Files
CTI-Inference-Opt/代码/code
Serendipity 9128b60e9d perf: RepEncoder 批量 embedding 查表(28 次 kernel launch → 1 次)
所有 slot 的 sign id 合并为一次 embedding lookup,再按 slot 拆分做 segment_reduce。
数学等价,纯 GPU 算子优化。
2026-06-13 12:36:25 +08:00
..