Files
CTI-Inference-Opt/代码/code
Serendipity a74af49456 feat: torch.compile 单独编译 Expert.forward(fc1→relu→fc2 融合)
- 仅编译 Expert.forward,不碰 MoE 循环和 attention
- 纯静态函数无分支,编译成功率高
- 替代 2:4 稀疏方案
2026-06-13 14:20:01 +08:00
..