4dbee83097
- 合规:单个权重置零,矩阵形状不变 - 只裁剪 8层×8expert×2fc = 128 个 Expert Linear - lambda forward 直调 sparse matmul,绕开 nn.Linear 兼容问题