f7e1fbfbdc
- torch.no_grad() → torch.inference_mode()(禁梯度+禁版本追踪,更快) - torch.compile(mode='default'):纯算子融合,不用 CUDA Graph,兼容动态 batch 形状