docs: 添加详细推理优化方案(含合规审查)

基于 baseline 代码分析、GRAB/HSTU 论文研读、官方提交规范的三重审查:
- 发现并记录 baseline 接口与评测规范的 3 处致命不匹配
- 6 个优化方案,按优先级排序,每个方案标注合规性和风险
- 移除不适用于本场景的 CUDA Graph 方案
- 新增 GRAB/HSTU 论文的 markdown 转录文件
This commit is contained in:
2026-06-03 14:18:17 +08:00
parent d0bbb8f3e2
commit b0ea305ad0
2 changed files with 624 additions and 0 deletions
View File