Serendipity
|
b991f9e78e
|
docs: 更新提交记录(消除 GPU 同步,58.49 分,88.1s)
|
2026-06-13 13:29:21 +08:00 |
|
Serendipity
|
e69ba714e5
|
revert: 移除 2:4 稀疏(PCOC 2.067 + 耗时反增 265s,to_sparse_semi_structured 与 nn.Linear 不兼容)
回退到稳定版:FP16 + Flash Attention + inference_mode(57.45 分)
|
2026-06-13 12:34:29 +08:00 |
|
Serendipity
|
032018fd00
|
docs: 添加数据分析(特征分布、瓶颈槽位、优化方向)
|
2026-06-13 12:24:18 +08:00 |
|
Serendipity
|
69a0ad367e
|
docs: 更新最终优化路线和提交记录(当前最优 57.45 分, 92.5s)
|
2026-06-13 12:19:24 +08:00 |
|
Serendipity
|
62421d7862
|
docs: 更新提交记录和优化路线(MoE k=1 失败回退)
|
2026-06-13 11:50:54 +08:00 |
|
Serendipity
|
47c89cc76d
|
docs: 添加评测环境、合规边界(Q&A)、更新优化路线
|
2026-06-12 22:12:36 +08:00 |
|
Serendipity
|
c5fee2da9b
|
docs: 更新优化路线和提交记录(Flash Attention 56.98 分, 94.5s)
|
2026-06-12 21:55:58 +08:00 |
|
Serendipity
|
97c4cc84a0
|
docs: 更新提交记录(第一版 FP16,得分 43.55,152s)
|
2026-06-12 21:37:59 +08:00 |
|
Serendipity
|
4ee08adff5
|
feat: 接口对齐 + FP16 量化(第一版优化方案)
- CTRUserDataset → CTRTestSeqDataset,构造参数对齐评测接口
- load_model 签名修正:ckpt_path 作为第一参数
- FP16 量化:model.half() + Embedding 保留 FP32
- move_batch_to_device 自动 FP32→FP16 转换
- 缓存时预转 FP16,减少推理循环开销
- requirements.txt 精简(去除 nvidia-* 包)
- build_env.sh 标准化(set -e + pip install)
- CLAUDE.md 更新开发命令、代码架构、关键接口说明
|
2026-06-12 20:47:12 +08:00 |
|
Serendipity
|
d0bbb8f3e2
|
chore: 初始化 CTI 推理优化项目
- baseline infer.py + requirements.txt + build_env.sh
- GRAB / HSTU 两篇核心论文
- 比赛规则和提交接口说明
- 项目 CLAUDE.md
|
2026-06-03 13:49:30 +08:00 |
|