Commit Graph

  • 9128b60e9d perf: RepEncoder 批量 embedding 查表(28 次 kernel launch → 1 次) Serendipity 2026-06-13 12:36:25 +08:00
  • e69ba714e5 revert: 移除 2:4 稀疏(PCOC 2.067 + 耗时反增 265s,to_sparse_semi_structured 与 nn.Linear 不兼容) Serendipity 2026-06-13 12:34:29 +08:00
  • e6519b7b1a chore: .gitignore 添加 .env(密钥防护) Serendipity 2026-06-13 12:33:06 +08:00
  • 032018fd00 docs: 添加数据分析(特征分布、瓶颈槽位、优化方向) Serendipity 2026-06-13 12:24:18 +08:00
  • 43b0c6c92a feat: 2:4 结构化稀疏(A800 原生加速,所有 Linear 层权重剪枝) Serendipity 2026-06-13 12:20:40 +08:00
  • 69a0ad367e docs: 更新最终优化路线和提交记录(当前最优 57.45 分, 92.5s) Serendipity 2026-06-13 12:19:24 +08:00
  • 1cf1024368 revert: 移除 torch.compile(default 模式也因动态 batch 形状导致编译开销 > 收益) Serendipity 2026-06-13 12:07:28 +08:00
  • 62421d7862 docs: 更新提交记录和优化路线(MoE k=1 失败回退) Serendipity 2026-06-13 11:50:54 +08:00
  • faedab5245 revert: MoE k=1 → k=2(PCOC 从 1.059 炸到 2.075,Top-1 破坏输出校准) Serendipity 2026-06-13 11:50:30 +08:00
  • 47c89cc76d docs: 添加评测环境、合规边界(Q&A)、更新优化路线 Serendipity 2026-06-12 22:12:36 +08:00
  • f7e1fbfbdc feat: inference_mode + torch.compile(default) Serendipity 2026-06-12 22:11:35 +08:00
  • feb71be5bd feat: MoE Top-1 gating(每个 token 仅激活 1 个 expert,FFN 计算减半) Serendipity 2026-06-12 22:04:34 +08:00
  • bc6e8307c5 revert: 移除 torch.compile(动态 batch 形状导致反复重编译,反而慢于不编译) Serendipity 2026-06-12 22:02:40 +08:00
  • c5fee2da9b docs: 更新优化路线和提交记录(Flash Attention 56.98 分, 94.5s) Serendipity 2026-06-12 21:55:58 +08:00
  • 61bab9d0e3 fix: build_env.sh 简化为纯净版本(避免 CUDA 预热导致异常) Serendipity 2026-06-12 21:55:09 +08:00
  • 574399e8ac feat: Flash Attention + torch.compile(第二版优化方案) Serendipity 2026-06-12 21:39:43 +08:00
  • 97c4cc84a0 docs: 更新提交记录(第一版 FP16,得分 43.55,152s) Serendipity 2026-06-12 21:37:59 +08:00
  • c53a936e81 revert: requirements.txt 还原为原始完整依赖列表 Serendipity 2026-06-12 21:24:22 +08:00
  • 47545efd43 fix: RepEncoder forward 中 Embedding FP32 输出显式转为后续层 dtype Serendipity 2026-06-12 21:22:06 +08:00
  • 0d97849813 docs: README 添加比赛规则、主页、提交链接 Serendipity 2026-06-12 20:58:10 +08:00
  • b252bd7a38 docs: 重写 README(项目介绍、架构、评分规则、优化路线) Serendipity 2026-06-12 20:52:46 +08:00
  • 03bab0f7e5 chore: 更新 notebook 环境和文档 Serendipity 2026-06-12 20:51:14 +08:00
  • 4ee08adff5 feat: 接口对齐 + FP16 量化(第一版优化方案) Serendipity 2026-06-12 20:47:12 +08:00
  • b0ea305ad0 docs: 添加详细推理优化方案(含合规审查) Serendipity 2026-06-03 14:18:17 +08:00
  • d0bbb8f3e2 chore: 初始化 CTI 推理优化项目 Serendipity 2026-06-03 13:49:19 +08:00
  • 0b1037b002 Initial commit Serendipity 2026-06-03 13:14:36 +08:00