# 实验记录

> 在 AI Studio notebook 里跑 `bench.py` 后，把每次配置的实测值填进表里。
> 「本地分」用本地 test.csv + label_data.txt 算（仅作方向参考）；「提交分」是验证集真实分数。
> 本文件可入 git，但**不进提交包**（打包只含 infer.py / requirements.txt / build_env.sh）。

| 任务 | 配置 | AUC | PCOC | 延迟(同步) | 本地分 | 提交分 |
|------|------|-----|------|-----------|--------|--------|
| 基线 | 默认(当前最优: fp16+merge0.90+clamp) | _待测_ | _待测_ | _待测_ | _待测_ | 58.86 |

## 待跑（按计划顺序）

- [ ] Task 2: `python bench.py` 默认配置 → 填上面「基线」行的本地实测
- [ ] **Task 3（最关键）**: `bench.run_once({"fp16": False, "expert_merge": False, "signid_mode": "clamp"})` → FP32 天花板 AUC，判定 80+ 是否有 AUC 空间
- [ ] Task 4: clamp vs modulo（先查 max_sign_id 是否超 5M）
- [ ] Task 5: 混合精度 keep_fp32_modules 扫描
- [ ] Task 6: expert_merge 开/关的 AUC 代价
- [ ] Task 7: 特征截断 + 上下文完整性核查
- [ ] Task 8: 锁定阶段 A 配置并提交一次