diff --git a/CLAUDE.md b/CLAUDE.md index 0c38f98..5d4f5d6 100644 --- a/CLAUDE.md +++ b/CLAUDE.md @@ -120,7 +120,21 @@ score_all = score_latency * 70 + score_model * 30 | 序列采样/截断 | ❌ 违规 | | | 对测试集训练 | ❌ 违规 | | -**策略指标以 baseline 为上限**,指标下降会扣分,超出范围直接 0 分。 +#### 剪枝细则(来自 Q&A #3) + +- **结构化剪枝(❌ 不允许)**: 删除整层、整行/整列权重、减少 channel 数等,会改变张量形状或网络拓扑 +- **非结构化剪枝(✅ 允许)**: 仅将单个权重置零或 mask 掉,不改变权重矩阵形状;可删除对输出贡献较小、冗余度高的部分,前提是结构不被破坏 + +> 关键边界:Linear 权重矩阵大小不变、Layer 数量不变、Attention head 数量不变、FFN 维度不变 → 属于合规的参数级剪枝 + +#### 评测细节 + +- **计时范围**: 仅 `model(batch)` 逐 batch 累加,`move_batch_to_device` 不计入 +- **硬件**: NVIDIA A800 (80GB, SM80) +- **软件**: Python 3.10 + PyTorch 2.6.0 +- **评测数据集 ≠ baseline 数据集**(AUC 天然有差异) +- **策略指标以 baseline 为上限**,指标下降会扣分,超出范围直接 0 分 +- **人工审核**:最终成绩由人工审核判定合规性 ## 数据分析