From 51ef3f66b2cad43860f485fbd0da637e88191cf4 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E5=88=98=E8=88=AA=E5=AE=87?= <3364451258@qq.com> Date: Sat, 13 Jun 2026 14:11:11 +0800 Subject: [PATCH] =?UTF-8?q?docs:=20=E8=A1=A5=E5=85=85=E5=89=AA=E6=9E=9D?= =?UTF-8?q?=E7=BB=86=E5=88=99=EF=BC=88=E9=9D=9E=E7=BB=93=E6=9E=84=E5=8C=96?= =?UTF-8?q?=20vs=20=E7=BB=93=E6=9E=84=E5=8C=96=EF=BC=89=E3=80=81=E8=AF=84?= =?UTF-8?q?=E6=B5=8B=E7=BB=86=E8=8A=82=E3=80=81=E4=BA=BA=E5=B7=A5=E5=AE=A1?= =?UTF-8?q?=E6=A0=B8=E8=AF=B4=E6=98=8E?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- CLAUDE.md | 16 +++++++++++++++- 1 file changed, 15 insertions(+), 1 deletion(-) diff --git a/CLAUDE.md b/CLAUDE.md index 0c38f98..5d4f5d6 100644 --- a/CLAUDE.md +++ b/CLAUDE.md @@ -120,7 +120,21 @@ score_all = score_latency * 70 + score_model * 30 | 序列采样/截断 | ❌ 违规 | | | 对测试集训练 | ❌ 违规 | | -**策略指标以 baseline 为上限**,指标下降会扣分,超出范围直接 0 分。 +#### 剪枝细则(来自 Q&A #3) + +- **结构化剪枝(❌ 不允许)**: 删除整层、整行/整列权重、减少 channel 数等,会改变张量形状或网络拓扑 +- **非结构化剪枝(✅ 允许)**: 仅将单个权重置零或 mask 掉,不改变权重矩阵形状;可删除对输出贡献较小、冗余度高的部分,前提是结构不被破坏 + +> 关键边界:Linear 权重矩阵大小不变、Layer 数量不变、Attention head 数量不变、FFN 维度不变 → 属于合规的参数级剪枝 + +#### 评测细节 + +- **计时范围**: 仅 `model(batch)` 逐 batch 累加,`move_batch_to_device` 不计入 +- **硬件**: NVIDIA A800 (80GB, SM80) +- **软件**: Python 3.10 + PyTorch 2.6.0 +- **评测数据集 ≠ baseline 数据集**(AUC 天然有差异) +- **策略指标以 baseline 为上限**,指标下降会扣分,超出范围直接 0 分 +- **人工审核**:最终成绩由人工审核判定合规性 ## 数据分析