docs: 补充剪枝细则(非结构化 vs 结构化)、评测细节、人工审核说明
This commit is contained in:
@@ -120,7 +120,21 @@ score_all = score_latency * 70 + score_model * 30
|
|||||||
| 序列采样/截断 | ❌ 违规 | |
|
| 序列采样/截断 | ❌ 违规 | |
|
||||||
| 对测试集训练 | ❌ 违规 | |
|
| 对测试集训练 | ❌ 违规 | |
|
||||||
|
|
||||||
**策略指标以 baseline 为上限**,指标下降会扣分,超出范围直接 0 分。
|
#### 剪枝细则(来自 Q&A #3)
|
||||||
|
|
||||||
|
- **结构化剪枝(❌ 不允许)**: 删除整层、整行/整列权重、减少 channel 数等,会改变张量形状或网络拓扑
|
||||||
|
- **非结构化剪枝(✅ 允许)**: 仅将单个权重置零或 mask 掉,不改变权重矩阵形状;可删除对输出贡献较小、冗余度高的部分,前提是结构不被破坏
|
||||||
|
|
||||||
|
> 关键边界:Linear 权重矩阵大小不变、Layer 数量不变、Attention head 数量不变、FFN 维度不变 → 属于合规的参数级剪枝
|
||||||
|
|
||||||
|
#### 评测细节
|
||||||
|
|
||||||
|
- **计时范围**: 仅 `model(batch)` 逐 batch 累加,`move_batch_to_device` 不计入
|
||||||
|
- **硬件**: NVIDIA A800 (80GB, SM80)
|
||||||
|
- **软件**: Python 3.10 + PyTorch 2.6.0
|
||||||
|
- **评测数据集 ≠ baseline 数据集**(AUC 天然有差异)
|
||||||
|
- **策略指标以 baseline 为上限**,指标下降会扣分,超出范围直接 0 分
|
||||||
|
- **人工审核**:最终成绩由人工审核判定合规性
|
||||||
|
|
||||||
## 数据分析
|
## 数据分析
|
||||||
|
|
||||||
|
|||||||
Reference in New Issue
Block a user