diff --git a/代码/code/infer.py b/代码/code/infer.py index 058a353..066652b 100644 --- a/代码/code/infer.py +++ b/代码/code/infer.py @@ -34,7 +34,6 @@ except Exception: # ============================================================ CONFIG = { "fp16": True, # True=半精度推理;False=FP32 参考跑(确立 AUC 天花板) - "emb_fp16": False, # True=Embedding 也 FP16(省 ~10GB 显存带宽,AUC 可能微降) "keep_fp32_modules": (), # fp16 下仍保留 FP32 的子模块名前缀,如 ("linear",) "expert_merge": True, # 是否做 expert 权重相似度合并 "merge_threshold": 0.90, # 合并的余弦相似度阈值