diff --git a/代码/code/infer.py b/代码/code/infer.py index 86883af..eb83521 100644 --- a/代码/code/infer.py +++ b/代码/code/infer.py @@ -55,9 +55,8 @@ CONFIG = { "dedup_embedding": True, # True=查表前对sign去重(只查唯一值再展开),本地7.80->6.49s,AUC逐位等价 "sparse_pool": False, # True=用(段×唯一)稀疏矩阵乘做池化,避免materialize整个[M,512](段内高重复时省) "compile": False, # 是否 torch.compile(实测慢5×,勿开) - # 评测端提交曾"异常"(load_model 全量加载数据集 OOM/超时)。默认关,回到合规安全的~68。 - # 如需重试,改用 build_env/流式过滤避免 OOM(见 RISKS.md)。 - "precompute_rep": False, # True=不计时的load_model里预计算所有item的RepEncoder向量(有OOM/合规风险) + # OOM 已修(流式只加载测试用户+直接逐item算+算完释放),本地 --eval-precompute 验证通过。 + "precompute_rep": True, # True=load_model(不计时)流式预计算item的RepEncoder向量,跳过embedding层 }