diff --git a/代码/code/infer.py b/代码/code/infer.py index eb83521..803fa2a 100644 --- a/代码/code/infer.py +++ b/代码/code/infer.py @@ -55,8 +55,9 @@ CONFIG = { "dedup_embedding": True, # True=查表前对sign去重(只查唯一值再展开),本地7.80->6.49s,AUC逐位等价 "sparse_pool": False, # True=用(段×唯一)稀疏矩阵乘做池化,避免materialize整个[M,512](段内高重复时省) "compile": False, # 是否 torch.compile(实测慢5×,勿开) - # OOM 已修(流式只加载测试用户+直接逐item算+算完释放),本地 --eval-precompute 验证通过。 - "precompute_rep": True, # True=load_model(不计时)流式预计算item的RepEncoder向量,跳过embedding层 + # 预计算在评测端两次未生效(先OOM异常、后静默回退,无日志难诊断)且属合规灰区。默认关。 + # 本地 --eval-precompute 可跑通(4.07s);需重试见 RISKS.md。默认=干净合规的 ~68。 + "precompute_rep": False, # True=load_model预计算RepEncoder向量跳过embedding层(评测端未生效+灰区) }