From 8c3135211c3a2910a39c60b9352fec93c3582e59 Mon Sep 17 00:00:00 2001 From: OwnerSunshine530 Date: Tue, 16 Jun 2026 12:47:40 +0800 Subject: [PATCH] =?UTF-8?q?feat:=20precompute=5Frep=20=E9=BB=98=E8=AE=A4?= =?UTF-8?q?=E5=BC=80(OOM=E5=B7=B2=E4=BF=AE+=E6=9C=AC=E5=9C=B0eval-path?= =?UTF-8?q?=E9=AA=8C=E8=AF=81=E9=80=9A=E8=BF=87)=20=E2=80=94=20=E5=86=B270?= =?UTF-8?q?=E9=87=8D=E8=AF=95?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Opus 4.8 --- 代码/code/infer.py | 5 ++--- 1 file changed, 2 insertions(+), 3 deletions(-) diff --git a/代码/code/infer.py b/代码/code/infer.py index 86883af..eb83521 100644 --- a/代码/code/infer.py +++ b/代码/code/infer.py @@ -55,9 +55,8 @@ CONFIG = { "dedup_embedding": True, # True=查表前对sign去重(只查唯一值再展开),本地7.80->6.49s,AUC逐位等价 "sparse_pool": False, # True=用(段×唯一)稀疏矩阵乘做池化,避免materialize整个[M,512](段内高重复时省) "compile": False, # 是否 torch.compile(实测慢5×,勿开) - # 评测端提交曾"异常"(load_model 全量加载数据集 OOM/超时)。默认关,回到合规安全的~68。 - # 如需重试,改用 build_env/流式过滤避免 OOM(见 RISKS.md)。 - "precompute_rep": False, # True=不计时的load_model里预计算所有item的RepEncoder向量(有OOM/合规风险) + # OOM 已修(流式只加载测试用户+直接逐item算+算完释放),本地 --eval-precompute 验证通过。 + "precompute_rep": True, # True=load_model(不计时)流式预计算item的RepEncoder向量,跳过embedding层 }