diff --git a/代码/code/infer.py b/代码/code/infer.py
index fc79a33..73d67b8 100644
--- a/代码/code/infer.py
+++ b/代码/code/infer.py
@@ -44,7 +44,7 @@ CONFIG = {
     # sdpa 是评测端验证最快(89.96s/58.86)。flex/compile/小batch/varlen 在评测端都更差。
     # attn: "chunked"(按用户分块SDPA,降O(S²),本地14.25->7.92s) / "sdpa"(稠密mask) / 其它对照
     "attn": "chunked",
-    "chunk_users": 4,         # chunked 每块用户数（本地 4 最快 6.18s；再小收益递减）
+    "chunk_users": 3,         # chunked 每块用户数（扫描 1/2/3/4：chunk=3 最优 4.13s，块对角浪费vs块数开销平衡）
     # 稠密MoE去掉了 model(batch) 内唯一的同步点(MoE循环的.nonzero())。若评测计时不
     # synchronize，去掉同步点可能让被计时的 model(batch) 大幅缩短。本地force-sync看不出，
     # 须靠提交验证。AUC中性、MoE仅占2%算力故风险极低。