第282章 “双PI效应”显形:乘数速度(1/2)
凌晨一点。
NeurIPS 截稿倒计时:47 小时。
清北校内一家通宵咖啡馆角落,MIT 访问学者艾瑞克·陈对着屏幕蹙眉——他是本次大会“几何深度学习”方向领域主席,正在初审。眼前第七篇稿件,又来自同一个中国团队。
七篇,七个不同子方向:图网络收敛、超大模型高效微调、对抗鲁棒解释、多智能体分布式优化……篇篇行文干净、创新清楚、实验充足,达到甚至超过接收线。
更离谱的是时间:七篇预印本的首次公开,集中在近三十天内。以他熟悉的北美一线实验室节奏,每篇都得五到十人专注三到六个月。
要么造假,要么——这支团队掌握了某种“效率密码”。
他点开团队官网,看到“核心研究人员”不到二十人。粗算一遍,他只觉得脑仁发胀:这不符合科研生产规律。
再点开附录代码。
提交历史像瀑布。
两个 ID 交替出现:l-wz 与 g-qh。两人的提交时间像齿轮咬合,常常只差几分钟。提交备注不是“修 bug”“加功能”,而像高速对话:
l-wz:主定理证明完成,见 sec3.2。需工程验证收敛速度。
g-qh:已接。分布式异步 SGD 实现,初步实验比理论预期快 17%。
l-wz:发现边界条件漏洞,修正后理论下界可提升,见 a1b2c3。
g-qh:已同步修正,实现重跑中……
不是“理论提—工程做”的单线流程,而是两颗顶尖大脑的实时共振:你推进一格,我立刻把地基铺平;你提刀收口,我当场把盔甲扣上。
再往下翻——
晚 10 点固定的“架构同步会”纪要,统一的实验流水线模板,代码注释规范、公式 LaTeX 模版、可视化配色标准……单看都普通,合在一起就是一套把沟通损耗压到尘埃里的科研操作系统。
“原来如此……”艾瑞克低声喃喃,“不是人海,是系统。”
手机震动。
斯坦福的导师、领域泰斗斯通教授来电。
“看到晚启那批论文了吗?”
“在看。七篇三十天,不科学。”
“但它是真的。”教授沉默片刻,“我和 DeepMd 的凯文通话——他们用晚启的开源代码复现了三篇,数据完全对得上,甚至有几个指标更好。”
“那就不是造假了。”
“不是造假,是一种我们不熟悉的工作方式。凯文说,他们按同样时间框架复做一篇‘最简单’的,连理论推导都没收尾。”
艾瑞克望向清北方向,几栋教学楼灯火未熄。他忽然起身:“我想亲眼看看。”
“他们不接待访问。”
“我知道。楼下转一圈也好。”
同一时间,三号楼三层。
“张薇组对抗训练误差降到 0.34%,达标。”程启珩眼不离屏,“王璐多模态预训练第一阶段完成,下游平均 +12.7 个百分点,超预期。”
林晚照盯着“七篇论文状态板”。六篇全绿,最后一篇“实验补充”还亮着黄灯。
“李浩然,第四篇的消融实验呢?”
“来了!”机房里传来急促的回应,“最后对照组卡在 92%,还要十五分钟!”
“十分钟。”程启珩抬腕,“十一点整,我要完整结果。否则降级预案,用历史最优数据顶上——我们有预案吧?”
“有!但我更想跑完真实数据……”
“给你十分钟。”林晚照拍板。
时间像刀在磨。
键盘声、风扇声、有人压着咳嗽声。一个月极限冲刺,每个人都透支到边缘,但眼神却亮得吓人。
张薇走到白板前,把“三十日作战表”的第七格涂上最后一点颜色——从第一格的激动到第七格的平稳,兴奋已经沉入肌肉记忆。外界喊他们“论文工厂”“效率怪”,甚至有人揣测是否使用了未公开的 AI 写作工具。只有他们知道:没有魔法,只有把每个环节练到变态。
是林晚照把模糊直觉钉成清晰命题;
是程启珩把命题拆成可跑清单;
是王璐、李浩然、陈峰把清单落成代码、曲线、图表;
是每日十五分钟站会把问题摁住;
是代码审查、可复现实验、写作模板把错误扼杀在出生点。
“到点。”程启珩开口。
本章未完,点击下一页继续阅读。