第223章 只有偏执狂才能生存(求订阅求月票)(1/2)
芝加哥大学,戈登综合科学中心,208办公室。
一台笨重的Poly三角形视频会议终端架在劳拉·宋的办公桌上,指示灯闪烁着幽幽的蓝光。
屏幕分辨率不高,画面带着老式摄像头特有的像素颗粒感。
屏幕对面坐着四五个穿着格子衬衫的男人,背景是费米实验室那个著名的野牛雕塑海报。
坐在正中间的是乔舒亚·弗里曼(JoshuaFriea),费米实验室天体物理中心主任,也是斯隆数字化巡天(SDSS)项目的核心负责人之一。
气氛并不算融洽。
“林先生,我看过你刚刚发表的预印本,关于广义不确定原理修正项的数学推导确实很……精巧。”
弗里曼扶了扶眼镜,用词非常谨慎,像是在评价一件易碎的瓷器,“但是,你想用SDSS尚未发布的DR6深度红移数据去验证你所谓的‘暗流体’假说,这在现阶段是不可能的。”
林允宁坐在劳拉旁边,手里转着一支笔,神色平静,仿佛早有预料:
“弗里曼教授,我不明白。数据已经采集完毕了,它们就在服务器里睡觉。为什么不能唤醒它们?”
“因为它们还没经过清理。”
弗里曼叹了口气,从手边拿起一份光纤光谱图对着镜头晃了晃,“你知道我们的光纤定位器有多敏感吗?哪怕是温度变化导致的几微米热胀冷缩,或者光纤头之间的机械碰撞,都会在光谱上留下伪影。
“目前的DR6数据里,充满了严重的‘手指效应’(Figer-of-Godeffect)和系统性红移畸变。我们的博士生花了三年时间去校准这些误差,目前的信噪比依然不足以支持标准宇宙学模型(ΛCDM)的验证。
“如果这时候把数据交给你,去验证一个比标准模型还要激进十倍的‘暗流体’假说……一旦得出错误的结论,SDSS的信誉也会连带受损。我们得花十倍的精力去向公众辟谣,解释那是仪器误差,而不是什么新物理。”
这几乎是一个无法反驳的理由。
天文学家是靠信誉吃饭的,他们宁愿不发论文,也不发错误的数据。
劳拉·宋有些无奈地看了林允宁一眼。
作为导师,她只能帮林允宁搭建这个对话平台,但不能强迫同行交出核心资产。
林允宁停下了转笔的动作。
他没有争辩物理理论的正确性,也没有试图用“为了全人类的真理”这种大话去感召对方。
他很清楚,那是外行才干的事。
“弗里曼教授,您刚才提到了光纤定位器的机械误差。”
林允宁身体前倾,双手交叉放在桌上,目光穿过模糊的屏幕,直视对方的眼睛,“如果我没猜错的话,你们现在还在用高斯平滑滤波器(GasiaSoothigFilter)来处理这些噪声,对吗?”
屏幕那头的弗里曼愣了一下:
“嗯……是的,这是业界的标准做法。”
“但高斯滤波有个致命的缺陷。”
林允宁语气平稳,胸有成竹地解释道,“它假设噪声是随机分布的。但机械碰撞和热胀冷缩产生的误差,是有拓扑结构的。它们不是随机噪点,它们是流形上的‘疤痕’。
“用高斯滤波去磨平这些疤痕,往往会把那些微弱的、但真实存在的大尺度结构信号——也就是你们最想找的重子声学振荡(BAO)峰值——也一起磨平了。”
弗里曼沉默了。林允宁一针见血地戳中了他们目前的痛点。
林允宁从包里掏出一个优盘,放在桌面上,尽管对方看不见优盘里的内容,但这是一种姿态。
“我有一套算法。不基于统计学,而是基于拓扑持久同调(PersistetHoology)。”
林允宁抛出了筹码,“它可以识别高维数据云中的‘孔洞’和‘连通分量’。换句话说,它能分清哪些是随机的机械抖动,哪些是真实的宇宙结构。
“我们做个交易吧,教授。
“给我原始数据的访问权限。我帮你们处理数据,帮你们把那些顽固的仪器噪声剥离出来。作为交换,我只需要验证我的猜想。
“如果我是错的,数据归你们,算法也归你们,我绝不公开发表任何结果。但如果我是对的……”
林允宁笑了笑:“那我们也许真的能揭示宇宙的奥秘。”
屏幕那头,弗里曼和身边的几个同事低声交谈了几句。
对于被海量脏数据折磨得痛不欲生的天文学家来说,一个高效的清洗工具,诱惑力太大了。
而林允宁给出的条件,对他们来说几乎不用付出任何代价。
两分钟后,弗里曼重新看向镜头。
“我们需要先测试你的算法。我会给你对于一部分数据的访问权限,如果你的算法能处理好那个著名的‘长城’(GreatWall)星系结构的数据,我们就成交。”
“没问题。”
林允宁站起身,“把端口和密钥发给我。”
……
第二天。
芝加哥大学,科研计算中心(RCC)。
这里的冷气开得像是停尸房,数千台服务器风扇的轰鸣声汇聚成一种低沉的白噪音。
林允宁裹着一件厚厚的连帽衫,坐在角落的终端机前,旁边堆着三个空的健怡可乐罐。
屏幕上,数TB的原始光谱数据像瀑布一样流淌。
情况比他想象的还要糟糕。
天文学的数据太“脏”了。
大气扰动、光纤串扰、甚至是探测器上的宇宙射线坏点,混合在一起,形成了一团乱麻。
Aether算法的初次运行并不顺利。
拓扑分析虽然强大,但在面对这种量级的噪声时,贝蒂数(BettiNubers)的计算量呈指数级爆炸,而且经常把一些因为红移畸变产生的伪信号误判为真实的拓扑环。
“单纯的几何切割不行,还得用老办法,加入物理约束。”
林允宁揉了揉发胀的太阳穴,手指悬在回车键上。
【学霸模拟器启动。】
【课题:基于拓扑数据分析(TDA)的红移空间畸变修正算法优化。】
【注入模拟时长:100小时。】
意识瞬间被拉入那个纯白的空间。
现实世界的喧嚣远去,眼前只剩下一团用来描述宇宙的庞大数据云。
【第10小时:你尝试引入Vorooi泰森多边形来进行空间剖分。失败。计算开销过大,且对边界效应极其敏感。】
【第35小时:你转变思路,不再试图去“修补”数据,而是去“剪裁”数据。你利用持久同调的条形码(Barde),设定了一个阈值,凡是持久性低于某个特征长度的拓扑环,全部视为噪声切除。】
【第68小时:切得太狠了。你发现这种“一刀切”的方法,把几个微弱的矮星系信号也给删掉了。弗里曼绝对不会接受这种结果。】
【第85小时:灵感闪现。你回想起了之前处理量子比特噪声时的经验。噪声是“死结”,信号是“活结”。你需要引入一个动力学参数——视向速度的四极矩(QuadrupoleMot)。】
【第98小时:算法重构完成。你构建了一个名为“持久同调去噪算子”的滤波器。它不是在抹平数据,而是在高维空间里,把那些由于仪器误差产生的、不符合引力坍缩规律的“非法拓扑结构”精准摘除。】
本章未完,点击下一页继续阅读。