首页 > 都市重生 > 学霸的模拟器系统 > 第236章 恒等映射(求订阅求月票)

第236章 恒等映射(求订阅求月票)(1/2)

目录

十二月的温哥华,空气湿润而凛冽。

灰蓝色的海湾倒映着北岸山脉的积雪,海鸥在温哥华会议中心的巨型玻璃幕墙外盘旋。

NIPS2007(神经信息处理系统大会)的注册大厅里,人声鼎沸。

林允宁刚领完胸牌,还没来得及把那个略显廉价的挂绳套在脖子上,就被一群年轻的面孔围住了。

“林-God!能不能签个名?”

一个戴着厚底眼镜的男生激动地递过来打印好的论文,封面上赫然印着《LiearAttetioMechais》(线性注意力机制)。

“我是伯克利的一年级博士生。您的这个算法简直是救命稻草!我们在做长序列基因预测,之前跑一次模型要一周,用了您的核技巧优化后,现在只要半天!”

“林先生,关于您那篇暗流体的论文,我在物理系的室友说您重新定义了真空?”

“林……”

林允宁熟练地接过马克笔,在那篇论文的空白处签下了名字。

这一年来的历练,让他对这种场面已经习以为常。

他不像是来参会的学生,更像是走红毯的明星。

“看来我们的‘物理学家’人气很高啊。”

一个带着英伦腔调的声音从侧方传来。

人群自动分开一条路。

杰弗里·辛顿(GeoffreyHito)穿着一件看着有些年头的粗花呢西装,正笑眯眯地看着他。

站在辛顿旁边的,是穿着格子衬衫、背着双肩包的Google工程战神杰夫·迪恩(JeffDea)。

“辛顿教授,迪恩博士。”

林允宁盖上笔帽,微笑着走过去握手,“ICML一别,好久不见。”

“确实好久不见。”

杰夫·迪恩的眼神依然热切,像是在看一块未被开采的金矿,“听说你最近在数学界和物理界闹出的动静很大?陶哲轩都在给我发邮件夸你。怎么样,有没有兴趣来GoogleBrai给我们讲讲那个‘复配边算子’?顺便聊聊入职的事?”

“杰夫,你就别费心了。”

辛顿打断了迪恩的挖角,“林这种人,注定是要自己定义问题的,而不是去解决别人定义的问题。不过,林,我很期待你今天的Keyote。听说你要从几何流的角度讲优化?”

“我确实有一点不成熟的想法。”

林允宁谦虚了一句,“希望能给在这个寒冬里坚持神经网络的人,一点信心。”

周围的参会者们看着这三个大佬级别的任务谈笑风生,眼神里充满了敬畏。

在2007年,这三个人站在一起,基本上就代表了人工智能的一半未来。

只是,其中有个人实在年轻的有点过分。

……

上午十点,主会场。

巨大的投影幕布上,显示着Keyote的标题:

《从几何流看神经网络的优化景观》。

演讲很成功。

林允宁的讲座深入浅出,没有用枯燥的代码,而是用物理直觉,将神经网络的参数空间比作一个高维的能量地形图,阐述了为什么传统的梯度下降法容易陷入局部极小值。

到了提问环节。

一位来自麻省理工学院(MIT)的老教授站了起来,扶了扶话筒:

“林先生,你的几何比喻很精彩。但是,深层网络的优化曲面是非凸的(No-vex),存在大量的鞍点(SaddlePoits)。在数学上,这些鞍点会导致海森矩阵(HessiaMatrix)出现负特征值,从而阻碍收敛。你是如何看待这个问题的?”

这是一个非常硬核的数学问题。

全场安静下来,等待着林允宁的回答。

“这是一个非常好的几何问题。”

林允宁眼睛亮了。

他指了指台边的黑板,“能帮我推过来吗?”

工作人员迅速将黑板推到舞台中央。

林允宁拿起粉笔,转身面对黑板。

“其实,如果我们跳出欧几里得空间的限制,把参数空间看作一个黎曼流形……”

哒哒哒。

粉笔在黑板上敲击出清脆的节奏。

第一行,他写下了海森矩阵的本征值分解公式。

台下的观众频频点头,来到这里的虽然大部分是计算机科学家,但数学水平并不低。

他们对于这些基础的代数问题,还是理解得很深入的。

第二行,林允宁开始引入莫尔斯理论(MorseTheory),用临界点的指数来描述鞍点的性质。

台下有一半人开始皱眉,拿笔的手停住了。

“进一步,如果我们考虑梯度流在这个流形上的测地线偏离方程(GeodesicDeviatioEquatio)……”

从第三行开始,林允宁直接祭出了他在和陶哲轩讨论时用到的“同调群”(HoologyGroup)演化方程,开始证明在高维空间中,鞍点其实是逃逸路径的“路标”,而非陷阱。

台下彻底安静了。

那是一种死一般的寂静。

刚才还在点头的计算机科学家们,现在的表情就像是误入了高等数学专业课的大一新生。

他们的眼神从迷茫,变成了呆滞,最后变成了放弃思考的释然。

只剩下此起彼伏的相机快门声——

虽然听不懂,但这公式看着就很厉害,先拍下来再说。

林允宁写得兴起,手中的粉笔折断了一截。

他回过头,正准备解释一下贝蒂数的物理意义,却看到了台下几千双迷茫的眼睛。

甚至连前排的杰夫·迪恩都在揉太阳穴。

“呃……”

林允宁愣了一下,瞬间反应过来。

这是AI大会,不是数学家大会。

他刚才那套连陶哲轩都要思考几分钟的推导,对这帮搞工程的人来说,简直就是天书。

这就是所谓的降维打击——

一不小心打得太狠,以此至于观众连痛感都没反应过来。

“咳。”

林允宁淡定地把剩下的半截粉笔扔进笔槽,拍了拍手上的灰,指着黑板上那堆如同鬼画符般的公式:

“简而言之,只要路径选得对,鞍点不是障碍,是跳板。”

台下沉默了一秒。

“哗——”

雷鸣般的掌声爆发了。

大家其实还是没听懂,但这不妨碍他们对这种智力上的绝对高点表示敬意。

……

午饭时间,海报展区(PosterSessio)。

相比于主会场的热闹,这里的角落显得有些冷清。

2007年的计算机视觉(CV)领域,还是SVM(支持向量机)和人工特征提取(SIFT/HOG)的天下。

在一个不起眼的角落里,林允宁看到了一个略显落寞的身影。

那是一位有些瘦削的亚裔女性,正独自站在一张海报前。

海报的标题是《Iage:ALarge-ScaleHierarchicalIageDatabase》。

李飞飞。

未来的AI教母,此刻正面临着职业生涯最大的至暗时刻。

她的Iage项目因为耗资巨大、且尚未产出任何能用的成果,被学术界视为“浪费资源的苦力活”。

在主流观点看来,算法才是关键,数据够用就行。

搞这么大的数据集,现有的算法根本跑不动,毫无意义。

路过的人大多只是瞥一眼海报上那个夸张的数据量——“一千万张图片”,然后就摇摇头走开了。

林允宁整理了一下方雪若送的那套高级西装,走了过去。

“李教授,好久不见。”

李飞飞抬起头,看到是林允宁,眼神中闪过一丝惊讶。

两人曾在ICML的闭门会议中有过一面之缘,但并未深交。

她没想到,这位刚刚在主会场享受完掌声的当红炸子鸡,会跑到这个冷清的角落来。

“林先生。”

李飞飞礼貌地笑了笑,笑容里带着一丝疲惫,“刚才的演讲很精彩。虽然我也没完全听懂那个同调群。”

“数学只是工具。”

林允宁站在海报前,认真地看着上面的架构图,“我在意的是地基。我了解过你的Iage项目,请问现在的进展如何?”

“不太好。”

李飞飞是个很坦诚的人,她苦笑了一声,“我们雇佣了来自167个国家的近5万名亚马逊MechaicalTurk工人来打标签。数据量是上来了,但是……误差率居高不下。

本章未完,点击下一页继续阅读。

目录
返回顶部