书吧达 > 15岁,成为国宝级天才科学家 > 第343章 哎

第343章 哎


肖宿坐在第一排正中间,心情却不像万汇杨那么激动。

这些对目前行业来说几乎是顶尖的技术,在他看来,需要优化的地方还有很多。

万汇杨在上面讲的时候,他已经把资料从头到尾看完了。

数据倒没什么问题,GeoSculpt的架构设计也基本沿用了他在论文里铺好的路线。

但有几个地方,他在看的时候习惯性地在脑子里跑了一遍优化方案,觉得还能再调一调。

比如分子对称群自适应分解模块,目前的实现是根据分子类型查表匹配点群。

这个方法对常见分子是够用的,但如果遇到一个全新的、不在表里的分子结构,就需要人工判断对称群。

如果能把这个过程自动化,让小智来做分子对称性识别,速度至少能再提百分之二十。

小智的解耦率目前已经在恒科的机器人、手机和车载系统上跑了快一个月了,处理这种结构化信息的模式识别应该更快一些。

再比如鞍点搜索那部分,万汇杨他们用的是他在NS方程论文里写的鞍点圆法基础版本。

但是基础版本有一个小问题,那就是它在处理多鞍点耦合体系的时候,搜索路径之间偶尔会发生串扰,导致个别鞍点的收敛速度慢下来。

这个问题他后来在整理NS方程十篇系列论文的时候已经找到了解决方案,只是还没单独写到计算化学的应用里。

如果把这部分补上,多鞍点体系的收敛效率应该还能再上一个台阶。

报告厅里的掌声还在持续,提问环节已经开始了。

万汇杨正在回答一个来自辉泽制药研发总监关于蛋白质大分子计算精度的问题,台下不断有人举手。

高长安往旁边看了一眼,发现罗氏的总监正朝这边走过来,手里还拿着名片。

在这种场合,如果让肖宿被人群围住,那今天下午就不用做任何事了。

他几乎是在瞬间就做出了撤退的判断。

他在肖宿耳边低声说了一句。

肖宿没有回头看那些正在涌过来的人群,只点了点头,站起身来。

顾清尘也同时起身,三人在人群合围之前穿过侧面那扇不起眼的安全通道,从报告厅的侧门安静地撤了出去。

苏菲走到第一排的时候,标着肖宿名牌的座位上已经空了,只剩下那份翻完的发布会资料搁在桌上上。

她看了看那个空位,又看了看侧门的方向,有些无奈地笑了一下,把名片收回了口袋里。

化学所三楼实验室里,几台工作站正安静地跑着新的测试数据,机箱风扇发出均匀的白噪音。

透过玻璃能看到楼下报告厅门口还没散去的人群,三三两两的代表还在讨论刚才的数据,记者们正扛着摄像机在采访出场的教授们。

许铭推开实验室的门,引着肖宿走到中间那台工作站前面。

屏幕上正显示着GeoSculpt的运行界面,一个苯分子的基态电子结构计算结果静静地停在上面,旁边的日志窗口滚动着鞍点搜索的迭代记录。

“目前整个框架的核心算法已经稳定了,学术免费版上线之后,下载量几分钟就破千了,服务器的压力测试我们在发布前也已经做过一轮了,暂时还没崩。

但有几个地方,我们一直觉得还能再优化,就是还没找到具体的切入点。”

许铭用手指着屏幕上的架构图,从辛几何映射引擎一路划到鞍点搜索优化器,在架构图上标出了两个红色标记点。

第一个是分子对称性识别模块,第二个是多鞍点耦合体系的收敛稳定性。

肖宿看了一眼那两个标记点,跟他刚才在台下看资料时脑子里跑过的方向一致。

他往前走了两步,手指在第一个标记点上点了点。

“对称性识别这部分,你们目前用的是查表法吧。”

许铭点头:“对,常见分子的点群我们是预先建了表,苯匹配D6h,水匹配C2v,氨匹配C3v,但遇到不在表里的新分子,就只能靠人工判断。”

“查表法对常见的分子够用了,”肖宿说,“但是那些表里没有的结构,每遇到一个新分子就要停下来等人眼判断,自动化流程在这里就断了。”

他走到白板前,拿起马克笔,在上面画了一个简单的分子结构草图,旁边标注了它的对称元素。

“分子点群的自动识别本质上是一个有限几何判定问题。

对称操作在笛卡尔坐标系下可以表示成一组三乘三的矩阵,矩阵的迹和行列式决定了操作的类型。

只需要扫描这个分子的所有对称操作,先找主轴,主轴方向取最高重旋转轴,再找垂直于主轴的C2轴,然后判断镜面和反演中心的有无,最后根据这些对称元素的组合关系就能直接判定点群。”

他在白板上写了几行简洁的伪代码。

“这是标准做法,输入是原子坐标,输出是点群标签,覆盖所有常见的分子点群只需要两三百行代码。”

“至于多鞍点耦合收敛速度波动。”

他在白板上画了几个鞍点在辛流形上的空间分布,以及从不同初值出发的最速下降路径。

笔尖在路径交叉的地方点了点。

“基础版鞍点圆法在单鞍点场景下是全局最优的,收敛速度有严格的理论保证,但是,在多鞍点场景下,多个鞍点各自的吸引域共享边界,搜索路径在边界附近会偶尔产生串扰,表现出来就是收敛曲线局部抖动,个别初值需要额外的迭代步数。”

许铭听到“吸引域共享边界”的时候,眉头微微皱了一下。

这个词肖宿说得轻描淡写,但许铭知道在多鞍点耦合体系里,吸引域边界的几何结构本身就是高度非线性的。

他们之前排查收敛速度波动的时候,方清怀疑过是不是步长自适应参数设错了,又或者收敛判据阈值太严了、初值分布不均匀,可都不对,现在,全被肖宿一句话兜住了。

“解法也不复杂。”

肖宿在路径交叉的区域画了一条新的轨迹,沿着吸引域边界的切线方向切了过去。

“只要在每一步鞍点搜索之后加一个正交化步骤,把当前迭代步产生的搜索方向向量与相邻鞍点的搜索方向做一次Gram-Schmidt正交化,去掉重叠的分量,这样每个搜索方向都能严格位于自己吸引域的内部,不再受相邻吸引域的梯度干扰了。”

他在白板上又写了几行推导。

正交化步骤的算法逻辑很简洁,核心是一个基于Gram-Schmidt的路径去冗余操作,大约只需要四十行代码。

“那边的定理四点二处理的是一个结构类似的多鞍点收敛问题,证明框架可以直接搬过来用,只需要把条件从紧流形放宽到非紧流形,证明的骨架不需要动。”

许铭站在白板前,把那张被画满了鞍点、路径和伪代码的白板从头看到尾。

方清试了好几版补丁都没压住的多鞍点收敛波动,肖宿用四十行代码和一个正交化步骤就解决了,而且连收敛性的严格证明都已经在另一篇论文里写好了,只需要把条件从紧流形放宽到非紧流形,改一下前提条件就行。

而那个让他纠结了好几天的对称性识别问题,甚至只需要一套标准的几何判据流程就能解决。

刚才在报告厅里被掌声包围的时候,许铭难免还有些飘飘然,毕竟,全球最快的第一性原理计算软件,颠覆一个行业的工具,那可是他们做出来的,这换谁都不可能不激动的。

结果,他们骄傲的那些成绩,在肖宿面前竟然全都是问题!

许铭原本春风得意的心瞬间就平静了下来。

那种面对肖宿熟悉的无力感又回来了,让他不禁在心里叹了口气。

“哎。”


  (https://www.shubada.com/127848/36101115.html)


1秒记住书吧达:www.shubada.com。手机版阅读网址:m.shubada.com