第380章 咔嚓咔嚓地合上
除了物理阻隔,极昼一号的人声识别需要耗费的算力投入也是极大的。
极昼一号搭载的三百六十度声场定位麦克风阵列,在实验室安静环境下可以做到一度的声源定位精度,但是在家庭环境里,是做不到那么安静的,客厅开着的电视声,厨房运行的抽油烟机声,楼上邻居拖动的椅子声……这些背景噪声叠加在一起,会把声场的信干噪比直接拉到个位数,远场语音识别的准确率从实验室的百分之九十八能直接掉到百分之七十几。
而恒科的解决办法是加大前端降噪算法的算力投入,给麦克风阵列的每个通道都单独跑一路自适应滤波,这就导致计算延迟更大了,网络传输的数据包更多了,整个系统的实时性进一步的恶化了。
这些都不是算法的问题,而物理现实在拖后腿。
信号从空气里传到麦克风振膜需要时间,电磁波从路由器天线辐射出去穿过墙体需要时间,云端服务器的推理计算需要时间,这些时间加起来,就构成了那道看不见的墙,把所有科幻电影里流畅得像人类一样的机器人,死死拦在现实世界的对岸。
肖宿翻完最后一页技术文档,把平板推到一边,靠在椅背上,陷入了思考。
网络本身的结构性延迟这个问题他之前在思考小智框架的时候就隐隐约约碰到过,只不过当时重心在AI的数学基础上,没有深挖,现在要改造极昼一号的硬件,这个问题就绕不过去了。
现有的互联网协议栈,从物理层到应用层,七层结构的设计理念可以追溯到七十年代的ARPANET。
TCP/IP协议族的核心假设是尽力而为的包交换,每一跳路由器都是一次不确定的等待,每一条链路都是一段不可控的延迟。
过去几十年,网络工程师们在这个框架上打了无数补丁,从最初的FTP到后来的CDN,从简单的缓存到复杂的边缘计算,但是底层的逻辑是一点没变的。
信息从A点传到B点,中间要经过无数个中转节点,每一个节点都可能成为瓶颈。
更不用说无线信道本身的物理特性了。
多径效应、阴影衰落、信道间干扰,这些问题在香农的信息论框架下已经有完备的理论极限。
香农极限规定了在给定信噪比和带宽下信息传输速率的上界,不管用什么编码方式、什么调制技术,都不能突破这个天花板。
肖宿的目光无意识地落在墙角那盆绿萝枯黄的叶子上。
香农极限。
上界。
信道容量。
这些概念在他脑子里像一串被碰倒的多米诺骨牌,哗啦啦地往一个方向倒去。
信道容量的定义,本质上是在一个给定物理介质上传输信息的最大速率,而这个最大,是在所有可能的编码方式上取上确界。
从数学上讲,这其实就是一个变分问题,在所有可能的信号分布中,寻找那个能让互信息达到极大的分布。
变分问题。
极小能量轨迹。
和乐约束。
几个关键词在肖宿的脑海里碰撞了一下,擦出了几点微弱的火花。
他双手在胸前交叠,左手撑在了下巴处。
如果能用和乐框架重新定义网络路由的最优路径,把传统IP网络中逐跳存储转发的随机排队过程,替换为受几何约束的极小能量轨迹,那整个网络的端到端延迟就有可能从现在的几十毫秒级别直接压缩到微秒级别。
想到这儿,肖宿的目光一敛,这个思路似曾相识,他之前在NS方程里就用过类似的逻辑。
涡量在流场里看起来是在做随机涨落,实际上是被和乐群锁死在一条确定的轨道上。
网络中的数据包在路由器之间看起来是在随机排队,但是如果把整个网络的拓扑结构嵌入一个底流形,给每个节点的队列状态定义一个局部能量,那么数据包在网络中的最优转发路径,就是这个底流形上连接源节点和目的节点的一条极小能量轨迹。
传统的路由协议,不管是OSPF的最短路径优先还是BGP的路径向量算法,本质上都是基于图论的离散优化,最优路径依赖于人为定义的链路权重,但是如果改用和乐框架,最优路径就不再依赖于任何人为设定的权重了,而是会直接从网络的全局几何结构中涌现出来。
这还不是最有趣的。
最有趣的是,如果把网络拓扑底流形上的每个节点的队列状态、链路容量、信号衰减这些物理量,统一编码成一个纤维丛的联络形式,那么信道的物理特性就不再是信息传输的障碍,而会变成纤维丛本身的几何约束。
在传统的香农框架下,信道噪声是敌人,是限制容量的因素,但在和乐框架下,信道噪声本身就是约束条件的一部分,它规定了纤维丛的曲率。
而极小能量轨迹,恰恰是在给定曲率约束下寻找最优路径的天然工具。
这意味着,从这个方向出发,根本不需要去对抗噪声,而是直接把噪声变成了道路的一部分。
这个视角一旦打开,肖宿脑子里那些之前散落的知识碎片就开始自动拼接起来了。
香农的信道容量定理给出了理论上界,但是那个上界是在不考虑网络拓扑动态变化的前提下成立的。
实际网络中的延迟,大部分根本不是物理信道本身造成的,而是因为路由层面的排队和拥塞。
如果把路由问题用和乐框架重新求解,传统路由器几十毫秒的转发延迟可以被压缩到接近物理层传输延迟的极限,也就是光在光纤中跑完那段距离所需要的时间。
再往下推一步,如果把这个新的网络协议栈和极昼一号的多模态感知系统做联合优化,把云端推理的部分计算下沉到网络边缘,用基于和乐约束的动态路由算法在端侧设备和边缘计算节点之间建立一条极低延迟的逻辑专线,那机器人做动作的时候就不再需要等几百毫秒去问云端,而是几乎实时的。
延迟问题从根上解决,端侧就能承担更多实时推理任务了,对云端的依赖减少了,网络负载也会随之下降,整个系统的鲁棒性就能进一步提升了。
脑子里那片散落的拼图,咔嚓咔嚓地一块块合上了。
(https://www.shubada.com/127848/35778909.html)
1秒记住书吧达:www.shubada.com。手机版阅读网址:m.shubada.com