书吧达 > 我的系统能刷数学经验 > 第233章 LPU的进展

第233章 LPU的进展


时间如白驹过隙,转眼已是11月中旬。

距离徐辰那篇《Logic  Is  Also  You  Need》在arXiv上发表,已经过去了两个多月。

而华国的秘密布局,更是已经悄然推进了三个多月。

这三个月里,虽然表面上风平浪静,但在半导体和AI的核心圈层,早已是暗流涌动。

……

十一月中旬,深圳,南山。

这间位于地下二层的恒温实验室里,这里是海丝半导体的绝密测试区。

总工程师何庭波站在单向玻璃后,并没有像往常那样盯着满屏的数据,而是闭着眼睛,似乎在听着什么。

实验室里摆着两台测试机柜。

左边那台,风扇正在发出喷气式飞机起飞般的啸叫,红色的过热警报灯疯狂闪烁。里面插着的,是目前市面上最顶级的算力怪兽——英伟达H100。

右边那台,却安静得像是一块石头。只有机箱面板上那颗绿色的指示灯,以一种极其缓慢、悠闲的节奏呼吸着。里面躺着的,是刚刚流片回来的工程样片——“昇腾LPU-Alpha”。

“跑完了。”

操作员的声音打破了死寂。

何庭波睁开眼:“报数据。”

“任务:SLRM架构下的千万级逻辑门推演。”

“H100组:耗时4分12秒,峰值功耗700W,核心温度85度。GPU利用率……只有12%。”操作员看着数据,咽了口唾沫,“因为大量的逻辑跳转导致CUDA核心一直在等待数据,显存带宽都快被撑爆了,算力却发挥不出来。”

“LPU组呢?”

“耗时……58秒。”

操作员的声音有些颤抖,仿佛不相信自己的眼睛。

“峰值功耗45W,核心温度……室温。”

何庭波没有说话,只是走到玻璃前,看着那台安静的机柜。

4分12秒对58秒。

700W对45W。

4nm先进制程对14nm成熟工艺。

这是一场不对称的屠杀。

没有欢呼,没有掌声。在场的工程师们只是面面相觑,眼神中流露出的不是狂喜,而是一种近乎敬畏的恐惧。

他们比谁都清楚这意味着什么。

当英伟达还在用“蛮力”去模拟逻辑的时候,徐辰设计的架构,已经让芯片学会了“思考”。

“封存数据。”何庭波的声音很轻,却在空旷的实验室里回荡,“把这台机器的代号,从‘备胎’改成……‘破壁者’。”

……

虽然核心数据被严密封锁,但在这个信息爆炸的时代,总有一些风声会从墙缝里漏出来。

B站,科技区。

一个名为“极湾Geekerwan”的UP主,发布了一条名为《有些事不能细说,但国产芯片可能真的要变天了》的视频。

视频里,UP主云非并没有像往常那样拿着显卡跑分,而是坐在镜头前,神色有些神秘,甚至带着点压抑不住的兴奋。

“兄弟们,最近我去了趟深圳,本来是想去华强北淘点电子垃圾的,结果被几个‘菊厂’的朋友拉去喝茶。签了保密协议,具体的参数我一个字都不能说,说了号就没了。”

“但我可以给你们打个比方。”

云非拿起桌上的一个魔方,又拿起一把锤子。

“以前我们搞AI,就像是用锤子砸魔方。只要力气够大,锤子够硬,总能把魔方砸开。”

“这也是英伟达一直在做的事,他们造出了世界上最硬的锤子。”

“但是这次……”

放下了锤子,轻轻转动了一下魔方。

“我看到了一种全新的解法。它不需要多大的力气,也不需要多硬的锤子。它只是……找到了那个公式。”

“咔哒。”

魔方复原。

“那种丝滑感,那种降维打击的感觉……真的,我当时在现场,鸡皮疙瘩都起来了。”

“我只能透露一点:这玩意儿不挑食。哪怕是咱们国内那种成熟工艺,也能跑得飞起。”

“时间呢,我不敢保证啊,我估计最快可能半年,慢一点一年左右,应该就能看到商业化产品问世了。当然,都是我猜测啊,猜不准我不负责。”

弹幕瞬间炸了。

【谜语人滚出哥谭!】

【卧槽?真的假的?云飞从来不吹牛逼的啊。】

【成熟工艺?难道是说芯片制程么?】

【传说中的存算一体?还是光子芯片?】

【别猜了,前几天我看新闻,科技部批了个‘新一代认知智能计算架构’的专项,好像就是以SLRM模型为原型开发的。】

评论区里,除了兴奋的吃瓜群众,很快就涌现出了一批画风诡异的账号。

“笑死,又在吹牛逼了。之前吹光刻机,现在吹LPU,能不能务实一点?”

“承认差距有那么难吗?人家英伟达几万人的团队搞了几十年,你换个名字就能弯道超车?做梦呢?”

“又是‘沸腾体’,能不能别整天遥遥领先了,看着尴尬。”

这些账号ID大多是一串乱码或者新注册的小号,言辞激烈,逻辑统一,显然是有组织的水军。

他们试图用冷嘲热讽,把这股刚刚燃起的希望之火给浇灭。

毕竟,对于某些势力来说,中国AI的崛起,是他们绝对不愿意看到的噩梦。

……

除了硬件圈的传闻,软件圈也不甘寂寞。

知乎上,一个名为“AI观察者”的大V,也发了一篇长文爆料。

《国产大模型的新赛道?通义、字节、月之暗面都在秘密测试新架构!》

文章里写道:

“据内部人士透露,国内几家头部AI大厂,最近都在秘密测试一种非Transformer架构的新模型。据说这种模型在逻辑推理和长文本处理上有着惊人的表现,完全没有‘幻觉’问题。”

“该模型据悉仍在非常早期的阶段,但是内部负责人表示在某些小数据集上训练后表现非常好。”

“工程师团队目前据说处在软件等硬件的状况下,因为缺少匹配的硬件,目前还没有办法跑大参数的模型,但是据说这个过程很快会有改进。”

“目前团队的重点还是提效和降本上,其中某个团队的运行成本已经降低了30%,而且还有很大的降本空间。”

“我有幸体验了一个内部测试版的Demo。说实话,生成速度很慢,但是回答的内容非常清晰,几乎没看出有什么幻觉类的问题。”

“不过目前测试只能限定在一些小的知识范围内,应该也和小模型demo有关。”

“虽然目前的综合能力可能还打不过GPT-4,甚至连GPT-3.5都够呛。毕竟人家发展了八年,咱们这个新架构才搞了几个月,数据量和训练时长都还不够。”

“但这就像是一个刚出生的天才婴儿,虽然现在还不会跑,但你能看到他眼里的光。这是一种全新的可能性!”

文章下面,评论区也是两极分化。

“真的假的?逻辑推理无幻觉?这可是LLM的死穴啊!”

“半成品也好啊!只要路子对了,早晚能追上!”

“得了吧,又是PPT造车。连个能用的产品都没有,就敢吹‘新赛道’?等拿出来再说吧。”

“估计又是骗经费的项目。Transformer已经是公认的最优解了,非要另起炉灶,这不是瞎折腾吗?”

……

无论是硬件圈的LPU传闻,还是软件圈的新模型爆料,都像是在平静的湖面上投下了一颗颗石子。

虽然水军在疯狂地泼冷水,虽然公众依然半信半疑,但那种“山雨欲来风满楼”的气息,已经越来越浓烈。

所有人都隐隐感觉到,一场巨大的变革,正在酝酿之中。


  (https://www.shubada.com/121182/39441172.html)


1秒记住书吧达:www.shubada.com。手机版阅读网址:m.shubada.com