NBA下注首页

NBA下注首页

NBA下注(中国)官网 平头哥发布首款智能网卡「磐脉 920」,补皆 AI 算力终末一块短板

发布日期:2026-05-09 05:29 来源:未知 作者:admin 浏览次数:

GPU 买了那么多,跑起来却像「堵车」?

裁剪|郑玄

最近两年,AI 行业最热的词一直绕不开「算力」。

从大模子教学,到本年 Agent 的火热,再到各家云厂商阻挡扩建智算中心,行业琢磨最多的,简直都是 GPU、芯片和算力畛域。好像只须卡够多,AI 就能继续往前跑。

但执行并不是。

不少作念大模子教学和推理的东说念主,一经越来越显然地感受到另一层问题:机器越来越贵,GPU 越来越强,但模子教学和推理的恶果,却莫得同步擢升。

问题不一定出在算力自身,而可能出在另一件弥远被惨酷的事情上——网力。

平头哥家具总监李旭慧打了个比喻:「要是把算力比作 AI 期间的石油,网力便是输油管说念。算力提供能源,网力保险恶果。」

4 月 28 日,在数字中国缔造峰会上,平头哥发布首款智能网卡磐脉 920。这是国内首个内置 PCIe Switch 的 400G 智能网卡,最大撑执 400Gbps 谈论带宽,可应用于万卡智算集群、通算集群和高性能存储等场景,咫尺一经量产,并将率先部署在阿里云数据中心。

磐脉 920 想要处置的便是「网力」问题。

今天的大模子教学,一个教学任务,经常需要几千以至上万张 GPU 同期谐和。单张 GPU 性能再强,也必须跟总共这个词集群保执同步。

问题在于,只须其中一部分节点慢下来,其他节点就只可恭候。他不雅察到,咫尺行业里好多万卡级智算集群,GPU 实质垄断率较低,「能作念到 60%,一经算行业顶尖水平。」

畴昔行业更容易存眷「有些许卡」,但实质在 AI 教学场景中,系统运造孽果并不是由最强的硬件决定,而是受限于集群里最慢的阿谁节点。「跨越节点的算力会执续闲置恭候,形成大畛域算力浪费。」

磐脉 920 的发布实质上也指明了一个目的:当 GPU 一经裕如强之后,下一步到底该补那儿。

一张网卡,周转总共这个词智算集群

当 AI 智能体启动进入信得过业务场景,推理业务的占比越来越高。

「在 Agent 应用爆发的布景下,推理业务的增长速率权臣快于教学。」李旭慧暗意。

大模子教学强调强同步,而推理靠近的是广阔突发、小包、高频苦求,对低时延和踏实性的要求更高,这也意味着对「网力」的要求更高。

而轮廓一下磐脉 920 在作念的事,便是尽量减少整系统里的「堵」和「等」,通过网力的擢升来开释 AI 算力。

其背后的散伙旨趣,有三个关键。

最初是撑执多旅途 RDMA,突破单沿旅途的局限。

等闲长入,便是正本只可走一条高速,咫尺变成多条路同期分流。更关键的是,这些数据固然分开走,但最终还能按规定准确拼总结。

李旭慧评释注解,磐脉 920 通过撑执逐包喷洒、乱序接纳和选拔性重传,散伙 RDMA 多旅途。

从散伙来看,这套决策带来的改善相比径直。

按照官方实测,磐脉 920 撑执单 QP 打满 400G 带宽,而同类主流家具带宽简略只好其一半。同期,多旅途才气不错把交换机端口缓冲区水线谴责 90%,减少丢包和重传。

第二个关键野心,是把「绕路」变成「直连」。

磐脉 920 最大的亮点之一,是内置 PCIe Switch。这亦然国内首个作念到这少量的 400G 智能网卡。

传统做事器架构里,NBA下注(中国)官网PCIe Switch 泛泛部署在主板上,数据需要绕多个节点转发。散伙便是,有的旅途长,有的旅途短,时延不一致。

关于需要高度同步的 AI 教学任务来说,这种「不整皆」会径直影响恶果。

李旭慧打了个比喻:传统架构里,经常会出现「四个下行通说念挤一个上行通说念」的情况。

这很像四条岔路同期汇入一条骨干说念,堵塞简直不成幸免。

磐脉 920 把 PCIe Switch 径直集成进芯片里面,让网卡与 CPU、GPU 形成更径直的贯穿相关。

少绕路,意味着更低时延;旅途更合并,则意味着更踏实的同步恶果。

把柄平头哥实测,在换取集群畛域和任务条目下,部署磐脉 920 后,大模子教学和推理任务完成期间可裁减 14%。

第三个关键,是让收罗具备我方判断的才气。

传统网卡更多像搬运工。收到数据,搬畴昔,仅此资料。

据了解,磐脉 920 加入了细粒度收罗感知和可编程拥塞截止才气。直白讲,便是它能主动避堵。让收罗启动从被迫传输,变成主动调遣。

关于越来越复杂的 AI 集群来说,这种才气的病笃性会越来越显然。

从这些野心能看出来,磐脉 920 并不是在追求参数上的浅薄擢升,它作念的事情很求实,让一经很贵的算力,少浪费少量,从而引发最大的潜能。

为何是阿里在界说 AI 基础设施?

除了性能自身,磐脉 920 背后更值得存眷的,是平头哥和阿里的全体布局。

畴昔几年,好多公司作念芯片,经常贴近在单一门径,比如 GPU、AI 加快卡或者 CPU。

但平头哥的想路是作念全栈。

咫尺,平头哥一经形成四条家具线:真武系列 AI 芯片、倚天做事器 CPU、镇岳存储主控芯片,以及此次发布的磐脉系列智能网卡。

对应的,刚巧是数据中心里的几个关键门径:算力、存力和网力。

李旭慧在采访中暗意:「单一芯片家具无法处置全链路问题,只好买通算力、存力、网力,才能最大化开释 AI 硬件性能。」

这亦然平头哥和好多单点芯片公司的永诀。它不是只作念一块性能更强的芯片,而是试图从总共这个词系统角度去看问题。

好多芯片公司作念家具,先作念出来,再去找客户和落地场景。

但平头哥不是。

李旭慧告诉极客公园,磐脉 920 立项之时 AI 智能体尚未成为行业焦点。但他们从阿里云自身业务中判断,畴昔 AI 一定会鼓动数据中心收罗才气升级。

「一线业务场景的实质需求,是芯陡然刻迭代与家具优化的中枢驱能源。」先有阿里云的大畛域业务场景,再从实质场景需求里倒推家具界说。

这便是磐脉 920 的买卖旅途。据披露,和平头哥倚天、真武、镇岳系列芯片同样,它会先部署在阿里云数据中心。

从这个角度看,磐脉 920 的发布,自身便是阿里「通云哥」协同才气的一次体现。

通义认真模子,阿里云认真场景,平头哥认真底层硬件。模子需求鼓动云基础设施升级,云场景又反向鼓动芯片演进。

这种全栈自研的闭环,在国内科技公司里并未几见。「通云哥」的款式固然前期插足大、周期长,但一朝走通,护城河也极深。

AI 竞争走到今天,比拼的一经不是单点才气,而是这一整套系统能否顺畅运转。

跟着 AI 越来越多从教学走向推理,模子、云与芯片之间形成的执续反应轮回,全体上风的显现可能才刚刚启动。

* 头图起原:平头哥

极客一问

你怎样看待「磐脉 920」?NBA下注(中国)官网

金年会(JinNianHui)体育官网