为超大规模智算集群铺就“算力大动脉”
创始人
2026-03-17 02:35:38
0

(来源:中国经济导报)

转自:中国经济导报

3月12日,中科曙光在河南省郑州市正式推出首款全栈自研400G无损高速网络——scaleFabric。中国工程院院士邬贺铨在发布仪式上表示:“高速网络是算力基础设施的核心关键技术,其自主可控直接关系到国家算力基础设施的安全与发展质量。”本报记者张守营/摄

本报记者 | 张守营

3月12日,中科曙光在河南省郑州市正式推出首款全栈自研400G无损高速网络——scaleFabric。这是国内首款基于原生RDMA架构的高端网络产品,从底层的112G SerDes IP、交换芯片、网卡,到上层的交换机硬件和管理软件,全部实现自主研发。它的出现,填补了我国在超大规模智能计算高速互联领域的空白,也为正在快速发展的国产智算集群,提供了一条高带宽、低时延、真无损的“算力大动脉”。

发布会后,中科曙光高级副总裁李斌、曙光信息产业(北京)有限公司副总裁李柳、中科曙光高速网络互联产品部总工程师万伟,以及用户代表——北京科技大学计算机与通信学院讲师储根深,一起接受了媒体采访,就产品定位、技术突破、产业生态和未来规划等话题进行了深入交流。

大模型训练,一半时间花在“等数据”

随着AI大模型参数突破万亿、甚至十万亿级别,单靠一台服务器早已无法完成训练。如今,万卡级算力集群成为主流——成千上万张GPU协同工作,就像一个庞大的交响乐团,每个乐手(计算节点)都必须步调一致。

研究显示,在大规模分布式训练中,网络通信耗时占比已达到30%~50%。换句话说,如果网络不畅,算力再强也得“等数据”。这就好比一个乐团指挥的指令传不下去,再好的乐手也只能干等。

目前,全球约60%的高性能计算系统采用InfiniBand网络架构。这种技术凭借原生无损传输、极低延迟的特性,成为顶尖超算和AI集群的标配。然而,从高速SerDes IP、核心芯片到IB网卡、交换机,整个产业链长期被国外厂商垄断。一旦供应链受阻,国产智算集群的扩展将面临严峻挑战。

中国工程院院士邬贺铨在发布仪式上表示:“高速网络是算力基础设施的核心关键技术,其自主可控直接关系到国家算力基础设施的安全与发展质量。”

国产原生RDMA问世:从核心IP到软件全自主

scaleFabric正是为解决这一痛点而生。它采用原生RDMA架构,从底层芯片到上层协议栈全部自研,构建起完整的国产技术体系。

性能上,scaleFabric400系列全面对标英伟达NDR,部分指标实现赶超。网卡基于PCIe5.0接口,端口带宽达400Gbps,端到端通信时延低至0.9微秒;交换机单端口带宽达800Gbps,整机交换容量可达双向64Tbps,交换时延仅260纳秒。这样的组合,足以满足万卡级AI训练集群对网络的极致需求。

在接受媒体采访时,万伟进一步解释了0.9微秒时延的测试条件:“这是一个业内标准测试,测试的是RDMA小包延时最低值。”这同英伟达CX7在同一个水平线上。

除了硬指标,scaleFabric在稳定性和扩展性上也下足了功夫。它采用基于信用的无损流控机制,从根源上避免拥塞丢包,链路故障恢复时间小于1毫秒。与国外同类产品相比,交换机端口密度提升25%,网卡最大QP数支持提升100%,单子网互连规模是传统IB的2.33倍,可轻松支持最大11.4万卡集群部署。同时,网络总成本可降低30%。

技术突破之外,scaleFabric的实际落地能力也已得到验证。目前,该产品已部署于位于郑州的国家超算互联网核心节点,支撑三套万卡级scaleX智算集群上线运行,总规模达3万卡,稳定运行时间超过10个月。

李斌介绍,随着产品在超大规模智算集群中的落地应用,国产原生RDMA技术路线正逐步走向成熟。“我们希望产业化落地,有若干个网卡,也是希望这样的系统越来越多。当前落地的机会是非常非常多的。经过前面这三个月,一方面我们需要在一个真实的超大规模的系统上对这个产品进行更多的打磨;另一方面在这三个月准备我们的产能,为更多的落地做准备。”

从应用场景来看,目前对scale-Fabric最感兴趣的主要集中在两大领域:一是科学工程计算(超算),二是人工智能的训练和推理。

用户视角:从“能用”到“好用”

储根深长期使用各类网络环境进行科研计算。在他看来,“能用”和“好用”是两码事。“在大规模分子动力学模拟或多机并行训练中,网络延迟的微小波动都会被放大,直接影响计算效率。基于原生RD-MA的网络能真正实现‘零丢包、低抖动’,让多机通讯像单机内存访问一样顺畅,这对科研效率的提升是实实在在的。”

当被问及是否与英伟达方案进行过横向对比时,储根深坦言:“这个对比我们还真没有专门做,但是从今天大家的分享来看,其实这两个差不多在同一层次,甚至我们比他高。”

他同时指出,高性能互联网络的核心难点有两方面:一是生态建设,英伟达和IB的生态已经非常成熟,曙光需要更大的环境和更多的单位来支持,进一步发展壮大;二是十万卡级的组网技术,如何把所有节点协同到一起工作,这是技术上的挑战。“从今天发布的效果来看,大规模应用的难点已经突破了。”

从万卡到10万卡:网络成为核心瓶颈

今年的全国两会明确提出建设超大规模智算集群、算电协同新基建工程,行业正从万卡级向10万卡级迈进。李斌表示,scaleFabric的定位就是面向超大规模的紧耦合算力系统,为未来提供支撑。

“从万卡到10万卡做突破,最核心的技术不是来自于计算节点,而是来自于互联系统。”李斌分析道,规模扩大到10万卡后,最大的挑战来自两方面:一是可靠性,“单点的可靠性乘以10万,能稳定跑上一两个小时,这个技术挑战非常大”;二是协同效率,“需要跟应用的算法和流程高度耦合,做大量的软件协同调优工作。过去国内大模型工程化落地能力比较弱,真正要搞这样一个系统,需要一个团队懂芯片、懂拓扑结构、懂网络传输,才能把性能发挥好。”

曙光信息产业(北京)有限公司副总裁李柳补充说,去年DeepSeek出来后,大家非常震撼,已经达到千亿级参数,今年进入万亿级参数时代。“未来万卡、10万卡有可能是常态化的算力集群。我们在郑州建的万卡集群、10万卡集群,已经被承包出去了,这是很大的发展趋势。”

他强调,大规模集群对建设成本、规模和运维性要求极高,“每算一次背后都是成本,我们争取一次性算成功。未来对集群的性能、可靠性、高带宽,甚至后期的运维成本,是建设大集群的主要目标。”

开放生态:与国产算力芯片广泛适配

在技术路线上,当前业界存在RoCE、ScaleOut、ScaleUp等多种选择。李斌表示,中科曙光内部对这些路线都有考量,特别是在超大规模系统上的性能和扩展性。“从后面的趋势来说,也会探索包括不同协议的融合,可能在原生RDMA上面做对RoCE的兼容。从技术来说是开放的,未来能做到一定程度的兼得。”

对于不同芯片的兼容性,李斌透露:“我们现在这个系统,网络接口是标准的,可以和不同的计算芯片做互联。过去我们已经做了一定的适配,未来会探索更高效的方式,比如计算芯片通过专有协议协同到网卡。另外,我们也在推动芯片互联协议的共享,未来有机会跟其他芯片做更高效的直通。”

当被问及与英伟达InfiniBand生态的对比时,李斌认为“它有它的协议和组织,从某种意义上来说也是开放的。最早InfiniBand能起来,就是因为相对开放,支撑了整个社区的开源体系。从我们的角度来说,In-finiBand开放的东西我们会继承,也会沿着这个思路去做。”

他强调,中科曙光未来希望不要做过度的业务绑定,愿意支持国内不同的算力芯片做高端开发。“从商业逻辑来说,InfiniBand被英伟达收购之后,在推进过程中绑定越来越紧密。我们希望开放出来,包括芯片化,跟国内不同的算力芯片都可以做适配。”

产业生态:光合组织牵头,产学研用协同

如何推动AI数据中心产业链的协同创新?李柳介绍,光合组织高性能计算专委会AIDC高速网络工作组,也将同步正式成立,未来将以开放的姿态联合更多国内合作伙伴,做三件事。

第一,把相关的标准建立起来。“标准不建立,大家会走很多无效的路径,效率比较低。未来会把相关的技术都开放出来,建立相关标准。”

第二,基于这个平台打造比较好的生态适配系统。“让更多的人去用,反馈出来为我们打磨好产品。”

第三,联合国内的一些科研力量,把产学研用体系做下去。“相关技术未来还是以探索、应用和产业的模式推动更好的发展。”

超算互联网:让算力像用电一样方便对于超算互联网的未来,李斌描绘了一幅更智能的图景。“从国家定位来说,是让算力用起来像用电、用水一样方便。但可能不一样的地方在于,未来的算力网会更加贴近真正的用户,离用户更近一些。其实用户不是需要冷冰冰的算力,而是需要一个系统帮他解决实际的问题。”

对于“十五五”期间能否构建全国一体化算力网,李斌表示,这个目标正在推进当中。“不同背景的单位参与者都在根据各自的优势做推进。我们在超算互联网中做的工作,代表在这个方向的一些探索,做得相对来说比较务实,落地有一些阶段性的成果出来。包括国家数据局把超算互联网纳入全国一体化算力网系统,也变成了一个试点。”

研发背后的艰辛:从“买不到”到“做出来”

在群访的最后,有记者问及三年研发过程中面临的技术挑战。万伟坦言:“SERDES确实是比较难的技术。一开始我们打算买一些IP,但是发现确实都不符合我们的要求,我们最后只有组建自己的团队专门做这个事情,终于把这个做成了,这个是比较难的。我们研发RDMA引擎时,有些规格定的要比英伟达的高一些,这也是具有挑战的事情。”

李斌补充道:“你说比他做得更好,非常非常难。把网络做好,最底层是物理层的东西,跟工艺都是强相关的。这个过程我们做得非常痛苦,最开始做的时候,也没有那么多信心说这个出来能达到IB的水平。当然,这个确实也经历了很多艰辛,最后出来的结果是非常好的。另外,我能做到有些方面比他好,因为我毕竟是站在巨人肩膀上,原来我们用他的产品也非常多,他中间不太好的设计,我们自研的过程中可以改进,可以去规避。”

补齐算力底座的关键一环

今年《政府工作报告》明确提出“持续推进制造业数字化转型和‘人工智能+’行动”,算力基础设施正进入新一轮升级周期。中科曙光依托在高性能计算、存储与网络领域的长期积累,已逐步形成“算—存—网”协同发展的完整算力底座能力。李斌透露,整个大算力方面的布局,一是核心计算芯片,二是基于核心计算芯片硬件的高效实现,包括冷却和供电等“深水区”技术,三是存算传的协同。

scaleFabric的发布,意味着我国在智算互联这一关键环节开始形成自主技术路径,补齐了智算基础设施中的关键一环。对于未来的智算中心而言,网络不再是配角,而是决定整体效率的核心之一。国产原生RDMA网络的问世,不仅让国产算力跑得更快、更稳,也为“十五五”规划中高速互联技术的攻关提供了有力支撑。

相关内容

热门资讯

果真有挂辅助!微信小程序开心泉... 果真有挂辅助!微信小程序开心泉州辅助器,中至吉安黑科技(透视有挂开挂辅助下载)《详细加薇136704...
原来有透视"德州wp... 原来有透视"德州wpk开挂辅助软件"开挂(透视)辅助工具(推荐几款新版攻略教程)原来有透视"德州wp...
详细透视"WePoK... 详细透视"WePoKer辅助挂怎么下载"开挂(透视)辅助神器(玩家必看分享辅助教程)详细透视"WeP...
有挂秘籍辅助!哈灵脚本ios,... >>您好:哈灵脚本ios确实是有挂的,很多玩家在这款哈灵脚本ios游戏中打牌都会发现很多用户的牌特别...
有挂头条辅助!多乐跑的快脚本,... 有挂头条辅助!多乐跑的快脚本,中至江西插件(玩家交流开挂辅助下载)《详细加薇136704302咨询》...
正版透视"wepok... 正版透视"wepoker线上发牌的规律"开挂(透视)辅助下载(实测揭晓透牌教程)正版透视"wepok...
竟然有挂开挂!山西扣点点辅助工... 您好:山西扣点点辅助工具免费这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用...
原来有透视"Wepo... 原来有透视"Wepoker透视免费版"开挂(透视)辅助神器(盘点一款透明挂教程)原来有透视"Wepo...
有挂辅助开挂!逗娱科技碰胡辅助... 较多好评“微乐万能挂官网”开挂(透视)辅助教程 了解更多开挂安装加(136704302)微信号是一款...
详细透视"wepok... 详细透视"wepoker开挂功能"开挂(透视)辅助安装(实测交流透明挂教程)详细透视"wepoker...