活动速递 | 华为“网络+”破局模型:开启大模型推理加速的下一站
创始人
2025-10-26 14:20:36
0

[中国,哈尔滨,2025年10月23日] 第22届中国计算机大会(CNCC2025)在“冰城”哈尔滨盛大启幕,主题为“数智赋能,无限可能”。华为数据通信产品线研究部部长郑晓龙在大会上发表题为《大模型推理加速与演进:网络如何破局?》的演讲,首次提出“网络+”破局模型,为十万卡智算集群面临的通信瓶颈提供了创新方案。他指出,在单卡算力提升日益趋缓的背景下,唯有通过网络、计算与存储的跨层协同,才能将集群效率推向全新量级。

华为数通研究部部长 郑晓龙发表主题演讲

为支持十万卡智算集群的规模化部署与高效运行,华为提出“网络+”破局模型,旨在系统化解决超大规模集群中的通信瓶颈问题。该主题演讲涵盖架构设计、协议优化与调度策略等多个层面,为构建下一代智算基础设施提供完整技术路径。

网络级负载均衡,应对大EP部署带来的动态通信模式挑战,性能提升20%+。

DeepSeek的出现,将大模型架构引向了更稀疏的大EP部署。随之而来的是通信模式及通信关系的变化。面对通信的随机性和非对称性,华为提出的网络级负载均衡,将通信性能提升20%+,显著降低P99完成时间。

从Chat LLM进入Agentic AI,“超节点”助力实现极致的TPOT需求

大模型应用从聊天式的Chat LLM向Agentic AI演进,对于token生成速度的要求从50ms提升到了10ms以下。这在当前的部署实践中,存在多个挑战:推理阶段以小消息通信为主,控制面时延占比高;单纯卸载控制面,则会消耗计算资源SM。华为推出了CloudMatrix384超节点及对应的超节点网络,为满足极致的TPOT需求提供了可能。

多模态LMM流量混战,网络调度“四两拨千斤”,提升推理性能

“网络+”不是简单的带宽升级,而是让网络成为AI集群的‘第七代算力’。”郑晓龙最后呼吁,华为愿与业界共建标准,与合作伙伴及行业组织一起,共同定义大模型时代的下一代智算网络接口。

相关内容

热门资讯

营商环境 桂在便利丨创新创业,... 12月23日,在崇左市龙州县响水镇鸣凤村的蔗田里,第四代自动化甘蔗整体收割机划出流畅弧线,仿地形前轮...
米粉必看!小米相册不仅能存图,... 很多使用小米手机的朋友,日常打开相册可能只是为了看看照片、删删截图。但其实,小米的系统相册已经进化成...
红外耳温计“误报”真相:久用误... 来源:市场资讯 (来源:大象新闻) 2026年1月1日起,我国将全面禁止生产含汞体温计和含汞血压计产...
数智赋能 绿色领航 造纸行业锚... 人民网北京12月26日电 (记者赵竹青)记者从论坛组委会获悉,以“智驱浆纸·数造新篇·绿享未来”为主...
蓝箭航天公布火箭推进剂加注系统... 人民财讯12月26日电,企查查APP显示,近日,蓝箭航天空间科技股份有限公司“一种火箭推进剂加注系统...
新能源车险,终于要开始降价了? “油电之争”,是当下最热门的话题之一。在攻击新能源车主“最薄弱的地方”时,新能源汽车居高不下的保险费...
锚定“AI+健康”核心战略 倍... 从升级中医体质辨识模型,到推出头皮按摩器Scalp 5等多款智能新品,再到与比亚迪、奇瑞等车企合作布...
华莱半导体取得LED灯珠用散热... 国家知识产权局信息显示,深圳市华莱半导体科技有限公司取得一项名为“一种LED灯珠用散热器”的专利,授...
超级nova加量不加价,nov... 平时拍照,你有没有过那种“拍完就后悔”的感觉?不是构图不好,也不是光线太差,而是颜色很奇怪。明明口红...
“杭州六小龙”又上岸一条!云深... 出品|搜狐科技 作者|郑松毅 编辑|杨锦 “杭州六小龙”,又来一个IPO! 根据中国证劵监督管理委员...