DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

华为花100亿在东莞建了个欧洲... ✦ 现场观察 ✦ HDC 2026 · 松山湖 · 三日观察 华为开发者大会(HDC 2026)在松...
给AI发放数字身份证!7项国标... 封面新闻记者 戴云 近日,市场监管总局批准发布《人工智能 智能体互联》系列7项国家标准,也是我国首个...
微言 | “灵晟“超算重夺世界... 最近“中国超算重回世界第一”的话题冲上热搜。据媒体报道,6月23日,在德国汉堡发布的第67期全球超级...
激光共聚焦显微镜的表面粗糙度测... 传统触针式粗糙度仪应用比非接触测量应用的广泛,但面对软质材料、复杂微结构和高精度表面时,材质会容易受...
2026天府人工智能产业生态暨... 6月25日,作为“中外企业四川行”的重要活动之一,以“场景牵引 以用促产”为主题的2026天府人工智...
中国信通院联合华为云等22家单... IT之家 6 月 26 日消息,6 月 25 日,中国人工智能产业发展联盟(AIIA)正式启动词元(...
原创 I... 按照正常的节奏,今年台积电、三星们会量产2nm芯片,而intel已经量产了18A芯片,也就是2nm芯...
走进深圳龙岗机器人街区 近年来,深圳龙岗区打造全国首个机器人街区,集机器人剧场、实验场、产业园区于一体,开设全球首家机器人6...