DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

七部门推平台经济发展“路线图”... 记者6月18日从工业和信息化部获悉,工信部、中央网信办、国家发改委等七部门联合印发《促进平台经济大中...
大模型API降价释放了三重信号 近日,上游算力租赁价格持续走高,下游国内主流大模型API(应用程序编程接口)却迎来一轮大幅降价,多款...
全球首次:我国科学家实现单神经... 感谢IT之家网友 的线索投递! 6 月 19 日消息,据央视报道,中国科学院脑科学与智能技术卓越创新...
实测 | 选品、比价、省钱、支... 凌晨刷着满屏“618”满减规则,来回切换京东、淘宝、抖音三款App(应用程序),比价、搜索的繁琐,让...
国产之“光”爆单 AI算力拉动... 今年以来,AI算力浪潮席卷全球。如果把AI大模型比作最强大脑,那么光通信就是为它输送海量数据的“高速...
光量子计算机“天衍-P2000... 近日,在中国科学院量子信息与量子科技创新研究院指导下,中国电信旗下中电信量子集团联合九章(济南)量子...
消息称阿里将推出“千问输入法”... 6月18日,据读佳消息,阿里千问团队将推出名为“千问输入法”的独立APP,产品已开发完成,即将上线各...
银行业保险业人工智能安全开发应... 新华社北京6月18日电(记者李延霞、张千千)国家金融监督管理总局6月18日对外发布《关于银行业保险业...
反转!追觅全面回归主业,战略调... 别看追觅现在拿了全球扫地机双第一,国内有科沃斯、石头、云鲸死死咬住份额,技术迭代速度极快,海外又有戴...
苏黎世为Robotaxi开绿灯... 近日,自动驾驶企业文远知行与全球出行巨头 Uber 联合官宣,双方将在瑞士苏黎世落地商业化 Robo...