DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

2026中关村论坛年会人工智能... 今天,2026中关村论坛年会正式启幕! 当全球顶尖的AI智慧汇聚海淀,当前沿科技的硬核发布与全民参...
苹果触控输入系统新专利曝光 可... 【CNMO科技消息】据CNMO了解,近日公布的一项苹果专利文件,详细描绘了其未来设备可能采用的下一代...
英特尔发布基于第三代酷睿Ult... IT之家 3 月 25 日消息,英特尔今日正式发布基于第三代酷睿 Ultra 处理器的 vPro 平...
字跳网络申请用于拼接图像的方法... 国家知识产权局信息显示,北京字跳网络技术有限公司申请一项名为“用于拼接图像的方法、装置、设备和程序产...
贝索斯旗下蓝色起源进军太空数据... 在瞄准企业市场推出由数千颗近地轨道(LEO)和中地球轨道(MEO)卫星组成的"TeraWave"平台...
靠谱的净化车间设计品牌推荐:实... 导语:净化车间设计是现代制造业生产体系中的关键环节,其性能与可靠性直接影响生产线的效率、品质与成本。...
估值逻辑已重构,26年投资小米... 当行业与资本市场仍沉浸在AI Agent的概念狂欢中,热议大模型如何驱动智能体完成复杂任务之时,相信...
好评广西|AI从广西来 新的一年,全国两会如期而至。机器人主播桂小Ai第一次走进北京,在广西云AI访谈间亮相,成为今年报道现...
原创 美... 2025年5月,美国商务部对电子设计自动化软件出口实施了许可要求,主要涉及几家领先企业对中国客户的销...
博鳌面对面丨对话中国工程院院士... 央广网北京3月25日消息(记者王泽华)据中央广播电视总台中国之声报道,正在进行的博鳌亚洲论坛2026...