DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

无人机在移动船载平台精准降落 无人机在移动船载平台精准降落 这项智能化技术于黄骅港水域通过测试 工作人员进行起降测试。 通讯员 ...
滴!福天天带你极速打卡福建新一... 它们驻守山巅、倚傍大海、仰望苍穹,将瞬息万变的风云尽收眼底。 它们捕捉每一片云的轨迹,追踪每一滴雨的...
原创 雷... 还记得第一代小米SU7是发布还是上市之后,雷军表示从北京到上海只充一次电。然后雷军被黑惨了!虽然稍有...
全链条共享,千亿集群加速崛起 (来源:河北日报) 转自:河北日报 全链条共享,千亿集群加速崛起 □本报记者 张晓超 “这批元器件急...
我国机构发布全球医学与生命科学... 我国机构自主研发制定的全球医学与生命科学高质量期刊列表3月21日发布,为世界学术期刊评价提供了“中国...
“北脑一号”脑机系统已完成7例... 人民网北京3月22日电 (记者董兆瑞)3月20日,2026年北京市未来产业发展重点工作新闻发布会召开...
全球每4块智能穿戴显示屏,就有... 谁懂啊 在维信诺昆山公司的产品展厅 逛一圈 直接刷新对“显示屏”的认知 薄如蝉翼的电子屏在微风中颤动...
原创 马... 回望过去十几年,马斯克吹过的牛全都变成了现实。当初他说火箭能回收,全网都在嘲笑。如今他的太空探索公司...
自主研发期刊评价体系发布 专家... 中新网北京3月21日电(记者 张素)依据自主研发的“种子期刊引文追溯+引文网络层级结构分级法”,从全...
能吸、能动、能切!西工大院士团... 一块材料能做什么?在大多数人印象里,材料是“被动”的——钢铁承重、塑料绝缘、橡胶密封…… 但如果告诉...