DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

ChatGPT记忆大升级,十亿... 新智元报道 【新智元导读】奥特曼官宣ChatGPT记忆重大升级!全新Dreaming V3架构正式...
上海海关推出智能验核终端,离境... 近日,上海海关新一代离境退税海关智能验核终端投入运行,以“前端智能终端+验核平台协同支撑”一体化服务...
原创 2... 一、影像革命:当手机镜头遇上专业光学 OPPO Find X8 Ultra的影像系统堪称移动摄影的...
原创 为... 短视频平台上,关于中国航天员荣誉等级的讨论总能引来成千上万的评论和转发。细心的网友翻阅航天员大队公开...
达实智能召开生态伙伴大会,“ ... 2026年6月3日,“AI赋能 · 价值共生”2026达实生态合作伙伴大会在深圳南山区达实智能大厦成...
你要的token全拿走,胡彦斌... 文|许静 当歌手拿起AI写代码,“Vibe Coding” 的风已经吹进娱乐圈。就在今天,胡彦斌官宣...
原创 主... 在化学元素周期表中,主族元素的最高正化合价与其主族序数之间存在着密切的联系。根据元素周期律,主族元素...
原创 6... 全球每卖出10台高性能四足机器人,有6台以上印着“中国宇树”的标签。 2025年,它卖出超过5500...
原创 大... 最近两年,日本国内有个话题越吵越热,连电视台都反复拿出来讨论:那些本土辛辛苦苦培养出来的科研尖子,怎...
全球首个!“预制算力中心底座”... 据央视新闻报道,6月6日,全球首个预制算力中心底座在山东青岛正式启用。相较于传统算力中心节约施工周期...