DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

NTP时间同步服务器,如何为你... 我们在谈论网络的时候,常常关注的是带宽有多宽、延迟有多低、数据会不会丢。但有一个同样关键、却容易被忽...
小米、京东等互联网大厂同时出手... 当人形机器人开始行走、奔跑,甚至完成空翻时,一个更本质的拷问浮出水面:它们能否像人类一样,真正“拿起...
AI已“无米下锅”:以掼蛋思维... 陆天然/文 从ChatGPT掀起大模型热潮,到AI在多领域落地应用,人工智能的发展恰似一场讲究策略与...
苹果传奇设计师艾维操刀,法拉利... IT之家 4 月 3 日消息,据外媒 Carscoops 于 4 月 3 日(今天)凌晨报道,法拉利...
中控技术申请问答模型验证方法专... 国家知识产权局信息显示,中控技术股份有限公司申请一项名为“一种问答模型验证方法、系统、电子设备和存储...
“人工智能+药品监管”怎么干?... 4月2日,国家药监局发布《关于“人工智能+药品监管”的实施意见》(以下简称《意见》)。 《意见》包括...
原创 “... 2026年4月1日傍晚,美国佛罗里达州肯尼迪航天中心的39B发射台上,322英尺高的太空发射系统火箭...
苏磁智能取得液冷式机壳专利,提... 国家知识产权局信息显示,苏州苏磁智能科技有限公司取得一项名为“液冷式机壳、磁悬浮电机及磁悬浮设备”的...
原创 H... 文字 | 朝乾 校对 | 朝乾 编辑 | 澄澈 最近半个月,石油涨价约15%,很多么?再看氦气,价格...