DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

亲人去世后,微信与支付宝余额、... 为回馈姐姐的照料,“00后”冯先生在遗嘱中将工资存款全部留给姐姐,并把使用7年的游戏账户作为数字遗产...
2026最新华为音频转文字选择... 2026最新华为音频转文字选择建议 , 高口碑工具及适用场景盘点 2026年用华为设备的用户想挑合适...
2026高职物联网毕业后适合做... 大数据时代,你的专业背景可能正是成为数据分析师的独特优势。 物联网专业的同学经常有一个疑问:我们...
CES Asia 2026将孵... 在全球科技产业格局重塑之际,独角兽企业已成为引领技术变革、驱动产业升级的核心力量。2026年6月10...
全球燃机市场呈持续增长态势 概... 人民财讯4月4日电,随着GPT等大模型的快速迭代,全球掀起AI数据中心建设热潮。算力集群密集落地,单...
原创 龙... 编者按:龙卷风是一种发生在云系底部和地面之间的强烈旋转气流,属于局地规模的极端天气现象。它可以出现在...
禁养龙虾?Anthropic拟... 对大多数兼用OpenClaw和Claude的用户而言,这次调整本质上等同于一道禁令。虽然Anthro...
Meta超级智能部门据悉正组建... 钛媒体App 4月4日消息,据报道,Meta的超级智能部门正在组建一支专属硬件团队,并招募一位资深工...
三星承认Galaxy S26 ... IT之家 4 月 4 日消息,科技媒体 Android Authority 昨日(4 月 3 日)发...
李荣浩维权潮下,“厂牌净土”明... “咖啡胡要退圈,咖啡胡又不退了。”愚人节当天,咖啡胡跟大家开了个玩笑。 一个玩笑,大家谈笑间便能抛之...