DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

母婴平台综合评分4.3分,用户... 本文基于公开行业数据,对当前母婴垂类平台进行客观概述,重点分析用户规模、功能特点等维度,以供参考。平...
智能制造 助力陕西工业转型升级 12月18日早上,在陕汽新能源商用车车架制造智能工厂,操作员王强波只需一按电钮,启动总控系统,厂房内...
薪酬方案裁决落地,马斯克成史上... 钛媒体App 12月21日消息,据报道,《福布斯》亿万富豪指数显示,在特拉华州最高法院恢复了埃隆·马...
宇树机器人为王力宏伴舞,马斯克... 近日,在歌手王力宏的演唱会上,6台宇树科技的人形机器人登台伴舞,引发热议。 网友发布的视频显示,6台...
奥尔特曼最新预测!未来告别屏幕... OpenAI的AI硬件计划备受关注,就在近日的一场播客中,被问及在筹备的AI硬件时,OpenAI C...
美国一法院放行马斯克原560亿... 美国特拉华州最高法院19日裁定,特斯拉公司首席执行官埃隆·马斯克原总值560亿美元的薪酬方案遭下级法...
诺奖得主Hassabis:5-... 新智元报道 编辑:元宇 【新智元导读】近日,在与数学家Hannah Fry的对话中,DeepMin...
华为鸿蒙系统开发者人数突破10... 来源:市场资讯 (来源:IT之家) IT之家 12 月 21 日消息,据心声社区公众号本周五分享,鸿...
小人型机器人首批量产交付 首钢... 12月20日,加速进化Booster K1全球首批规模化量产交付仪式在首钢园融石广场陶朱新造局门店举...
Scaling Law没死!G... 谷歌又要有重大突破了? 最近,Google DeepMind的Gemini预训练负责人Sebasti...