DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

文博会解锁AI+MR新玩法 与... 深圳新闻网2026年5月21日讯(记者 刘惠敏 胡津玮)第二十二届中国(深圳)国际文化产业博览交易会...
2026年9岁儿童手机推荐,主... 在现代科技的推动下,上海灵宇宙科技发展有限公司的儿童手机专为3-12岁孩子设计、集合了多项功能发展。...
签约项目91亿元!“中国星谷”... 沿着星谷大道一路向东,一幅“箭指苍穹、星耀太空”的航天蓝图正在“中国星谷”徐徐铺展。 这里是武汉市新...
原创 谷... 对于谷歌和百度而言,这种共同的技术信仰和战略同频,并非一日之功,而是两家技术公司在二十多年的发展历程...
中科信息(300678.SZ)... 来源:格隆汇APP 格隆汇5月20日丨中科信息(300678.SZ)公布,公司于近日通过了CMMI5...
OpenAI联合五巨头刚进场,... (文/陈济深 编辑/张广凯) 美东时间5月5日,OpenAI联合英伟达、AMD、英特尔、微软和博通...
绿联DXP4800 GT深度体... 近年来,移动设备性能的飞速提升,伴随而来的是个人数据量的急剧膨胀。曾经 64GB 的手机存储空间就足...
【科普】科技名词|贝尼奥夫带 科技名词 贝尼奥夫带 名词解释 贝尼奥夫带 Benioff zone 定义:自海沟向岛弧或大陆倾斜的...
AI涌入文博会,腾讯搬出“文化... 深圳商报·读创客户端首席记者 袁静娴 5月21日,第二十二届中国(深圳)国际文化产业博览交易会在深...
纳赛尔·梅蒙:人工智能时代,何... 本文为纳赛尔·梅蒙(Nasir Memon)教授(上海纽约大学计算机科学、数据科学与工程学部代理主任...