DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

以数智焕活历史文脉 中原文旅新... 人民网记者 王绍绍 近年来,依托数智技术赋能,中原文旅正打破传统表达边界,以数字化、沉浸式、互动式体...
华为申请计算设备及集群专利,提... 国家知识产权局信息显示,华为技术有限公司申请一项名为“一种计算设备及集群”的专利,公开号CN1217...
原创 现... 我记得去年底那次,SpaceX又一次把Starlink卫星一批一批扔上天。 Falcon 9火箭,复...
以“确定性”重塑体验,滴滴租车... 随着清明、五一假期临近,租车出游市场热度攀升,订单量同比增长显著。然而,车辆临时取消、费用不透明、事...
长沙五一商圈有位“网红”,交警... 4月1日,长沙五一广场核心商圈正式迎来交通管理“新成员”,警用无人巡逻车正式亮相,国金中心司门口智能...
雷军:新一代小米SU7锁单量超... IT之家 4 月 2 日消息,在今晚的雷军拆一拆新 SU7 的直播中,小米创办人、董事长兼 CEO ...
消息称苹果iOS 27快捷指令... 4 月 1 日消息,根据尼古拉斯 · 阿尔瓦雷斯发现的后台代码、经 MacRumors 证实,苹果正...
起底价格不透明的家电维修 家电维修服务长期存在价格不透明、收费偏高、标准缺失等乱象,令消费者深陷“高价维修”困境。近日,据多位...
原创 别... iPhone 18 Pro的模具图居然在网上偷跑了!这波爆料可以说直接把大家的期待值拉满了,那么这款...
从机器人到电动航空,卧龙电驱卡... 出品 | 子弹财经 作者 | 星芒 编辑 | 闪电 美编 | 倩倩 审核 | 颂文 智能机器人的热度...