DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

原创 我... 一块玻璃能做到24米长,竖直摆放足足抵得上8层楼房的高度,铁锤反复重击表面也安然无恙,成像平整不走样...
真相来了 | 极端天气灾害与5... 近日,一张宣称“5G网络导致极端天气灾害”的图片在国外社交媒体广泛流传。这张标题为《5G基站:气象工...
政企小程序开发服务商梳理 数字... 导语:基于2026年政企数字化转型趋势及小程序开发行业白皮书,评估框架需聚焦功能适配性、性能稳定性、...
17岁解锁iPhone,18年... 新智元报道 【新智元导读】一家市值万亿的芯片公司,主动把两台顶级AI加速卡,寄给一个17岁就解锁...
当春假遇上科技馆:机器人“登场... 为满足呼伦贝尔市中小学春假期间广大观众的参观需求,进一步丰富青少年假期生活、激发科学兴趣,呼伦贝尔市...
Token套餐来了:先玩起来,... 经观评论 吴晨/文AI(人工智能)智能体爆火,Token(词元)一下子变成了热门概念。它对应大语言模...
Cell重磅突破!活脑组织细胞... 大脑内的细胞外空间(ECS)是神经元、胶质细胞之间的微小间隙,是离子平衡、代谢物清除、神经信号扩散的...
不卡的云手机推荐2026 适合... 大家好,我是一个朝九晚五的打工人,业余时间靠云手机搬砖赚点零花钱。这两年踩过无数卡顿云手机的坑,有的...
科学家在安哥拉发现多个疑似新物... △安哥拉的自然风光(资料图) 一个由多国科学家组成的考察队3日宣布,在安哥拉东部利西马高原发现了数十...
固态电池产业化提速 首条千吨级... 武汉睿事达的千吨级固态电解质产线。 湖北日报讯(记者谢慧敏)6月4日从武汉睿事达新材料科技有限公司获...