DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

山东低空重载商业航线首飞 1月16日上午,山东首条低空重载商业运营航线在济南市莱芜区成功首飞,标志着全省低空经济正式迈入商业化...
菏泽联通:圆满完成郓城县医院搬... 齐鲁晚报·齐鲁壹点 宋秋梅 通讯员 陈芳 医疗资源升级,通信先行护航。近日,菏泽郓城县人民医院新院区...
AI芯片技术演进的双轨路径:从... 指令集优化与电路级重构协同塑造智能计算新生态 【导语】随着人工智能从算法研究走向大规模工程化与产业化...
第二家2万亿AI独角兽即将诞生... 智东西 作者 | 陈骏达 编辑 | 李水青 智东西1月19日消息,昨天,据英国《金融时报》报道,美国...
华为联合四川农商联合银行打造数... 1月16日,第三届区域银行数智融合创新主题交流活动在成都顺利举办,大会以“数智川流·聚势共生”为主题...
保真数字孪生+AI 超级智能工... 2026年1月8日,上海——在CES 2026国际消费电子展上,英伟达与西门子联合发布Digital...
富程威申请固态电池缓冲材料专利... 国家知识产权局信息显示,珠海市富程威科技有限公司申请一项名为“一种用于固态电池或电池模组的缓冲材料及...
708个学术会议入选!《重要学... 近日,中国科协发布《重要学术会议目录(2025)》,聚焦高水平学术会议的价值引领导向,集中收录了20...
怀柔科学城国家级科研平台+1!... 1月19日,记者从密云区获悉,国家水生态环境智慧监测业务与实验平台项目已启动建设,建成后,将与怀柔科...
哈工大系闯出人形机器人黑马:成... 允中 发自 凹非寺 量子位 | 公众号 QbitAI 就在刚刚,人形机器人赛道投下了一颗“开源炸弹”...