DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

字节反击腾讯称“都是卖猪食的,... 近日,有传言称,腾讯副总裁批“低质洗脑短视频像猪食”,字节跳动副总裁反击称:“都是卖猪食的,谁也别看...
手机清空回收站误删数据恢复工具... 请帮帮我!我彻底慌了,手机里的所有文件都丢了!多年的照片、视频、音乐、短信和聊天记录——全都没了!我...
全球首个!我国6G频率获批,有... IT之家 5 月 26 日消息,本月初(5 月 8 日),工业和信息化部发文,为进一步推动我国 6G...
博实结获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示博实结(301608)新获得一项实用新型专利授权,专利名为“一...
原创 刚... 本来今天想给大家跟 OPPO Reno16 系列跟荣耀 600 系列的新机发布会的... 但由于晚...
打工机器人,在杭州“交社保” “各大厂商基本都已推出了2万元左右的消费级新产品,有些小于1米的迷你机器人已下探到千元区间。” 文 ...
神舟二十三号搭载9项太空实验 神舟二十三号载人飞船发射入轨后,于5月25日凌晨成功对接于空间站天和核心舱。记者从中国科学院空间应用...
科美诊断申请化学发光检测试剂专... 国家知识产权局信息显示,科美博阳诊断技术(上海)有限公司、科美诊断技术股份有限公司申请一项名为“一种...
谷光伏太阳能支架设备企业 谷光伏太阳能支架设备企业:支撑绿色能源的隐形脊梁 提到太阳能发电,大家往往首先想到的是那些闪闪发光的...