DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

微软要把公司内部的智能体“管起... IT之家 6 月 6 日消息,微软正在大量使用 AI 智能体。据《商业内幕》6 日报道,为了“管好”...
5G工业路由器厂家梳理 智能制... 导语:根据2026年工业通信设备行业白皮书及市场调研数据,5G工业路由器在智能制造、远程运维等场景需...
世界第一!让全体AI翻车的叠衣... 新智元报道 【新智元导读】一件衣服竟难倒整个AI圈?看狮子山实验室如何硬核破局「柔性操作」难题,斩...
阿卓帕科技取得具有支架的便携屏... 国家知识产权局信息显示,深圳市阿卓帕科技股份有限公司取得一项名为“具有支架的便携屏”的专利,授权公告...
国际空间站维修新漏气点,宇航员... 【文/观察者网 陈思佳】 国际空间站已环绕地球运行27年,正面临设备老化和损坏的风险。据美国有线电...
96GB显存运行230B大模型... 一、前言:128GB的移动AI工作站有多强 随着豆包收费的节点越来越近,再加上之前小龙虾风靡一时之后...
多款施工黑科技亮相万宁智慧工地... 海南日报全媒体记者林博新 6月5日,2026年万宁市安全生产月启动会暨智慧安全工地观摩会在仁里保障性...
全球海洋现象智能预报大模型“琅... 新京报讯 据中国科学院海洋研究所消息,今天(6月6日),由中国科学院海洋研究所自主研发的全球海洋现象...
首飞成功、世界最大!本周我国多... 本周 我国在航天、清洁能源、农业等领域 迎来重大突破 从田间江河到星辰大海 从农业新品种到世纪工程新...
蜜蜂王国新发现:蜂后拥有专属“... 中新网北京6月6日电 (记者 孙自法)国际学术期刊《自然》最新发表一篇生物学论文称,研究人员发现蜜蜂...