DeepSeek 致谢腾讯技术团队优化DeepEP通信框架
创始人
2025-05-08 13:20:20
0

环球网科技综合报道】5月8日消息,腾讯技术团队近日针对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在多种网络环境下的性能实现了显著提升,为企业开展AI大模型训练提供了更高效的解决方案。

据测试结果显示,优化后的DeepEP通信框架在RoCE网络环境下的性能提升了100%,而在IB(InfiniBand)网络环境下也实现了30%的性能提升。这一技术突破得到了DeepSeek的公开致谢,被赞誉为一次“huge speedup”的代码贡献。

腾讯星脉网络团队在DeepEP开源后迅速展开技术攻关,针对该框架存在的两大关键瓶颈——双端口网卡带宽利用率不足和CPU控制面交互时延问题,进行了深入研究和优化。经过不懈努力,他们不仅成功解决了这些问题,还使DeepEP在RoCE网络环境下的性能实现了翻倍,同时在IB网络环境下的通信效率也再提升了30%。

目前,这一优化后的技术方案已经全面开源,并成功应用于腾讯混元大模型等项目的训练推理中。在腾讯星脉与H20服务器构建的环境中,这套方案展现出了出色的通用性和稳定性。(纯钧)

相关内容

热门资讯

第四届链博会:人工智能赋能千行... 6月22日至26日,第四届中国国际供应链促进博览会在北京举办。链博会是以供应链为主题的国家级展会,本...
马云率阿里众高管下田插秧,这次... 据说,阿里内网今天又被一篇帖子刷屏了。 发帖人是阿里合伙人、高德董事长刘振飞,标题起得颇有意思——《...
未来已来:科技如何重塑你的日常... 清晨时分, 智能闹钟按照你的睡眠状态轻柔唤醒, 窗帘自行拉启, 能煮咖啡的机器已煮好了一杯香气浓郁的...
618水桶机推荐:26年6月高... 618水桶机推荐:26年6月高性价比神机盘点,全能无短板 618水桶机推荐:26年6月高性价比神机盘...
原创 宇... 这是我们宇宙的虚无禁区,直径 3.3 亿光年,本该挤着上千个星系,实际却只有孤零零 60 个,它就是...
对话火山引擎谭待:传闻的See... 出品|搜狐科技 作者|张莹 “外面传的所有Seedance收入数据都是错的,而且偏高,给我压力很大,...
鲁Sir数码复盘:荣耀1100... 数码快讯天天看,鲁Sir带你捋一遍。 今天6月23日,数码圈这几条新闻的热度堪称烫手:荣耀把一台1...
三星半导体原中文官网交棒,中文... IT之家 6 月 23 日消息,三星半导体今日发布公告,作为全球官网统一行动的一部分,其原中文官网即...
中美德“盾构机”速度差距:德国... 隧道工程是现代基建的核心脉络,而盾构机作为“工程机械之王”,其掘进速度直接决定工程效率,更是一个国家...
关心:“礼包赠送” 实为隐性租... 【文/观察者网专栏作者 关心】 办理宽带时,一句 “全套设备免费送” 总能打动不少消费者,中国电信等...