DeepSeek R1推理性能提升3.8倍,AMD发布下一代开源软件栈技术ROCm 7
创始人
2025-06-14 11:40:47
0

6 月 13 日消息,在今日凌晨的 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 与开发者生产力。

随着 ROCm 7 的发布,AMD 终于从其 ROCm 6 软件栈向前迈进,该软件栈在过去几年中 —— 尤其是在 AI 计算出现以来 —— 已经经历了多次更新。以下是 AMD 在 ROCm 7 中重点关注的一些功能:

最新算法与模型

用于扩展 AI 的高级功能

MI350 系列支持

集群管理

企业级功能

通过 ROCm,AMD 表示其正更加专注于其软件堆栈中日益增长的推理能力。ROCm 7 堆栈将包括增强型框架,如 vLLM v1、llm-d、SGLang,并专注于提供多种优化。即将到来的 ROCm 7 新内核和算法包括 GEMM 自动调优、MoE、Attention 和基于 Python 的内核编写。

AMD 已宣布对其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 也包含对这些高级数据类型的全面支持,如 FP8、FP6、FP4 和混合精度。

IT之家从发布会获悉,在性能方面,AMD 表示 ROCm 7 将推理作为重点,为 AI 工作负载带来了高达 3.5 倍的性能提升。

具体来看,相较于 ROCm 6,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍,Qwen2-72B 提升了 3.4 倍,DeepSeek R1 提升了 3.8 倍。

【来源:IT之家】

相关内容

热门资讯

诺基亚助力印尼电信巨头实现绿色... 近日,印尼领先的数字电信公司Indosat Ooredoo Hutchison部署了诺基亚能源效率解...
数字技术助力红色文化与思政教学... □ 蒋文汇 刘宗劲 在数字化浪潮席卷教育领域的当下,虚拟仿真技术以突破时空限制、重构认知体验的独特优...
知微新材料取得氮化硅高温陶瓷加... 金融界2025年7月11日消息,国家知识产权局信息显示,深圳知微新材料技术有限公司取得一项名为“一种...
“十四五”以来,我国制造强国建... 中国经济报导:“十四五” 以来,我国制造强国建设迈出坚实步伐,以先进制造业为骨干的现代化产业体系加速...
财政部:4500万元以上的医疗... 据财政部网站消息,7月6日,财政部发布关于在政府采购活动中对自欧盟进口的医疗器械采取相关措施的通知。...
美团免单冲上热搜榜首!外卖补贴... 7月10日,“美团免单”的话题冲上热搜榜首,引起网友关注。有网友反映,收到了美团外卖免单的通知短信,...
建筑机器人“整活”!广州建博会... 7月8日至7月11日,第27届中国(广州)国际建筑装饰博览会(以下简称“广州建博会”)在广交会展馆举...
从河埠小港驶向世界一流 不久前,我带着朋友游览天津市古文化街,他们对天津港集团的“津港印象”展览馆印象深刻。丰富的港口元素和...
新毅东申请光刻机可变狭缝控制相... 金融界2025年7月9日消息,国家知识产权局信息显示,新毅东(北京)科技有限公司申请一项名为“光刻机...
存储空间越来越不够用!1%的P... 据最新的Steam硬件调查结果显示,PC游戏玩家正面临日益严重的存储空间危机。现在游戏是越来越庞大,...