DeepSeek R1推理性能提升3.8倍,AMD发布下一代开源软件栈技术ROCm 7
创始人
2025-06-14 11:40:47
0

6 月 13 日消息,在今日凌晨的 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 与开发者生产力。

随着 ROCm 7 的发布,AMD 终于从其 ROCm 6 软件栈向前迈进,该软件栈在过去几年中 —— 尤其是在 AI 计算出现以来 —— 已经经历了多次更新。以下是 AMD 在 ROCm 7 中重点关注的一些功能:

最新算法与模型

用于扩展 AI 的高级功能

MI350 系列支持

集群管理

企业级功能

通过 ROCm,AMD 表示其正更加专注于其软件堆栈中日益增长的推理能力。ROCm 7 堆栈将包括增强型框架,如 vLLM v1、llm-d、SGLang,并专注于提供多种优化。即将到来的 ROCm 7 新内核和算法包括 GEMM 自动调优、MoE、Attention 和基于 Python 的内核编写。

AMD 已宣布对其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 也包含对这些高级数据类型的全面支持,如 FP8、FP6、FP4 和混合精度。

IT之家从发布会获悉,在性能方面,AMD 表示 ROCm 7 将推理作为重点,为 AI 工作负载带来了高达 3.5 倍的性能提升。

具体来看,相较于 ROCm 6,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍,Qwen2-72B 提升了 3.4 倍,DeepSeek R1 提升了 3.8 倍。

【来源:IT之家】

相关内容

热门资讯

从5G、5G-A到6G,新一代... ⇧点蓝色字关注 “网信湖北” 从5G、5G-A到未来6G,新一代通信网正持续迭代升级。不同于大众熟知...
你的DNA正在“打电话”?科学... 你的DNA正在“打电话”?科学家30年实验证明:信号失真,人就病了 上周末,我在一个科普群里看到一段...
售价2999元起,华为nova... 大象新闻记者 李莉 张迪驰 6月1日,华为nova 16系列手机正式发布。大象新闻记者从发布会上获悉...
全球首条S+C+L三波段超低损... IT之家 6 月 2 日消息,据科技日报今日报道,近日,由中国移动联合产业合作伙伴自主设计的全球首条...
AI修图火了!GPT Imag... 2026 年 4 月,OpenAI 正式发布了 GPT Image 2,用更丰富的语言支持、更高的制...
空调开26℃最省电?错!别再被... 近日深圳天气闷热 空调成了居家必备降温神器 社交媒体上 “空调设置26℃ 是最省电的温度” 相关话题...
谷歌母公司Alphabet拟筹... 当地时间6月1日,谷歌母公司Alphabet宣布,拟进行800亿美元的股权融资,以推进其人工智能基础...
原创 开... # 腾讯云官宣降价 #重磅消息落地,腾讯云官方发布调价公告,6 月 3 日零点起下调 DeepSee...
WiFi信号总在卫生间“罢工”... 躺在床上刷视频卡成PPT,一进卫生间直接没信号——这大概是现代人最头疼的家居问题之一。很多人第一反应...
高山峡谷间,东方大峡谷搭起数字... 怒江傈僳族自治州98%区域为高山峡谷,形成了“四山夹三江”的东方大峡谷特殊地貌。每年5月之后,怒江进...