DeepSeek R1推理性能提升3.8倍,AMD发布下一代开源软件栈技术ROCm 7
创始人
2025-06-14 11:40:47
0

6 月 13 日消息,在今日凌晨的 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 与开发者生产力。

随着 ROCm 7 的发布,AMD 终于从其 ROCm 6 软件栈向前迈进,该软件栈在过去几年中 —— 尤其是在 AI 计算出现以来 —— 已经经历了多次更新。以下是 AMD 在 ROCm 7 中重点关注的一些功能:

最新算法与模型

用于扩展 AI 的高级功能

MI350 系列支持

集群管理

企业级功能

通过 ROCm,AMD 表示其正更加专注于其软件堆栈中日益增长的推理能力。ROCm 7 堆栈将包括增强型框架,如 vLLM v1、llm-d、SGLang,并专注于提供多种优化。即将到来的 ROCm 7 新内核和算法包括 GEMM 自动调优、MoE、Attention 和基于 Python 的内核编写。

AMD 已宣布对其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 也包含对这些高级数据类型的全面支持,如 FP8、FP6、FP4 和混合精度。

IT之家从发布会获悉,在性能方面,AMD 表示 ROCm 7 将推理作为重点,为 AI 工作负载带来了高达 3.5 倍的性能提升。

具体来看,相较于 ROCm 6,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍,Qwen2-72B 提升了 3.4 倍,DeepSeek R1 提升了 3.8 倍。

【来源:IT之家】

相关内容

热门资讯

法因未来取得拼接交换平台式激光... 国家知识产权局信息显示,山东法因未来智能制造有限公司取得一项名为“一种拼接交换平台式激光切板机”的专...
热变电奇迹现场上演 曲靖科技馆... 2025年12月28日上午,曲靖市科技馆“去高校学科学”系列活动第五讲,走进曲靖师范学院第二理学楼物...
【国企动态】市数据集团:宿迁一... 近日,宿迁市楚润数据集团正式上线运营宿迁市一体化算力调度监测平台(https://calcloud....
“非完全人形”机器人正在攻入家... 来源:市场资讯 (来源:钛媒体APP) 资本和市场的双重推动力让2025年成为人形具身智能概念和产业...
别错过!这家事业单位公开招聘 济南先进动力研究所(简称“先进动力所”)位于济南新旧动能转换起步崔寨街道中科新经济科创园,2018年...
万来旅游取得遮阳蓬可调节式盖板... 国家知识产权局信息显示,浙江万来旅游工艺品有限公司取得一项名为“一种遮阳蓬可调节式盖板”的专利,授权...
《连线》杂志:2026年将是阿... 12月29日,著名科技媒体《连线》(WIRED)发表头条文章《再见,GPT-5。你好,千问》。文章称...
AI手串、AI调香、AI照相机... 文 | 锌刻度,作者 | 黎炫岐,编辑 | 陈邓新 在AI席卷各行各业的这一年,不少巨头在这条赛道...
微信回应“占内存”,官方解答存... 一直以来 不少网友总在吐槽: “微信太占手机的存储空间了” 动辄30、40个G 你有这种感受吗? 今...
灵心巧手完成A++轮融资,全球... 来源:市场资讯 (来源:维科网机器人) 今日,全球灵巧手领军企业灵心巧手正式完成A++轮融资,本轮融...