DeepSeek R1推理性能提升3.8倍,AMD发布下一代开源软件栈技术ROCm 7
创始人
2025-06-14 11:40:47
0

6 月 13 日消息,在今日凌晨的 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 与开发者生产力。

随着 ROCm 7 的发布,AMD 终于从其 ROCm 6 软件栈向前迈进,该软件栈在过去几年中 —— 尤其是在 AI 计算出现以来 —— 已经经历了多次更新。以下是 AMD 在 ROCm 7 中重点关注的一些功能:

最新算法与模型

用于扩展 AI 的高级功能

MI350 系列支持

集群管理

企业级功能

通过 ROCm,AMD 表示其正更加专注于其软件堆栈中日益增长的推理能力。ROCm 7 堆栈将包括增强型框架,如 vLLM v1、llm-d、SGLang,并专注于提供多种优化。即将到来的 ROCm 7 新内核和算法包括 GEMM 自动调优、MoE、Attention 和基于 Python 的内核编写。

AMD 已宣布对其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 也包含对这些高级数据类型的全面支持,如 FP8、FP6、FP4 和混合精度。

IT之家从发布会获悉,在性能方面,AMD 表示 ROCm 7 将推理作为重点,为 AI 工作负载带来了高达 3.5 倍的性能提升。

具体来看,相较于 ROCm 6,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍,Qwen2-72B 提升了 3.4 倍,DeepSeek R1 提升了 3.8 倍。

【来源:IT之家】

相关内容

热门资讯

【深改2025 科协亮点工作】... 2025年,科技中心整合区内资源,成功申报中国科协赋能项目,推动组织建设与资源整合,助力区域科技创新...
荣耀Magic8 Pro官宣全... IT之家 1 月 20 日消息,在昨晚的荣耀 Magic8 ProAir 及荣耀联名设计系列新品发布...
智谱AI在华为芯片上成功训练多... 中国智谱AI公司完全使用华为处理器训练图像生成模型,证明中国企业在无法获得先进西方芯片的情况下,仍能...
赋能机构投研升级 中信建投“智... 转自:中国证券报·中证网 中证报中证网讯(记者 谭丁豪)当市场波动常态化、资产轮动加速,传统投研模式...
海报组图|从1G到6G,广东手... 世界每卖出三台手机,就有一台源自广东。这片中国智能手机产业的核心集聚区,从1987年广州开通首个蜂窝...
南山多家企业入围国家AI医疗器... 深圳商报·读创客户端记者 郑恺 近日,工业和信息化部、国家药品监督管理局联合发布《关于公布2025年...
原创 携... 作者|睿研消费 编辑|Emma 来源|蓝筹企业评论 最近携程不太平。 先是与柬埔寨国家旅游局签了个合...
全程可追溯,鸡蛋有了“数字身份... 全程可追溯,鸡蛋有了“数字身份证” ——AI赋能千行百业一线故事(二十) 1月16日,在邯郸百瑞可...
机器人维保供应商:构建高效运维... 机器人维保供应商:构建高效运维体系的关键角色 随着工业4.0时代的到来,机器人在制造业、物流业等多...
中科院研发海洋生物地球化学原位... 麦姆斯咨询获悉,近日,中国科学院西安光机所吴国俊团队牵头研制的多型国产海洋生物地球化学原位传感器完成...