DeepSeek R1推理性能提升3.8倍,AMD发布下一代开源软件栈技术ROCm 7
创始人
2025-06-14 11:40:47
0

6 月 13 日消息,在今日凌晨的 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 与开发者生产力。

随着 ROCm 7 的发布,AMD 终于从其 ROCm 6 软件栈向前迈进,该软件栈在过去几年中 —— 尤其是在 AI 计算出现以来 —— 已经经历了多次更新。以下是 AMD 在 ROCm 7 中重点关注的一些功能:

最新算法与模型

用于扩展 AI 的高级功能

MI350 系列支持

集群管理

企业级功能

通过 ROCm,AMD 表示其正更加专注于其软件堆栈中日益增长的推理能力。ROCm 7 堆栈将包括增强型框架,如 vLLM v1、llm-d、SGLang,并专注于提供多种优化。即将到来的 ROCm 7 新内核和算法包括 GEMM 自动调优、MoE、Attention 和基于 Python 的内核编写。

AMD 已宣布对其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 也包含对这些高级数据类型的全面支持,如 FP8、FP6、FP4 和混合精度。

IT之家从发布会获悉,在性能方面,AMD 表示 ROCm 7 将推理作为重点,为 AI 工作负载带来了高达 3.5 倍的性能提升。

具体来看,相较于 ROCm 6,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍,Qwen2-72B 提升了 3.4 倍,DeepSeek R1 提升了 3.8 倍。

【来源:IT之家】

相关内容

热门资讯

iPhone17Pro被黄牛拒... 9月19日,苹果iPhone 17系列机型正式开售。在某一线城市苹果门店前,有黄牛现场收购首批新机。...
811公里!超高速!又一国际海... 近日, 烽火通信BaSICS Pro 400G系统成功完成稳定性测试与业务加载,多项性能指标表现优异...
王亚平:男女航天员训练标准一样... 中新网9月19日电 国新办19日就《新时代中国推进妇女全面发展的实践与成就》白皮书举行新闻发布会。全...
光影秀+智慧养老+创客空间!宝... 当科技之光温柔洒满生活,宝山庙行的这个秋天注定与众不同!一场融合未来感与烟火气的“美‘庙’生活季”正...
骑手小哥排队取iPhone 1... 极目新闻记者 李迎 陈红 何佳仪 邓春兰 今早8点刚过,家住上海的王先生就收到了在电商平台预定的iP...
天马发布高端OLED技术品牌:... 2025年9月19日,天马微电子在厦门隆重举办“天工屏 定乾坤”高端OLED技术品牌发布会,正式推出...
打工?狗都不打!机器人:狗不打... “打工?这辈子都不可能打工的!” “好!这是你说的是吧?你不打有的是人打!” 不过此人非彼人。 机器...
至纯科技获得发明专利授权:“在... 证券之星消息,根据天眼查APP数据显示至纯科技(603690)新获得一项发明专利授权,专利名为“在线...
5人被撤销奖励!决不让歪风侵蚀... 坚守诚信底线,科技界再敲警钟:决不让歪风侵蚀科研生态! 中国科协19日发布公告,因周新源等5人存在违...
消息称理想汽车智驾组织拆分为 ... IT之家 9 月 19 日消息,“云见 Insight”今晚爆料称,理想自动驾驶部门近期重新梳理了组...