DeepSeek R1推理性能提升3.8倍,AMD发布下一代开源软件栈技术ROCm 7
创始人
2025-06-14 11:40:47
0

6 月 13 日消息,在今日凌晨的 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 与开发者生产力。

随着 ROCm 7 的发布,AMD 终于从其 ROCm 6 软件栈向前迈进,该软件栈在过去几年中 —— 尤其是在 AI 计算出现以来 —— 已经经历了多次更新。以下是 AMD 在 ROCm 7 中重点关注的一些功能:

最新算法与模型

用于扩展 AI 的高级功能

MI350 系列支持

集群管理

企业级功能

通过 ROCm,AMD 表示其正更加专注于其软件堆栈中日益增长的推理能力。ROCm 7 堆栈将包括增强型框架,如 vLLM v1、llm-d、SGLang,并专注于提供多种优化。即将到来的 ROCm 7 新内核和算法包括 GEMM 自动调优、MoE、Attention 和基于 Python 的内核编写。

AMD 已宣布对其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 也包含对这些高级数据类型的全面支持,如 FP8、FP6、FP4 和混合精度。

IT之家从发布会获悉,在性能方面,AMD 表示 ROCm 7 将推理作为重点,为 AI 工作负载带来了高达 3.5 倍的性能提升。

具体来看,相较于 ROCm 6,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍,Qwen2-72B 提升了 3.4 倍,DeepSeek R1 提升了 3.8 倍。

【来源:IT之家】

相关内容

热门资讯

2025国际人工智能奥林匹克学... 2025年8月4日,北京 一场汇聚全球AI少年智慧的科技盛宴 第二届国际人工智能奥林匹克学术活动 (...
废掉一个人最隐蔽的方式:让他一... 2015年,作家李尚龙曾说: 废掉一个年轻人,一根网线就够了。 如今十年过去,算法让这句话更具冲击力...
浙江电信:书写“数字浙江”新答... 当湖州安吉县人民医院通过手机预约,20分钟后就收到无人机送达的医疗物资;当宁波慈溪某车业公司的AI摄...
《战地6》PC版优化很好 98... 《战地6》似乎为AMD的X3D处理器做足了优化,根据Twitch主播Bruhskey,《战地6》能在...
录取通知书里的农业高科技(三夏... 夏忙时节,也是准大学生们梦想实现的季节。随着各地农业大学的年轻学子们陆续收到2025年录取通知书,本...
“大逆不道”的不确定性原理 1924 年,玻尔在丹麦的研究所迎来了一位23岁的小伙,在 3 年多的时间里,玻尔与他结下了深厚的友...
艾氢技术:瞄准氢能产业储运痛点... ● 本报记者 郑萃颖 在全球积极推进能源转型、大力发展清洁能源的背景下,氢能作为一种清洁、高效、可持...
惠州好盈电机取得高可靠无刷电机... 金融界2025年8月2日消息,国家知识产权局信息显示,惠州好盈电机有限公司取得一项名为“高可靠无刷电...
苹果新成立“Answers”团... 【环球网科技综合报道】8月4日消息,据外媒报道,苹果成立了一个新的“Answers”团队,正在开发一...
刘超:技术转移不是终点,而是价... “新质生产力之所以‘新’,其核心逻辑在于以创新科学技术的深化应用为驱动,进而推动产业创新。 而我们一...