阿里Qwen发布320亿参数QwQ-32B大模型
创始人
2025-03-06 12:40:31
0

2025-03-06 09:42:19 作者:狼叫兽

3月6日,阿里Qwen团队正式对外发布了其最新的研究成果——QwQ-32B大语言模型。这款模型拥有320亿参数,在性能上能够与参数量高达6710亿的DeepSeek-R1(其中370亿参数被激活)相媲美。

尽管QwQ-32B的参数量仅为DeepSeek-R1的大约1/21,但通过强化学习技术,该模型成功实现了性能上的显著提升。此外,阿里在这款推理模型中还集成了与Agent相关的能力,使其不仅能够使用工具,还能进行批判性思考,并根据环境反馈动态调整推理过程。

QwQ-32B在多项基准测试中接受了全面评估,涉及数学推理、编程能力和通用能力等多个领域。在数学能力测试AIME24评测集中,以及用于评估代码能力的LiveCodeBench测试中,QwQ-32B的表现与DeepSeek-R1相当,并且大幅优于o1-mini和相同规模的R1蒸馏模型。

同时,在由多位知名研究者主导的多个权威评测榜单中,QwQ-32B也取得了优异成绩。例如,在被称为“最难LLMs评测榜”的LiveBench、用于评估指令遵循能力的IFEval评测集,以及针对函数或工具调用准确性测试的BFCL中,QwQ-32B的得分均超过了DeepSeek-R1。

目前,QwQ-32B已经在Hugging Face和ModelScope平台开源,用户还可以通过Qwen Chat直接体验这一先进模型。

相关内容

热门资讯

原创 智... 又是一年冬天。 2025年11月,又一家智驾公司(毫末智行)轰然倒塌。 虽然此前也有很多零散的消息,...
融资|眸深智能完成数千万元天使... 2025年12月18日,国内首个生成式通用具身大脑公司 —— 「上海眸深智能科技有限公司(眸深智能)...
原创 手... 微信聊天记录里可能有重要的工作文件、珍贵的家人对话或朋友间的美好回忆。但这些记录默认只存在手机里,万...
AI终端玩家卡位,鸿蒙跑出新赛... 大厂们又开始了AI领域的新一轮角力。 12月17日,腾讯宣布升级大模型研发架构,OpenAI前研究员...
主播说联播丨这份新规,剑指互联... 国家发展改革委、市场监管总局、国家网信办联合印发的《互联网平台价格行为规则》今天(20日)发布,为互...
2027年起强制执行!事关你的... 近年来,手机、电脑等电子产品更新换代频率加快,大量旧手机、旧电脑进入回收渠道,但是这些电子产品中存储...
智能手机的下一次变革,已被AI... 智能手机的下一次变革,已被AI启动? 2025年接近尾声,中国基金报推出“2025年终报道”,梳理总...
母婴平台综合评分4.3分,用户... 本文基于公开行业数据,对当前母婴垂类平台进行客观概述,重点分析用户规模、功能特点等维度,以供参考。平...
智能制造 助力陕西工业转型升级 12月18日早上,在陕汽新能源商用车车架制造智能工厂,操作员王强波只需一按电钮,启动总控系统,厂房内...
薪酬方案裁决落地,马斯克成史上... 钛媒体App 12月21日消息,据报道,《福布斯》亿万富豪指数显示,在特拉华州最高法院恢复了埃隆·马...