阿里Qwen发布320亿参数QwQ-32B大模型
创始人
2025-03-06 12:40:31
0

2025-03-06 09:42:19 作者:狼叫兽

3月6日,阿里Qwen团队正式对外发布了其最新的研究成果——QwQ-32B大语言模型。这款模型拥有320亿参数,在性能上能够与参数量高达6710亿的DeepSeek-R1(其中370亿参数被激活)相媲美。

尽管QwQ-32B的参数量仅为DeepSeek-R1的大约1/21,但通过强化学习技术,该模型成功实现了性能上的显著提升。此外,阿里在这款推理模型中还集成了与Agent相关的能力,使其不仅能够使用工具,还能进行批判性思考,并根据环境反馈动态调整推理过程。

QwQ-32B在多项基准测试中接受了全面评估,涉及数学推理、编程能力和通用能力等多个领域。在数学能力测试AIME24评测集中,以及用于评估代码能力的LiveCodeBench测试中,QwQ-32B的表现与DeepSeek-R1相当,并且大幅优于o1-mini和相同规模的R1蒸馏模型。

同时,在由多位知名研究者主导的多个权威评测榜单中,QwQ-32B也取得了优异成绩。例如,在被称为“最难LLMs评测榜”的LiveBench、用于评估指令遵循能力的IFEval评测集,以及针对函数或工具调用准确性测试的BFCL中,QwQ-32B的得分均超过了DeepSeek-R1。

目前,QwQ-32B已经在Hugging Face和ModelScope平台开源,用户还可以通过Qwen Chat直接体验这一先进模型。

相关内容

热门资讯

三星正研发改进型S Pen手写... IT之家 2 月 27 日消息,三星从 Galaxy S25 Ultra 开始砍掉了 S Pen 手...
NASA突然为登月计划新增一次... 来源:环球市场播报 作者:杰基・沃特斯 NASA 周五突然宣布,调整宇航员重返月球表面的计划,决定...
中国移动广西公司以科技赋能民族... 在广西河池市,中国移动广西公司以“科技+文化”融合创新为引擎,通过数字化手段活化非遗、赓续红色精神、...
亚马逊豪掷500亿美元投资Op... 来源:市场资讯 (来源:IT之家) IT之家 2 月 27 日消息,OpenAI 与亚马逊今日宣布达...
豪迈气门嘴取得一种机械手专利,... 国家知识产权局信息显示,山东豪迈气门嘴有限公司;山东同创精密科技有限公司取得一项名为“一种机械手”的...
我国发明专利申请量连续多年全球... 我国发明专利申请量连续多年全球居首 拥有全球60%人工智能专利、约2/3机器人相关专利 国家知识产权...
透明软件!开心泉州辅助器,wp... 透明软件!开心泉州辅助器,wpk刷入池率脚本(辅助挂)详细开挂辅助平台;亲,wpk刷入池率脚本这款游...
透视数据!wepoker免费脚... 透视数据!wepoker免费脚本,hhpoker真的假的(辅助挂)详细开挂辅助平台;亲,hhpoke...
透视辅助!小程序跑的快辅助器,... 【亲,小程序跑的快辅助器 这款游戏可以开挂的,确实是有挂的,很多玩家在这款小程序跑的快辅助器中打牌都...
透视模拟器!胡莱三国辅助工具,... 透视模拟器!胡莱三国辅助工具,hhpoker软件靠谱吗(辅助挂)详细开挂辅助神器 了解更多开挂安装加...