阿里Qwen发布320亿参数QwQ-32B大模型
创始人
2025-03-06 12:40:31
0

2025-03-06 09:42:19 作者:狼叫兽

3月6日,阿里Qwen团队正式对外发布了其最新的研究成果——QwQ-32B大语言模型。这款模型拥有320亿参数,在性能上能够与参数量高达6710亿的DeepSeek-R1(其中370亿参数被激活)相媲美。

尽管QwQ-32B的参数量仅为DeepSeek-R1的大约1/21,但通过强化学习技术,该模型成功实现了性能上的显著提升。此外,阿里在这款推理模型中还集成了与Agent相关的能力,使其不仅能够使用工具,还能进行批判性思考,并根据环境反馈动态调整推理过程。

QwQ-32B在多项基准测试中接受了全面评估,涉及数学推理、编程能力和通用能力等多个领域。在数学能力测试AIME24评测集中,以及用于评估代码能力的LiveCodeBench测试中,QwQ-32B的表现与DeepSeek-R1相当,并且大幅优于o1-mini和相同规模的R1蒸馏模型。

同时,在由多位知名研究者主导的多个权威评测榜单中,QwQ-32B也取得了优异成绩。例如,在被称为“最难LLMs评测榜”的LiveBench、用于评估指令遵循能力的IFEval评测集,以及针对函数或工具调用准确性测试的BFCL中,QwQ-32B的得分均超过了DeepSeek-R1。

目前,QwQ-32B已经在Hugging Face和ModelScope平台开源,用户还可以通过Qwen Chat直接体验这一先进模型。

相关内容

热门资讯

推动人工智能与实体经济深度融合... 7月28日,2025人工智能产品应用博览会在苏州工业园区开幕。本届智博会以“智无界·慧共生”为主题,...
原创 郭... 在6月17日,令人期待的《此处通往繁星》开机现场,两位主角郭麒麟与张雪迎并肩而立,仿佛两个世界的连接...
记者观察:大模型行业应集各家所... 在近日举行的2025世界人工智能大会上,记者发现大模型行业出现了一个有趣的现象:同行非但没有成为冤家...
宜兴农商银行完成ATM信创改造... 在金融科技飞速发展的今天,数据安全成为银行运营中不可忽视的重要环节。宜兴农商银行近期完成的ATM信创...
宁德时代获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示宁德时代(300750)新获得一项发明专利授权,专利名为“一种...
联想AI基础设施新品落地长沙,... 数据显示,2021年长沙数字经济总量突破4000亿元,位居全国第12位;至2023年,全市数字经济核...
美图秀秀、美颜相机2025上半... 在2025年的移动互联网领域,美图公司再度展现了其强大的市场影响力。据QuestMobile最新发布...
SuperCLUE测评榜单第一... 今年6月,工业和信息化部在审议《工业和信息化部信息化和工业化融合2025年工作要点》时,明确提出要实...
依托Qwen多模态大模型,工行... 移动支付网消息(欧文):银行业正积极推进人工智能大模型在金融领域应用。近日,工商银行为解决商户准入审...
聚焦WAIC 2025|数据标... (记者 张苏慧)7月26日-29日,WAIC 2025在上海举行。在中国电信展台上,“方言语音高质量...