阿里Qwen发布320亿参数QwQ-32B大模型
创始人
2025-03-06 12:40:31
0

2025-03-06 09:42:19 作者:狼叫兽

3月6日,阿里Qwen团队正式对外发布了其最新的研究成果——QwQ-32B大语言模型。这款模型拥有320亿参数,在性能上能够与参数量高达6710亿的DeepSeek-R1(其中370亿参数被激活)相媲美。

尽管QwQ-32B的参数量仅为DeepSeek-R1的大约1/21,但通过强化学习技术,该模型成功实现了性能上的显著提升。此外,阿里在这款推理模型中还集成了与Agent相关的能力,使其不仅能够使用工具,还能进行批判性思考,并根据环境反馈动态调整推理过程。

QwQ-32B在多项基准测试中接受了全面评估,涉及数学推理、编程能力和通用能力等多个领域。在数学能力测试AIME24评测集中,以及用于评估代码能力的LiveCodeBench测试中,QwQ-32B的表现与DeepSeek-R1相当,并且大幅优于o1-mini和相同规模的R1蒸馏模型。

同时,在由多位知名研究者主导的多个权威评测榜单中,QwQ-32B也取得了优异成绩。例如,在被称为“最难LLMs评测榜”的LiveBench、用于评估指令遵循能力的IFEval评测集,以及针对函数或工具调用准确性测试的BFCL中,QwQ-32B的得分均超过了DeepSeek-R1。

目前,QwQ-32B已经在Hugging Face和ModelScope平台开源,用户还可以通过Qwen Chat直接体验这一先进模型。

相关内容

热门资讯

当MAXHUB做生态、华为做安... 中国云会议市场正在经历一场微妙的预期重构。 IDC曾预测2024年市场规模突破百亿,而终局数据定格在...
高通CEO:正研发超40款AI... 高通首席执行官克里斯蒂亚诺·阿蒙(Cristiano Amon)近日透露,公司正在研发超过40款新型...
顺德发布人工智能赋能数字政府三... 到2028年底,顺德要打造一批可复制、可推广的“AI+数字政府”场景应用。近日,顺德区政务服务和数据...
卓兆点胶获得发明专利授权:“稳... 证券之星消息,根据天眼查APP数据显示卓兆点胶(920026)新获得一项发明专利授权,专利名为“稳定...
中国生物医学工程学会用一场挑战... 穿戴设备如何精准识别本人与非本人使用?如何自动识别运动类型?如何无感监测血压变化,实现高血压疾病的提...
删了几千张照片结果内存没变 苹... 问题背后的原因,在于iPhone相册内删除的照片和视频并不会立刻被永久清除。系统会将其自动转移到一个...
华南腾飞科技分布式管理系统 在当今全球化和信息化迅速发展的背景下,企业面临着前所未有的机遇与挑战。传统的企业管理模式已经难以满足...
AI应用进入深水区,存储如何重... 6月15日,华为极简全闪数据中心2.0存储商业峰会-暨南大学附属第一医院样板点发布会在暨南大学石牌校...
腾讯内测AI视频创作工具TDr... 6月12日消息,据读佳获悉,腾讯正在内测一款名为TDream的AI视频创作工具。该产品选择了一条与市...
阿里发布具身大模型Qwen-R... 阿里巴巴正将大模型的竞争从数字世界延伸至物理世界。 6月16日,阿里巴巴发布千问具身智能大模型Qwe...