阿里Qwen发布320亿参数QwQ-32B大模型_科技动态

创始人

2025-03-06 12:40:31

0次

2025-03-06 09:42:19 作者：狼叫兽

3月6日，阿里Qwen团队正式对外发布了其最新的研究成果——QwQ-32B大语言模型。这款模型拥有320亿参数，在性能上能够与参数量高达6710亿的DeepSeek-R1（其中370亿参数被激活）相媲美。

尽管QwQ-32B的参数量仅为DeepSeek-R1的大约1/21，但通过强化学习技术，该模型成功实现了性能上的显著提升。此外，阿里在这款推理模型中还集成了与Agent相关的能力，使其不仅能够使用工具，还能进行批判性思考，并根据环境反馈动态调整推理过程。

QwQ-32B在多项基准测试中接受了全面评估，涉及数学推理、编程能力和通用能力等多个领域。在数学能力测试AIME24评测集中，以及用于评估代码能力的LiveCodeBench测试中，QwQ-32B的表现与DeepSeek-R1相当，并且大幅优于o1-mini和相同规模的R1蒸馏模型。

同时，在由多位知名研究者主导的多个权威评测榜单中，QwQ-32B也取得了优异成绩。例如，在被称为“最难LLMs评测榜”的LiveBench、用于评估指令遵循能力的IFEval评测集，以及针对函数或工具调用准确性测试的BFCL中，QwQ-32B的得分均超过了DeepSeek-R1。

目前，QwQ-32B已经在Hugging Face和ModelScope平台开源，用户还可以通过Qwen Chat直接体验这一先进模型。

国产超节点商业化大幕拉开记者郑晨烨在7月17日至20日举行的2026世界人工智能大会（WAIC）上，超节点成为全场焦点。...

原创 v... 能够首发搭载最新的旗舰处理器，会自带较高的热度，9月份首发第五代骁龙8至尊版的小米17系列是这样，1...

灿勤科技获得发明专利授权：“一... 证券之星消息，根据天眼查APP数据显示灿勤科技（688182）新获得一项发明专利授权，专利名为“一种...

原创怎... 今天刚看到的最新消息：高通已正式向客户发送通知函，宣布将对包括骁龙8 Elite Gen 6与骁龙8...

俄罗斯“联盟MS-28”飞船搭... 央视新闻消息，央视记者当地时间7月26日从美国方面获悉，一支由美国和俄罗斯航天员组成的联合乘组在完成...

原创用... 全球跨文化实验做过一件挺有意思的事——让不同肤色、不同国家、完全没有文化交集的人群，给同一批面孔打分...

国内首款：TP200大型多功能... IT之家 7 月 26 日消息，国内首款按适航要求正向研制的吨级多功能长航时民用无人机 —— TP2...

原创单... 最新2026年第29周国内单款手机销量排行出炉了，这次榜单前面几位是有所变化的。特别是华为畅享90...

罗永浩吐槽电视长辈模式不好用：... IT之家 7 月 26 日消息，罗永浩昨天在微博发文，控诉电视机厂商的产品经理。罗永浩表示，他最近...

SK集团会长崔泰源：Anthr... IT之家 7 月 26 日消息，据彭博社当地时间 24 日报道，SK 集团会长崔泰源近日在美国加利福...