智谱开源新一代旗舰模型GLM-4.7：超越GPT-5.2_科技动态

智谱开源新一代旗舰模型GLM-4.7：超越GPT-5.2

创始人

2025-12-24 04:20:22

0次

在多项主流公开基准测试中取得开源模型中的最佳表现。

据IPO早知道消息，正在冲刺“全球大模型第一股”的智谱今日发布其新一代旗舰模型GLM-4.7。新版本面向Coding场景强化了编码能力、长程任务规划与工具协同。

具体来讲，GLM-4.7在编程、推理与智能体三个维度实现突破：

更强的编程能力：显著提升了模型在多语言编码和在终端智能体中的效果；GLM-4.7现在可以在Claude Code、TRAE、Kilo Code、Cline和Roo Code等编程框架中实现“先思考、再行动”的机制，在复杂任务上有更稳定的表现。

前端审美提升：GLM-4.7在前端生成质量方面明显进步，能够生成观感更佳的网页、PPT、海报。

更强的工具调用能力：GLM-4.7提升了工具调用能力，在BrowseComp网页任务评测中获得67.5分；在τ²-Bench交互式工具调用评测中实现87.4分的开源SOTA，超过Claude Sonnet 4.5。

推理能力提升：显著提升了数学和推理能力，在HLE（"人类最后的考试"）基准测试中获得42.8%的成绩，较GLM-4.6提升41%，超过GPT-5.1。

通用能力增强：GLM-4.7对话更简洁智能且富有人情味，写作与角色扮演更具文采与沉浸感。

值得一提的是，新版本在多项主流公开基准测试中取得开源模型中的最佳表现。

在全球百万用户参与盲测的权威编码评估系统Code Arena中，GLM-4.7位列开源第一、国产第一，超过GPT-5.2。

在主流基准测试表现中，GLM-4.7的代码能力对齐Claude Sonnet 4.5：在SWE-bench-Verified获得73.8%的开源SOTA分数；在LiveCodeBench V6达到84.9%的开源SOTA分数，超过Claude Sonnet 4.5；SWE-bench Multilingual达到66.7%（提升12.9%）；Terminal Bench 2.0达到41%（提升16.5%）。

就在数天前，被誉为“中国OpenAI”的智谱披露了通过港交所聆讯后的资料集，有望成为“全球大模型第一股”。

自成立伊始就瞄向AGI的智谱，原创性提出基于自回归填空的通用预训练范式GLM并研发出中国首个预训练大模型框架。而后，智谱又陆续推出中国首个百亿模型、首个开源千亿模型、首个对话模型、首个多模态模型和全球首个设备操控智能体，打造了世界范围内最为先进而全面的模型组合及智能体（AI Agent）产品。

根据弗若斯特沙利文的报告，按2024年收入计算，智谱是中国最大的独立大模型厂商。2022年至2024年，智谱的营收分别为0.57亿元、1.25亿元和3.12亿元，复合年增长率达130%。2025年上半年，智谱的营收为1.9亿元，同比增长超300%。

成立至今，智谱已完成8轮融资，投资方涵盖美团、蚂蚁、阿里、腾讯、小米、金山、BOSS直聘、好未来等产业资本，君联资本、启明创投、红杉中国、高瓴、顺为资本、光合创投、今日资本等知名机构，以及各地方政府国资支持，累计融资规模超83亿元人民币。

本文为IPO早知道原创

作者｜Stone Jin

上一篇：潍柴动力取得压路机智能控制方法专利

下一篇：育碧正与任天堂合作为Switch2添加新VRR算法

智谱开源新一代旗舰模型GLM-4.7：超越GPT-5.2

相关内容

热门资讯