Kimi K2新模型来了！多项测试超Claude、审美超前代，免费可用_科技动态

Kimi K2新模型来了！多项测试超Claude、审美超前代，免费可用

创始人

2025-09-06 01:40:42

0次

智东西

作者 | 程茜

编辑 | 云鹏

智东西9月5日消息，刚刚，大模型独角兽月之暗面发布Kimi K2-0905，目前，Kimi应用和网页版中的K2模型已全量升级到Kimi K2-0905。

该模型的核心升级点为Agentic Coding能力增强、支持256K上下文、API支持高达60-100Token/s的输出速度、支持Claude Code。

为了测试Kimi K2-0905的性能，智东西对比了其与Kimi K2-0711在生成个人网站上的表现。

提示词：开发一个美观的个人网站，使用Bootstrap作为前端框架，直接输出相关代码。

下图左上是Kimi K2-0711生成的结果、左下是Kimi K1.5的生成结果，右侧均为Kimi K2-0905的结果。

可以看出，网站整体的美观度以及整体风格的一致性相比前代模型都有了一定提升，且包含的信息更加完善。

▲左上为Kimi K2-0711生成、左下Kimi K1.5生成、中和右为Kimi K2-0905生成

在考察真实软件工程任务的基准测试中，Kimi K2-0905多项表现超过Claude Sonnet 4，其中在用于评估大模型在软件开发任务上能力的SWE-benchVerified、评估模型在实际软件开发工程中综合能力的SWE-Dev表现略逊色于Claude Sonnet 4。

，该模型总参数10000亿，激活参数320亿。2天前，月之暗面就公开了Kimi K2-0905的一些细节，其基于基础模型构建，增强了编程能力，仍不具备思考或视觉，但保留了颇受欢迎的Kimi K2-0711模型的个性和风格。

目前，Kimi开放平台已上架kimi-k2-0905-preview模型API，且定价与上一代一致，计费方案为每百万输入tokens/4元，每百万输出tokens/16元。

月之暗面的官宣文章中提到，目前，AI编程工具Cursor、Windsurf、Trae、Cline、RooCode、Kilo Code等已内置或接入了Kimi K2模型，国内外云服务厂商均部署了Kimi K2模型。

论文地址：https://arxiv.org/abs/2507.20534

Hugging Face地址：https://huggingface.co/moonshotai/Kimi-K2-Instruct-0905

GitHub地址：https://github.com/moonshotai/kimi-K2

一、真实软件工程任务能力升级，多项测试超Claude

Kimi K2-0905具体能力提升主要有以下四点：

Agentic Coding能力提升，在公开基准测试和真实的编程任务中均展现出更好的性能；

前端编程体验升级：提升了前端代码的美观度和实用性；

扩展上下文长度：从128K升级到256K，为复杂长线任务提供更好的支持；

提供高速版API：支持高达60-100Token/s的输出速度。

在侧重考察真实软件工程任务的SWE-bench Verified等基准测试，新版Kimi K2模型的表现如下：

Kimi开放平台已上架kimi-k2-0905-preview模型API：

上下文升级到256K；Token Enforcer保证toolcall 100%格式正确；完全兼容Anthropic API、支持WebSearch Tool，提供更好的K2+Claude Code使用体验；支持全自动Context Caching，有助于节省Input Token；定价与之前的0711版相同；速度达60-100 Token/s的高速版API（kimi-k2-turbo-preview）已同步升级新模型。

二、拆解需求、规划步骤、实战演练都能应对

智东西还考察了Kimi K2-0905拆解需求、规划步骤、代码落地的能力。

提示词：写一个工具，输入一段英文文本（可能包含标点、大小写、空格），输出以下统计结果：①总单词数（忽略标点，大小写视为同一单词，如Hello和hello算一个）；②出现频率最高的3个单词及频次（若频次相同，按字母序排序）；③文本中最长的句子（以. ! ?为句末标志，若多个最长句，输出第一个）。

这一工具拆分了统计总单词数、频率最高3个单词、最长句子的需求。

第二个是在具体的图书馆场景中，智东西要求其开发一个简易的图书馆借阅管理系统。

提示词为：设计一个图书馆借阅系统的核心功能，需支持：①书籍入库（记录书籍ID、书名、作者、库存数量）；②读者借阅（记录读者ID、借阅书籍ID、借阅日期，需判断书籍是否有库存）；③读者还书（记录还书日期，需判断是否超期，假设借阅期限为30天，超期按1元/天计算罚款）；④查询功能（按书名查询书籍库存，按读者ID查询未还书籍及是否超期）。

Kimi K2-0905生成的系统界面中，明确包含了书籍入库、读者借阅、读者还书、查询库存、查询未还书籍的模块。

值得注意的是，智能文本统计工具和图书馆借阅系统生成整体风格相似，均为蓝白配色。

结语：AI编程或应对复杂编程挑战

当下，越来越多的开发者使用AI工具更高效便捷编写代码，具体用例包括自动补全代码行、修复代码错误和测试代码等。

Kimi K2在Agentic Coding能力方面的提升，意味着其模型在面对复杂编程任务时，能够更高效、自主地理解需求、规划步骤并生成高质量代码，以应对更多真实编程场景中。

上一篇：格力电器获得实用新型专利授权：“气调保鲜装置及冰箱”

下一篇：【省媒看金昌】金昌四年财政科技支出年均增幅超12%

Kimi K2新模型来了！多项测试超Claude、审美超前代，免费可用

相关内容

热门资讯