Kimi K2新模型来了!多项测试超Claude、审美超前代,免费可用
创始人
2025-09-06 01:40:42
0

智东西

作者 | 程茜

编辑 | 云鹏

智东西9月5日消息,刚刚,大模型独角兽月之暗面发布Kimi K2-0905,目前,Kimi应用和网页版中的K2模型已全量升级到Kimi K2-0905。

该模型的核心升级点为Agentic Coding能力增强、支持256K上下文、API支持高达60-100Token/s的输出速度、支持Claude Code

为了测试Kimi K2-0905的性能,智东西对比了其与Kimi K2-0711在生成个人网站上的表现。

提示词:开发一个美观的个人网站,使用Bootstrap作为前端框架,直接输出相关代码。

下图左上是Kimi K2-0711生成的结果、左下是Kimi K1.5的生成结果,右侧均为Kimi K2-0905的结果。

可以看出,网站整体的美观度以及整体风格的一致性相比前代模型都有了一定提升,且包含的信息更加完善。

▲左上为Kimi K2-0711生成、左下Kimi K1.5生成、中和右为Kimi K2-0905生成

在考察真实软件工程任务的基准测试中,Kimi K2-0905多项表现超过Claude Sonnet 4,其中在用于评估大模型在软件开发任务上能力的SWE-benchVerified、评估模型在实际软件开发工程中综合能力的SWE-Dev表现略逊色于Claude Sonnet 4。

,该模型总参数10000亿,激活参数320亿。2天前,月之暗面就公开了Kimi K2-0905的一些细节,其基于基础模型构建,增强了编程能力,仍不具备思考或视觉,但保留了颇受欢迎的Kimi K2-0711模型的个性和风格。

目前,Kimi开放平台已上架kimi-k2-0905-preview模型API,且定价与上一代一致,计费方案为每百万输入tokens/4元,每百万输出tokens/16元。

月之暗面的官宣文章中提到,目前,AI编程工具Cursor、Windsurf、Trae、Cline、RooCode、Kilo Code等已内置或接入了Kimi K2模型,国内外云服务厂商均部署了Kimi K2模型。

论文地址:https://arxiv.org/abs/2507.20534

Hugging Face地址:https://huggingface.co/moonshotai/Kimi-K2-Instruct-0905

GitHub地址:https://github.com/moonshotai/kimi-K2

一、真实软件工程任务能力升级,多项测试超Claude

Kimi K2-0905具体能力提升主要有以下四点:

Agentic Coding能力提升,在公开基准测试和真实的编程任务中均展现出更好的性能;

前端编程体验升级:提升了前端代码的美观度和实用性;

扩展上下文长度:从128K升级到256K,为复杂长线任务提供更好的支持;

提供高速版API:支持高达60-100Token/s的输出速度。

在侧重考察真实软件工程任务的SWE-bench Verified等基准测试,新版Kimi K2模型的表现如下:

Kimi开放平台已上架kimi-k2-0905-preview模型API

上下文升级到256K;Token Enforcer保证toolcall 100%格式正确;完全兼容Anthropic API、支持WebSearch Tool,提供更好的K2+Claude Code使用体验;支持全自动Context Caching,有助于节省Input Token;定价与之前的0711版相同;速度达60-100 Token/s的高速版API(kimi-k2-turbo-preview)已同步升级新模型。

二、拆解需求、规划步骤、实战演练都能应对

智东西还考察了Kimi K2-0905拆解需求、规划步骤、代码落地的能力。

提示词:写一个工具,输入一段英文文本(可能包含标点、大小写、空格),输出以下统计结果:①总单词数(忽略标点,大小写视为同一单词,如Hello和hello算一个);②出现频率最高的3个单词及频次(若频次相同,按字母序排序);③文本中最长的句子(以. ! ?为句末标志,若多个最长句,输出第一个)。

这一工具拆分了统计总单词数、频率最高3个单词、最长句子的需求。

第二个是在具体的图书馆场景中,智东西要求其开发一个简易的图书馆借阅管理系统

提示词为:设计一个图书馆借阅系统的核心功能,需支持:①书籍入库(记录书籍ID、书名、作者、库存数量);②读者借阅(记录读者ID、借阅书籍ID、借阅日期,需判断书籍是否有库存);③读者还书(记录还书日期,需判断是否超期,假设借阅期限为30天,超期按1元/天计算罚款);④查询功能(按书名查询书籍库存,按读者ID查询未还书籍及是否超期)。

Kimi K2-0905生成的系统界面中,明确包含了书籍入库、读者借阅、读者还书、查询库存、查询未还书籍的模块。

值得注意的是,智能文本统计工具和图书馆借阅系统生成整体风格相似,均为蓝白配色。

结语:AI编程或应对复杂编程挑战

当下,越来越多的开发者使用AI工具更高效便捷编写代码,具体用例包括自动补全代码行、修复代码错误和测试代码等。

Kimi K2在Agentic Coding能力方面的提升,意味着其模型在面对复杂编程任务时,能够更高效、自主地理解需求、规划步骤并生成高质量代码,以应对更多真实编程场景中。

相关内容

热门资讯

西北农林科技大学用千斤自研鲜果... 又到一年毕业季,近日,西北农林科技大学园艺学院“踏长征奋进路,品园艺甜蜜果”主题毕业活动如约而至。果...
利好来了!假期首日,广东重磅发... 来源:券商中国 假期第一天,广东发布重磅文件。AI、算力、6G、卫星互联网、低空经济、证券、银行、房...
2026年郑州定制小程序开发公... 数字化转型背景下的郑州小程序开发现状 随着移动互联网的深入发展,郑州小程序开发公司在区域数字经济中...
当偏远基站遭遇供电难题,太阳能... 在广袤的农田、丘陵或偏远山区,部署的农业监测、通讯基站等设备,常常面临着一个基础却棘手的困境:电力供...
软件辅助挂!边锋老友内蒙古辅助... 软件辅助挂!边锋老友内蒙古辅助(辅助)都是真的有辅助插件(有挂透明挂)1、起透看视 边锋老友内蒙古辅...
目前!福建兄弟13水辅助(辅助... 目前!福建兄弟13水辅助(辅助)本来真的有辅助app(有挂教学)1、福建兄弟13水辅助免费辅助多个强...
据相关数据显示!闲逸碰胡辅助器... 据相关数据显示!闲逸碰胡辅助器(辅助)原来真的是有辅助软件(有挂存在)所有人都在同一条线上,像星星一...
软件辅助挂!赣牌圈挂安装图解(... 软件辅助挂!赣牌圈挂安装图解(辅助)都是是有辅助app(了解有挂)1、用户打开应用后不用登录就可以直...
第三方插件!丽水都莱大菠萝脚本... 第三方插件!丽水都莱大菠萝脚本辅助(辅助)竟然存在有辅助方法(有挂存在)1、全新机制【丽水都莱大菠萝...
为切实保障!决战十三辅助辅助器... 为切实保障!决战十三辅助辅助器(辅助)确实是有辅助挂(竟然有挂)1、游戏颠覆性的策略玩法,独创攻略技...