Kimi K2新模型来了!多项测试超Claude、审美超前代,免费可用
创始人
2025-09-06 01:40:42
0

智东西

作者 | 程茜

编辑 | 云鹏

智东西9月5日消息,刚刚,大模型独角兽月之暗面发布Kimi K2-0905,目前,Kimi应用和网页版中的K2模型已全量升级到Kimi K2-0905。

该模型的核心升级点为Agentic Coding能力增强、支持256K上下文、API支持高达60-100Token/s的输出速度、支持Claude Code

为了测试Kimi K2-0905的性能,智东西对比了其与Kimi K2-0711在生成个人网站上的表现。

提示词:开发一个美观的个人网站,使用Bootstrap作为前端框架,直接输出相关代码。

下图左上是Kimi K2-0711生成的结果、左下是Kimi K1.5的生成结果,右侧均为Kimi K2-0905的结果。

可以看出,网站整体的美观度以及整体风格的一致性相比前代模型都有了一定提升,且包含的信息更加完善。

▲左上为Kimi K2-0711生成、左下Kimi K1.5生成、中和右为Kimi K2-0905生成

在考察真实软件工程任务的基准测试中,Kimi K2-0905多项表现超过Claude Sonnet 4,其中在用于评估大模型在软件开发任务上能力的SWE-benchVerified、评估模型在实际软件开发工程中综合能力的SWE-Dev表现略逊色于Claude Sonnet 4。

,该模型总参数10000亿,激活参数320亿。2天前,月之暗面就公开了Kimi K2-0905的一些细节,其基于基础模型构建,增强了编程能力,仍不具备思考或视觉,但保留了颇受欢迎的Kimi K2-0711模型的个性和风格。

目前,Kimi开放平台已上架kimi-k2-0905-preview模型API,且定价与上一代一致,计费方案为每百万输入tokens/4元,每百万输出tokens/16元。

月之暗面的官宣文章中提到,目前,AI编程工具Cursor、Windsurf、Trae、Cline、RooCode、Kilo Code等已内置或接入了Kimi K2模型,国内外云服务厂商均部署了Kimi K2模型。

论文地址:https://arxiv.org/abs/2507.20534

Hugging Face地址:https://huggingface.co/moonshotai/Kimi-K2-Instruct-0905

GitHub地址:https://github.com/moonshotai/kimi-K2

一、真实软件工程任务能力升级,多项测试超Claude

Kimi K2-0905具体能力提升主要有以下四点:

Agentic Coding能力提升,在公开基准测试和真实的编程任务中均展现出更好的性能;

前端编程体验升级:提升了前端代码的美观度和实用性;

扩展上下文长度:从128K升级到256K,为复杂长线任务提供更好的支持;

提供高速版API:支持高达60-100Token/s的输出速度。

在侧重考察真实软件工程任务的SWE-bench Verified等基准测试,新版Kimi K2模型的表现如下:

Kimi开放平台已上架kimi-k2-0905-preview模型API

上下文升级到256K;Token Enforcer保证toolcall 100%格式正确;完全兼容Anthropic API、支持WebSearch Tool,提供更好的K2+Claude Code使用体验;支持全自动Context Caching,有助于节省Input Token;定价与之前的0711版相同;速度达60-100 Token/s的高速版API(kimi-k2-turbo-preview)已同步升级新模型。

二、拆解需求、规划步骤、实战演练都能应对

智东西还考察了Kimi K2-0905拆解需求、规划步骤、代码落地的能力。

提示词:写一个工具,输入一段英文文本(可能包含标点、大小写、空格),输出以下统计结果:①总单词数(忽略标点,大小写视为同一单词,如Hello和hello算一个);②出现频率最高的3个单词及频次(若频次相同,按字母序排序);③文本中最长的句子(以. ! ?为句末标志,若多个最长句,输出第一个)。

这一工具拆分了统计总单词数、频率最高3个单词、最长句子的需求。

第二个是在具体的图书馆场景中,智东西要求其开发一个简易的图书馆借阅管理系统

提示词为:设计一个图书馆借阅系统的核心功能,需支持:①书籍入库(记录书籍ID、书名、作者、库存数量);②读者借阅(记录读者ID、借阅书籍ID、借阅日期,需判断书籍是否有库存);③读者还书(记录还书日期,需判断是否超期,假设借阅期限为30天,超期按1元/天计算罚款);④查询功能(按书名查询书籍库存,按读者ID查询未还书籍及是否超期)。

Kimi K2-0905生成的系统界面中,明确包含了书籍入库、读者借阅、读者还书、查询库存、查询未还书籍的模块。

值得注意的是,智能文本统计工具和图书馆借阅系统生成整体风格相似,均为蓝白配色。

结语:AI编程或应对复杂编程挑战

当下,越来越多的开发者使用AI工具更高效便捷编写代码,具体用例包括自动补全代码行、修复代码错误和测试代码等。

Kimi K2在Agentic Coding能力方面的提升,意味着其模型在面对复杂编程任务时,能够更高效、自主地理解需求、规划步骤并生成高质量代码,以应对更多真实编程场景中。

相关内容

热门资讯

AI能力官方认可!合思入选超算... 近日,国家超算互联网平台正式发布《人工智能生态产业图谱》,合思凭借其在财务数智化领域的创新实践与领先...
探馆短视频:在这里感受新技术的...   简介:2025全球工业互联网大会9月5日到8日在辽宁省沈阳市举行。本次大会以“数启新章 智造新质...
【省媒看金昌】金昌四年财政科技... △全国有色金属行业智能制造暨数字化转型推进会上,专家学者正在倾听甘肃金宏翔新能源有限公司负责人的讲解...
Kimi K2新模型来了!多项... 智东西 作者 | 程茜 编辑 | 云鹏 智东西9月5日消息,刚刚,大模型独角兽月之暗面发布Kimi ...
格力电器获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项实用新型专利授权,专利名为“...
瑞士政府发布自研大语言模型Sw... 瑞士联邦政府正式发布了其自主研发的人工智能模型SwiGPT,这是一个基于公共数据训练的大语言模型。该...
6G标准化研究正式起航:全球科... 国际通信标准组织3GPP近期在印度班加罗尔召开了首次6G无线接入网(RAN)工作组会议,标志着6G技...
纽约联储调查:人工智能应用加速... 转自:财联社 纽约联储调查周四发布的一项研究显示,尽管过去一年人工智能(AI)在企业中的普及率显著增...
原创 手... 在如今这个科技飞速发展的时代,手机迭代的速度如同闪电一般,各大厂商你方唱罢我登场,新机型层出不穷。消...
海尔智家获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示海尔智家(600690)新获得一项实用新型专利授权,专利名为“...