梁文锋向左,杨植麟向右
创始人
2026-06-13 19:07:28
0

出品|虎嗅科技组

作者|宋思杭

编辑|苗正卿

头图|视觉中国

月之暗面(以下简称“Kimi”)和DeepSeek,已然成为2026年大模型圈内最受关注的两家公司。与此同时,两家公司也越来越相似。

首先是融资。过去半年里,Kimi连续完成多轮融资,估值快速上涨。而另一边,此前一直被视为不差钱的DeepSeek,也终于启动了融资。放在两年前,这其实是一件很难想象的事情。

当时的大模型行业里,两家公司代表着两种不同的发展路径。

Kimi是明星创业公司,融资频繁,持续扩张;DeepSeek则显得有些特殊。梁文锋很少出现在融资新闻里,外界对于DeepSeek最大的印象,也始终是技术。

但到了今年,一个越来越明显的变化是,两家公司开始同时出现在资本市场的牌桌上。

其次是技术路线。过去很长一段时间里,外界总喜欢把两家公司放在一起比较,但实际上,它们做的事情并不完全一样。

Kimi一直更靠近产品。从长文本、搜索,到后来的Agent、Coding,月之暗面始终试图把模型能力变成产品。

而DeepSeek则更像一家研究机构。无论是V2、R1还是V3,行业讨论最多的始终是模型能力本身。但从今年的V4开始,在技术路线上,DeepSeek也将焦点放在了长文本、Coding和Agen上。

这两家公司的边界正在变得模糊。

Kimi开始越来越重视底层模型能力;而DeepSeek也开始越来越关注推理效率、工程体系以及大规模部署问题。甚至连招聘方向都开始出现重叠。

虎嗅注意到,近期Kimi和DeepSeek都在持续招聘Harness相关岗位。对于大模型公司而言,Harness并不是模型本身,而是模型背后的基础设施。训练、推理、调度、资源管理,都需要依赖这一套系统。

换句话说,当两家公司同时开始扩招Harness团队时,说明他们关注的已经不只是模型能力,而是模型如何被更快地训练出来、更稳定地运行,以及更低成本地被使用。

而除了上述所提到的融资、技术路线,创始人的管理风格也有一些相似之处。

杨植麟和梁文锋都属于典型的技术创始人,他们都不喜欢站到聚光灯下,也很少主动讲故事。相比市场、营销或者融资,他们更愿意讨论模型、算法和技术本身。

过去几年里,“技术理想主义”几乎成为外界贴在两家公司身上最统一的标签。

但融资之后,两家公司可能又会走向新的分岔。

DeepSeek的钱,准备花在哪?

对于DeepSeek来说,今年最大的变化是融资。过去很长一段时间里,外界对DeepSeek的印象都是“不缺钱”。

梁文锋背后的幻方量化,本身就拥有持续投入AI研发的能力。相比很多需要不断融资才能维持训练节奏的大模型公司,DeepSeek一直显得有些特殊。

这也是为什么,当融资消息传出时,比起融资金额和估值、融资方外,大家最关注的还是,DeepSeek为什么突然开始融资了?

目前来看,人才或许是其中一个原因。

过去一年,大模型行业最激烈的竞争,已经从模型能力逐渐转向人才竞争。

无论是OpenAI、Meta还是国内头部模型公司,都在持续争夺顶级研究员和工程人才。而对于DeepSeek来说,融资无疑能够提供更充足的激励工具,帮助其留住核心团队。

但如果仅仅是为了留住人才,或许还不足以解释DeepSeek最近的一系列动作。

近期,虎嗅注意到,DeepSeek正在招聘“数据中心高级交付经理”的岗位。从岗位职责来看,其负责内容包括数据中心项目从立项、建设、交付到运营的全流程管理,同时还需要参与IDC自动化运维平台建设、资源管理以及运维标准体系建设。

更值得关注的是,在任职要求中,DeepSeek特别提到了GPU算力相关交付运维经验,以及大型集群规划建设经验。

对于普通互联网公司来说,这或许只是一个基础设施岗位。但对于一家大模型公司而言,这背后对应的其实是另一套能力体系。

过去两年,行业讨论最多的是模型能力。R1、V3、V4,每一次模型发布都会引发外界关注。但随着模型规模不断扩大,以及Agent带来的Token消耗持续增长,模型公司面临的问题已经不仅仅是如何把模型训练出来。

越来越多的问题开始出现在模型之外。例如,如何管理越来越庞大的GPU集群;如何提升算力资源利用率;如何保证训练和推理任务稳定运行;以及如何支撑下一代模型训练所需要的基础设施规模。

而这些,恰恰是数据中心团队所要解决的问题。与此同时,DeepSeek也在持续扩张Harness团队。

对于很多模型公司而言,Harness更接近训练和推理基础设施平台。它并不直接参与模型研发,但负责让模型训练、推理以及资源调度能够更加高效地运行。

从这个角度来看,DeepSeek当下的关注点已经不仅仅聚焦在模型能力上,还有基础设施能力,因为它决定着模型能达到的上限。

这或许也是DeepSeek融资之后,最值得关注的变化之一。

一个流向用户,一个流向GPU

2026年对Kimi来说是至关重要的一年,这一点从其半年融资三次,估值涨了5倍,就可以看出。

今年年初,OpenClaw带来了惊人的收入增长。这让月之暗面第一次真正看到了商业化的希望。

与此同时,从Kimi今年发布的几款模型变化中也可以发现,模型技术开始越来越明显地为产品服务。

无论是Agent、Coding还是海外市场,月之暗面都在试图证明,模型能力最终能够转化为收入和增长。

所以,对于Kimi来说,既要继续摸高模型的能力,又要加速投身商业化。而对于DeepSeek来说,其关注点和Kimi并不相同。

虽然两家公司都在融资,也都在扩张团队,但它们要解决的问题完全不同。

对于Kimi来说,市场关心技术,但更关心的是由技术和产品带来的增长,以及Agent能否带来新的付费场景?海外市场能否复制国内的成功经验?这些问题最终都会回到商业化本身。

但DeepSeek面临的压力并不在这里。从成立至今,DeepSeek最大的竞争力始终来自模型能力。无论是V2时期的低成本训练,还是R1带来的推理模型热潮,其核心优势都建立在技术领先之上。

因此,对于DeepSeek而言,最重要的问题并不是如何找到更多用户,而是如何持续保持领先。

这也是为什么,在融资之后,外界看到的并不是大规模产品扩张,而是Harness团队扩张、数据中心岗位出现,以及更多围绕基础设施建设的动作。

因为对于DeepSeek来说,模型能力本身仍然是最重要的资产。

相比为某一个产品功能做针对性优化,DeepSeek更需要保证的是,下一代模型能够继续迭代,下一次技术突破仍然发生在自己身上。

某种程度上,这也是两家公司最根本的区别,因为背靠量化的DeepSeek本质上不是一家创业公司。Kimi需要向市场证明好的模型能够赚钱。DeepSeek则需要向市场证明模型能够继续领先。前者的资金最终会流向技术、产品、用户和收入。后者的资金则会流向算力、集群和基础设施。

而这也决定了,同样是一笔融资,两家公司最终会走向完全不同的方向。

相关内容

热门资讯

科普进校园 燃动科学热 为深化馆校科普融合,丰富校园科技文化内涵,扎实推进校园科技活动周开展,近日,市科技馆走进多所中小学、...
中移申请机器人控制方法专利,可... 国家知识产权局信息显示,中移(杭州)信息技术有限公司;中国移动通信集团有限公司申请一项名为“机器人控...
固态电池惊天骗局曝光,卷走13... 来源:环球零碳 Donut lab 撰文 | Shushu 编辑 | 小澜 →这是《环球零碳》的2...
直击徐汇AI路演现场:专家点评... 来源:滚动播报 (来源:上观新闻) 6月12日,“AI赋能——人工智能产业创新与知识产权保护同行”主...
解锁脑洞涂鸦!市科技馆开展绘画... 6月13日,固原市科技馆开展涂鸦机器人科普活动。活动现场,科技辅导员首先为青少年们科普了涂鸦机器人的...
英诺赛科取得一种功率器件专利,... 国家知识产权局信息显示,英诺赛科(苏州)半导体有限公司取得一项名为“一种功率器件”的专利,授权公告号...
Arch Linux AUR遭... IT之家 6 月 13 日消息,据 The Hacker News 昨天报道,Arch Linux ...
上交会智慧口岸展区串起产业链,... 第十二届中国(上海)国际技术进出口交易会正在上海举行,上海智慧口岸与全球供应链数字化服务生态专属展区...
青春华章·“两弹一星”铸丰碑丨... 青海日报融媒体记者 杨燕玲 位于青海海北藏族自治州海晏县西海镇的爆轰试验场有一面浮雕墙,墙上定格了十...
梁文锋向左,杨植麟向右 出品|虎嗅科技组 作者|宋思杭 编辑|苗正卿 头图|视觉中国 月之暗面(以下简称“Kimi”)和De...