来源:市场资讯
(来源:虎嗅APP)
出品 | 虎嗅科技组
作者 | 丸都山
编辑 | 苗正卿
头图 | 虎嗅拍摄
“过去AI产业呈现正金字塔结构,底层芯片拿走绝大部分价值,芯片上的模型拿到了不到十分之一(的价值),而模型上的应用则更少了一个数量级。”
在11月13日的百度世界2025大会上,李彦宏发出了此般感慨,并表示“这种结构既不健康,也不可持续”。
在他看来,健康的AI产业生态应该是“倒金字塔”模式,即芯片之上的模型需产生10倍于芯片的价值,基于模型开发的应用则要创造100倍的价值。
如果是其他互联网大厂说出这番话,大可看作是对当下行业格局的无奈表达,以及对未来行业发展的一厢情愿。
但百度的特殊性在于,这家公司不仅兼顾模型、应用两端,同时也是最早开始搭建AI Infra层的公司。
至少从条件上看,百度有机会推动行业发生改变。
在本届大会上,百度发布了两款全新的芯片:昆仑芯片M100与昆仑芯M800。
其中,前者针对大规模推理场景进行优化,定位于充分发挥自研架构优势,使得MOE模型的推理性能大幅提升,预计在明年年初上市。而后者则可以看作是M100的高性能版本,主要针对超大规模多模态大模型的训练和推理进行深入优化。
据百度执行副总裁、百度智能云事业群总裁沈抖透露,未来5年昆仑芯将实现“按年上新”。
鉴于百度暂未公布这两颗芯片的详细参数,因此也不好与市面上其他量产产品做对比。
不过,倒是可以重点说说昆仑芯团队在AI Infra层的另一项突破——超节点。
在大会期间,百度同步发布了“天池256超节点”与“天池512超节点”。其中,单个天池512超节点可支持万亿参数模型训练,在DeepSeek V3/R1 PD分离推理架构的优化下实现了单卡性能提升95%,单实例推理性能大幅提升高达8倍。
据悉,这两款超节点都将于明年正式上市,仔细想想这个进度着实在意料之外。
众所周知,超节点的出现是因为随着模型越来越大,以MoE为代表的主流架构带来了GB级单次通信量,传统服务器跨机互联的带宽和时延无法满足需求的情况下,厂商才想到通过高速总线等技术,去把更多的芯片放置在同一节点下。
而目前愿意做超节点的厂商大致可以分为两类:一类是英伟达这种,手里本就握着NVLink直连和C2C芯片互联技术的;另一类则是在交换机、网络拓扑、专用交换托架等领域有着深厚积累的厂商。
那么百度算是上述两类公司之一吗?都不是。
尽管昆仑芯早于2011年成立,但毕竟超节点毕竟是个很新的概念,且百度在大规模通信互联领域也鲜有深入研发。
另外,需要说明的是,超节点属于一项系统级工程,除了芯片底层能力和通信互联能力外,对于散热、电源管理及架构兼容上也有着很高的要求。
而从目前公开信息来看,百度于今年4月发布了同样基于P800计算卡打造的“64卡超节点”,尽管这个产品充满着技术验证的色彩,但结合今天公布的“天池256超节点”和“天池512超节点”来看,至少可以推论出两个事实:
首先,P800的底层能力一定没有问题。虽然不大可能像之前网传的那样对标英伟达H800,但能用在512卡规模的超节点上,至少说明它的自研内核不局限于常用的Tensor计算,具备优秀的标量、矢量通用计算能力,可处理多样化AI负载。
其次,昆仑芯P800上集成的昆仑芯XCLL互联技术、以及其另类的XPU-P“通算融合”架构同样也得到了验证,要不然百度大可等M100系列芯片成熟后,再去开发512卡这个级别的超节点。
关于李彦宏的“正金字塔”理论,就差直接在现场点出英伟达的名字了,但这套理论也是个不争的事实。
根据摩根士丹利的测算,2025年生成式AI产业的总收入约为1530亿美元,统计范围包含产业直接收益和关联领域收益,而英伟达一家公司在2025财年的营收就高达1305亿美元。
这还只是营收上的对比,考虑到目前行业内大部分AI应用公司都在亏损,李彦宏提到的“应用层获得的价值比芯片层少两个数量级”,绝不夸张。
那么这样的行业生态会得到扭转吗?
目前来看,虽然“正金字塔”结构仍然存在,但价值流向已经悄然发生变化。
百度的就算是个比较典型的例子。根据这家公司在二季度的财报,虽然广告业务的疲软导致整体营收略微下滑,但由AI云业务驱动的非在线营销收入首次突破百亿大关,达到34%的增长。
与此同时,百度也在积极推动搜索业务的全面AI化进程。
在百度世界2025大会的开幕演讲中,李彦宏表示,目前百度搜索绝大部分的搜索结果由AI生成,而首条结果的富媒体覆盖率已达70%。
“你现在搜索10个问题,7个答案都是富媒体的,不是一条条的文字链接,而是一个图片、一个视频、一个直播,甚至是一个数字人。”
这种比较激进的AI化改造,意味着百度有望长期守住搜索这一基本盘,同时代理生成广告、数字人广告等相关收入增长。
此外,考虑百度的AI布局覆盖AI Infra、模型、应用等各个环节。搜索的AI化改造也能为大模型提供海量数据,反推其在理解和生成能力上的优化;昆仑芯作为底层算力支撑,也能在大规模富媒体内容生成的过程中,不断验证和提升芯片的算力适配性与能效比。
总的来说,“正金字塔”结构的AI产业生态虽然已成客观事实,但绝不会长期持续下去,而那些能够覆盖AI全链条、能发挥AI全栈技术协同的公司,大概率会率先撕开一道裂缝。