当地时间2月25日,The Information报道,Meta正在商讨建立一个新的数据中心园区,用于其人工智能业务。按照该园区所需的芯片数量和电力需求,该项目可能超过2000亿美元,远远超过Meta迄今为止的任何数据中心,并可能成为同类项目中规模最大的一个。
而就在几日之前,同为美国科技巨头的微软公司却被爆出已经取消了部分数据中心容量的租约。美国券商TD Cowen渠道检查显示微软因潜在供应过剩而取消美国数据中心容量租赁。
同样是美国科技巨头,微软与Meta对于未来算力市场的预期为何截然不同?
反向而行
据悉,Meta高管已通知数据中心开发商,该公司正在考虑在路易斯安那州、怀俄明州或得克萨斯州等州建设园区,Meta高级领导人本月已访问了潜在的地点。有知情人士称,根据芯片的数量和该公司正在讨论的园区用电量,其投入成本可能超过2000亿美元。
报道称,Meta高层认为,该数据中心最终可能需要5-7GW(千兆瓦)的电力供应。不过,据媒体计算,Meta可能需要五年以上的时间才能为拟建园区达到足够电力供应量。
目前尚不清楚 Meta 是会自己建设这些设施,还是会与外部开发商合作,或者与 Oracle 或 CoreWeave 这样的云计算提供商合作,后者将协助建设和运营。Meta 既使用自己的数据中心,也从亚马逊网络服务和 Oracle 等云提供商那里租用 AI 服务器。
而微软正反向而行,TD Cowen援引其供应链检查结果称,微软已经取消了与至少两家私营数据中心运营商签订的总计"几百兆瓦"的容量租赁合约。
有分析师评论称,其渠道检查表明,微软在数据中心方面做了以下调整:1) 已取消了与至少两家私人数据中心运营商在美国签订的总计“几百兆瓦”的租赁合同;2) 撤回了将资格声明(SOQ)转换为租约的计划;3)已将其国际支出的很大一部分重新分配给美国。
虽然同是美国科技巨头,但Meta与微软在业务方面的布局却截然不同。
微软方面,从业务构成上看,智能云部门是当下微软的核心业务,据统计,2024年,微软智能云业务占微软总销售额43%。而智能云部门是以Azure云服务为核心,涵盖GitHub开发者平台、企业级云解决方案及人工智能服务(如与OpenAI合作的AI模型部署)等。
可以说,微软当下的主要业务是面向ToB企业端,提供云服务,以及时下最火的大模型应用服务为主。而年初DeepSeek-R1的问世,以及开源,让算力成本大幅下降,这也将深入的影响企业侧算力需求,以及算力价格。
当DeepSeek等开源模型降低技术门槛后,微软更需要通过弹性算力供给(而非固定容量)来吸引客户。取消固定租赁转向灵活采购,既能规避过度投资风险,又能利用现有超大规模集群维持服务能力。
主营私人财富管理的美国伯恩斯坦公司分析师马克·默尔德曾对媒体表示,微软退租数据中心可能表明需求减少,同样反映微软在过去数年间堆积的算力可能超出需求。
不过,微软紧急在2月24日回应了此次退租的传闻,微软发言人表示,微软可能就某些领域的基础设施进行“战略性加快建设或调整”,但公司不会更改2025财政年度内在算力领域投入超过800亿美元的计划。(微软今年初宣布上述800亿美元投资计划,用于建设数据中心,以训练人工智能(AI)模型并加持人工智能应用。)
与微软不同的是,Meta的业务构成主要有两大部分,一个是应用程序组成的传播矩阵;另一个是长远战略投资的元宇宙。从两者的业务逻辑上来看,两者大范围覆盖了ToC领域,尤其是其社交矩阵(Facebook/Instagram/WhatsApp)每天产生超过50亿条内容,需要实时处理用户生成内容(UGC)的合规审查、个性化推荐等场景。
随着C端消费者对AI的热情增加,也间接带动了Meta对算力的需求,自建数据中心能更好地整合AI芯片(如自研MTIA系列)与软件栈,实现端到端优化。
更重要的是,元宇宙业务涉及大量3D渲染和空间计算,这类负载对网络时延和带宽有严苛要求,必须通过地理邻近的数据中心支撑,租赁模式难以满足定制化需求。
与微软、谷歌和亚马逊一样,Meta 已概述了今年大幅增加资本支出的计划,主要用于 AI 开发。Meta 表示,其资本支出将增加到 600 亿至 650 亿美元之间,较去年增长近 70%。目前尚不清楚对新项目的支出是否会发生在今年。
算力是过剩,还是紧缺?
一方面是微软退租数据中心,一方面是Meta投建新数据中心,AI带来的算力影响到底是过剩,还是紧缺?
从Meta角度出发,Meta重金押注元宇宙,势必带来了更多的算力需求,而Meta对下一代沉浸式互联网的投资是激进的,其试图通过规模壁垒建立新时代的社交霸权。
另一方面,也有分析认为,Meta正在为其人工智能聊天机器人的数十亿用户带来的生成式AI需求激增做准备。同时,这也显示出扎克伯格可能会竭尽全力与OpenAI保持竞争——OpenAI已经与软银展开合资,计划在四年内投资5000亿美元用于建设新的AI数据中心。
而Meta的投建或许也是为了尽快追赶上多位竞争对手,此前,LessWrong网站统计了世界五大科技公司的2024年拥有的算力以及2025年的预测,其中,数据显示Meta有55万-65万块等效H100,明年(2025年)预计达到190万-250万,这一数据落后于微软的75万-90万块等效H100,明年(2025年)预计达到250万-310万,以及谷歌的100万-150万块等效H100,明年(2025年)预计达到350万-420万。综上,对于Meta来说,当前的算力是远远不足的。
微软处境却与Meta截然不同,一方面,微软与OpenAI之间的关系出现了裂痕。据The Information消息,预计到2030年,OpenAI数据中心75%的容量都将来自“星际之门(Stargate)”项目,这也意味着,OpenAI将渐渐不再依靠微软这个大股东和主要算力来源。
“星际之门”项目,项目规模5000亿美元,出资者便包括OpenAI、软银、甲骨文和阿联酋投资者MGX。
此后,OpenAI与软银绑定程度进一步加深——双方先是宣布成立一家名为“SB OpenAI Japan”的合资公司,向日本的公司推销高级企业人工智能“Cristal intelligence”;之后本月初又有消息称,软银即将敲定对OpenAI 400亿美元的投资,前者将在未来12到24个月内支付这笔资金,第一笔付款最早将于今年春季到位。
OpenAI与软银之间千丝万缕的关系,也预示着OpenAI将转投软银的怀抱。而之前作为OpenAI最大算力支持的微软,显然将逐渐在算力支持层面“退出”。
不久前微软宣布,改变与OpenAI的合作关系,微软将不再担任OpenAI的独家算力云供应商。根据新的修订协议,微软将保留向OpenAI提供云资源的优先权,但如果微软无法满足其需求,OpenAI可以选择转向其他云厂商。
据知情人士爆料,此前,微软与OpenAI就围绕微软在营利实体中的股权;微软是否会继续担任 OpenAI 的独家云服务提供商;微软在多长时间内可以随意在其产品中使用 OpenAI 的知识产权;以及微软是否会继续从 OpenAI 的收入中抽取 20%等四个领域展开过谈判。
与OpenAI的“渐行渐远”是影响微软算力基础设施布局的关键因素之一,另一方面,预训练边际效益递减,推理市场的兴起也是一个关键因素。OpenAI创始人Altman和微软CEO纳德拉均表示,未来领先优势将更加狭窄,单纯依靠参数扩张建立壁垒的“预训练时代”已走向终结。
此前,有行业专家认为,未来,用于预训练的巨型数据中心只需2-3个,预训练和推理的计算资源分配将变为5/95(预训练占5%,推理占95%)。预训练算力将集中在少数超大规模集群(10万卡级),而推理算力则以分布式、低成本架构为主,地理就近部署与能效比成为关键。(本文首发于钛媒体APP,作者|张申宇,编辑丨盖虹达,作者杨丽对本文亦有贡献)