数据中心的演进就是一部市场需求驱动的发展史。
从早期的企业服务器机房,到互联网时代的兆瓦(MW)级数据中心出现,再到云计算时代超大规模(Hyperscale)数据中心的应运而生,数据中心每一次重要演进的背后都离不开市场需求的变迁。
如今,步入AI时代,AI大模型训练与推理所带来爆发性的AI算力需求,正加速开启一个前所未有的“GW级”智算中心时代。这一次并非简单的规模升级,而是数据中心为适应AI技术变革在市场需求、能源结构和资本投入模式上的结构性改变。
就像OpenAI、Google、xAI等国外巨头纷纷投入GW级智算中心建设一样,中国对于GW级智算中心的探索与建设也紧锣密鼓地展开。
近日,在2025人工智能计算大会(AICC 2025)上,GW-Scale Open AIDC工作组正式宣告成立,首批成员包括阿里云、百度、中国移动、快手、世纪互联、电子标准院、浪潮信息、广东省连接器协会、立讯技术、安澜万锦、亿纬锂能、中航光电等12家企业和机构。
此举标志着中国GW级智算中心建设的全面提速,产业界力图从产业链协同、行业标准建立、产品创新等多维度发力,以迎接AI算力需求的大爆发。
麦肯锡最新报告预测,AI将带来持续、巨量的算力消耗,2025年-2030年全球AIDC总投资将达到5.2万亿美元;其中,全球AIDC电力容量将增加125GW,到2030年AIDC的算力规模将是现在的3.5倍。
在“计算力就是生产力,智算力就是创新力”成为共识的背景下,GW级数据中心作为AI算力建设与应用最重要的载体,不仅是算力基础设施建设的具象化方向,更成为未来AI市场竞争最大的角力点。像OpenAI Stargate计划设定4年内达到10GW,Meta Hyperion计划的目标达到6GW。
所谓GW级(GM:吉瓦),即功率单位,1GW=1000MW(MW:兆瓦)=10亿瓦。GW级智算中心意味着在设备规模、算力密度、电力指标等比以往数据中心有着跨越式提升,并面临着巨量电力、制冷散热、技术复杂性、可靠性等众多工程挑战。
“AI算力对于密度与规模的偏好,正推动着数据中心从机柜、散热到供电、储能等走向全面变革。GW级智算中心的出现,标志着全球算力格局将产生重要变迁。”OCP中国社区负责人叶毓睿如是说。
与传统数据中心相比,GW级智算中心的崛起是数据中心又一次质的飞跃:
OCP中国社区负责人 叶毓睿
首先,GW级智算中心将打破过去数据中心趋于稳定的标准状态,从组件、设备到整体形态都产生显著变化,未来必定会在建设与实践过程中逐渐形成新的标准与规范。
例如,高速传输互联线缆是GW级数据中心信号传输和互联交换的重要组件,为满足未来对于传输的新要求,产业界正在开展探索高速互联传输新材料、新工艺和新标准等一系列工作。
其次,GW级智算中心将对数据中心各级供电架构、散热设计彻底重塑。IEA最新报告指出,到2030年,全球约十分之一的电力需求增长将来自数据中心;其中,AI占数据中心电力消耗将上升至35%至50%。可以说,GW级数据中心未来需要解决大规模用电、供电可靠性、用电波动性、散热冷却等一系列问题。
例如,单园区1GW的智算中心,年用电量超过70亿度,最大负荷可达100万kW,且需要投资数亿元来建设变电站,电力消耗和电力成本惊人。
第三,GW级智算中心的建设需要巨大且长期的投入,像OpenAI、Meta、阿里等国内外厂商均纷纷表示将投入巨资到AI基础设施的建设之中,必然会对未来全球算力市场的格局,以及整个智算产业供应链结构、协作模式带来深远影响。
今年以来,国内市场相继有GW级智算中心项目动工。从实际情况来看,与国外在AI大模型、AI数据中心等领域走相对封闭的路线不同,开放、开源依然是中国发展GW级智算中心和AI大模型的主路径。中国市场的优势在于拥有超大规模的使用场景,通过开源+开放的技术路径,有助于整个智算产业在GW时代获得快速成长和长远发展。
事实上,这也是GW级开放智算中心OCP中国社区小组成立的初衷。叶毓睿直言:“从数据中心的发展历程,尤其是以OCP为代表的开放计算项目的成功,证明了规模决定方向、领域决定特性。规模决定方向即数据中心规模大小,决定宏观尺度上数据中心相关技术的发展大方向;领域决定特性即数据中心相关技术从超大规模数据中心逐步推广的过程中,不同的场景和应用领域会衍生出不同的特性。进入到GW级智算中心时代,‘规模决定方向、领域决定特性’将会表现得更加突出。”
众所周知,OCP重新定义数据中心基础设施的建设方式和产业模式,并在过去多年里获得全球性的验证。
此次GW级开放智算中心OCP中国社区小组成立,即获得了中国智算产业界的积极响应,首批成员包括组件、整机、数据中心建设方、超大规模用户等产业链上下游多家企业和机构。事实上,在OCP全球组织中已经有Open Systems for AI小组,而GW级开放智算中心OCP中国社区小组会更加强调从场景驱动、超大规模应用需求和跨域协同等维度开展工作。
“先引入,后输出。”叶毓睿如是说,“OCP的Open Systems for AI很多经验和技术框架值得学习与借鉴。GW级开放智算中心OCP中国社区小组则会先立足中国市场,由中国用户来主导,聚焦AI大模型、Agentic AI、产业智能化等场景,后续则会将成果输出到国际市场。”
据悉,工作组的近期工作目标主要分为两个:第一是围绕GW级智算中心初步建立起标准体系,像框架类白皮书、高速互联、液冷组件等细分领域的标准制定等;第二则是样板工程与评测认证,面向互联网、金融等多类业务场景开展性能与能效评测,推动标准化认证体系落地。工作组远期目标则是推出MW(兆瓦)级AI整机柜参考设计方案,并且积极向OCP提交方案,推动中国方案成为全球标准。
毫无疑问,开放+开源是打破技术壁垒,实现技术创新共享与快速迭代的最佳方式,而GW级开放智算中心OCP中国社区小组的成立,未来对于我国智算产业走向全球至关重要。
其一、中国市场的优势在于产业链,当前全球算力市场已离不开中国产业链。该工作组的成立,有利于将中国的智算产业链串联起来,以开放的策略来推动产业链协同创新,在GW级智算中心建设中逐渐让中国标准成为世界标准。
“像连接器、高速线缆、冷却液等领域,中国厂商均在市场中占据重要的位置。我们希望在GW级智算中心高速发展的过程中,逐渐从点到面、由面到体,最终构建出一个产业群组,推动智算产业做大做强。”
其二、GW级智算中心未来在满足爆炸性AI算力的需求的同时,对于能源的挑战极大。因此,节约社会资源、减少重复造轮子至关重要。而工作组很大的一部分责任就是整合技术规范和标准,减少资源浪费和复用技术成果,让GW级智算中心充分释放价值。
“形成共性的技术需求框架和标准规范,然后在此之下去解决各自的挑战。工作组的目标是未来3-5年内,让中国的方案在OCP全球有话语权和影响力,让中国的标准走向全球。”
超节点的兴起并非偶然,而是AI算力需求爆发式增长的必然结果。
在AI大模型参数、集群规模持续增加的趋势下,AI应用对于极致算力密度和极致性能的不断追求,使得传统服务器遇到的“通信墙”、“功耗散热墙”和“复杂度墙”三重挑战愈发突出,超节点则以大带宽(不低于400GB/s)、低时延(交换时延低于500纳秒)和内存统一编址三大基础特征,实现多芯片协同,可以很好地满足当下AI算力使用需求。
另一方面,超节点也带来极大的复杂性,对于系统整合、标准制定带来难度。例如目前市场中一些超节点产品,高速互联线、光模块数量动辄达到几千。更加不能忽视的是,目前市场上的超节点产品已形成多元化格局,几乎每一家产品所采用的技术方向、系统设计等均存在着差异,且标准规范等工作尚无头绪。
超节点可以理解为AI整机柜,属于机柜级产品,是当下支撑AI应用的重要产品。毫无疑问,超节点未来会成为GW智算中心的重要组成部分。因此,推动超节点等机柜级产品的健康发展就成为工作组的一大重心。
目前市场中也有一些厂商开始有意识地推动超节点走向开放与产业协作。以工作组中的浪潮信息为例,其元脑SD200超节点AI服务器就采用了3D Mesh的开放架构,不仅支持单机64路AI芯片纵向扩展,具备4TB+64TB超大KV缓存空间,能同时部署多个万亿模型构建智能体协作,还支持标准开放加速模组OAM、Open Fabric超低延迟互联协议等。
“无论Google提出的XaaC理念,还是后续Meta提出的OCP项目,再到浪潮信息提出计算三步走,本质上都是围绕‘一切皆计算机’理念。超节点作为当下的市场热点,是‘一切皆计算机’理念在机柜级领域的体现。从长远来看,‘智算中心即计算机’会是大势所趋。”叶毓睿最后表示道。