当复兴号动车组以350公里的时速穿梭于华夏大地,一张覆盖全域的高铁网络,早已成为中国力量的鲜明注脚。
如今,一场更为深刻的变革正在数字领域中激荡,人工智能的浪潮席卷千行百业,数据成为新时代的“石油”,一个新的命题已然浮现:在数字经济与行业智能化的宏大叙事中,能否搭建起一张同样强大、高效、普惠的全国一体化算力网?
答案指向了,中国版图上一个同样承载着枢纽使命的城市:郑州。这是中国铁路网络核心节点,而今,历史的聚光灯再次在此点亮。
2月5日,国家超算互联网核心节点正式在郑州上线试运行,这个配备了强大国产万卡超集群的算力新枢纽,可为万亿参数模型训练、高通量推理、AI for Science等大规模计算场景,提供坚实、安全、普惠的算力基座。
一场“国家算力枢纽”的升维之旅,正徐徐拉开序幕……
回望中国高铁的崛起,那是一场从跟跑到领跑、从引进到引领的突围之路。最终,在无数次的技术迭代与突破中,最终织就了全球规模最大的高速铁路网络。
今天,人工智能的浪潮正以燎原之势重塑一切,每一个行业都面临着智能化转型的必然课题。而算力就如同当年的高铁一样,成为支撑国家发展的关键基础设施,建设一张像高铁网络一样高效通达的“全国一体化算力网”,将是支撑千行百业数字化转型,推动数字经济高质量发展的应有之义。
《十五五规划建议》中明确提出,要构建现代化基础设施体系,适度超前建设新型基础设施,推进信息通信网络、全国一体化算力网、重大科技基础设施等建设和集约高效利用。这显然为算力产业的发展提供了政策支撑。
但不容忽视的是,当前中国算力产业仍面临着一些突出的矛盾:一边是市场对算力的迫切需求,尤其是中小企业和科研机构,常常陷入算力不足的困境;另一边是国家已投资建设的大量超算中心,却存在算力闲置的情况,部分超算中心利用率甚至不足50%。
究其根本,是算力基础设施与应用端脱节,先进的算力没有走进行业纵深,同时算力产业从芯片、软件到服务,也尚未形成国产化生态闭环。
比如在硬件层面,国产算力芯片得性能释放高度依赖与基础软件、框架、应用的全栈优化,而当前产业各环节协同不足,导致硬件算力难以高效转化;而在软件层面,不同算力中心往往采用异构的技术架构和标准,应用移植和开发门槛高,致使算力资源难以跨平台调度与共享;同时,面向特定行业的成熟解决方案和服务缺失,使得企业即使获得算力,也面临开发周期长、部署复杂等现实难题。
而加快建设全国一体化算力网,正是破解这一矛盾的关键,既要让充沛的算力“流”到最需要的地方,又要让建好的算力中心“活”起来。这需要一场涉及技术标准、调度机制、商业模式、生态培育的系统工程。
在此背景下,国家超算互联网核心节点的启动,能否为我们趟出一条可行的路径,解答这个时代的算力之问?
超算互联网,是致力于实现全国计算资源统筹与调度的综合算力服务平台,就像是一条连接算力供给与需求的“算力高速铁路”。
而核心节点,位于中国地理的中原地带,亦是“东数西算”工程八大枢纽节点的地理中心,天然具备承东启西、连南贯北的区位优势。2023年10月,在国家部委、河南省、郑州市和中科曙光等多方支持下,国家超算互联网核心节点在郑州正式启动建设,并于2026年2月从蓝图变为现实。
据了解,核心节点采用的曙光scaleX万卡超集群基于AI计算开放架构,可全面兼容CUDA等主流软件生态,支持多品牌国产加速卡混合部署,具备向十万卡、百万卡规模的灵活扩展,目前已完成400多个主流大模型、世界模型的适配优化。依托国家超算互联网实现一体化算力调度,更可接入上千款应用,从而可为全球用户提供好用易用的中国AI算力。
事实上,核心节点作为推动全国一体化算力网建设,助力算力强国战略的重要支撑,承载着多重价值。
首先,从区域协同发展角度。核心节点作为中部核心枢纽,巧妙承担起承接东部旺盛算力需求外溢、联动西部绿色能源算力的战略角色,可以形成“东部崛起、中部赋能、全国共赢”的开放算力生态格。
进一步看,核心节点的建成,使国家超算互联网的骨干网架形态更加清晰和完整,并为未来在全国范围内实现算力资源的统筹调度、跨域流动和产业协同赋能,奠定了坚实基础。全国一体化算力网,也有机会以此为支点,引领中国算力产业进入一个以应用驱动发展的战略周期。
其次,从中国算力产业发展角度。超算互联网代表的,是一条“基建先行+生态开源+全场景适配”的中国式算力发展路径,不同于美国“芯片堆砌+闭源垄断”的封闭路线,是具有中国特色的算力发展模式。
超算互联网作为这一模式的核心载体,能够通过平台化模式,带动国产芯片、国产软件产业的发展,通过聚集百万级用户流量,反馈应用需求,反哺技术创新,形成“应用促研发、研发强应用”的良性循环,为突破关键技术“卡脖子”问题提供强大的内生动力。
最后,从算力普惠角度。超算互联网的本质目的,是解决算力应用的“最后一公里”,让算力真正像水和电一样,实现“一点接入、即取即用”。郑州节点作为超级入口之一,将极大助推制造业、人工智能、数字文创等千行百业降低算力使用门槛,加速数智转型。
如果说高铁网络的价值在于缩短时空距离,便利人民出行,那么超算互联网的核心价值,就在于打破算力壁垒,提供普惠的算力服务。两者的联接属性相似,带来的社会意义同样非凡。
超算互联网,通过构建统一的算力调度平台,将全国分散的超算中心、智算中心连接起来,实现算力资源的统筹调度,让闲置的算力资源得到高效利用,同时,通过标准化的服务体系,降低算力接入门槛,让中小企业和科研机构能够以更低的成本和更便捷的方式获取所需算力,真正实现“算力普惠”。
但要真正实现这一目标,还需要国产化算力创新在背后的支撑。目前,该核心节点依托中科曙光scaleX万卡超集群系统,最大可对外提供超3万卡国产AI算力,是国家超算互联网平台自2024年4月开通以来接入的全国最大单体国产AI算力资源池。
这一国产集群的落地,正是国产算力技术突破的重要成果,其应用价值体现在三个维度:第一,效率翻倍,万卡级并发能力可将大模型训练时间从月级缩短至天甚至小时级,极大加速研发周期;第二,成本降低,规模化、集约化的运营与智能调度,能有效摊薄单位算力成本,让更多中小主体用得起尖端算力;第三,创新加速,稳定、强大的算力底座,使得科研人员和企业能够敢于尝试更复杂的模型架构、更大规模的数据训练,从而催生原创性的产业应用。
当然,在生态层面,超算互联网也在构建一个蓬勃的开发者与用户生态。据了解,平台已服务100多万用户,单日处理作业峰值突破103万个,月均访问量突破1130万次,应用商城商品超7300个,AI社区开源大模型超1100个,支持百万级用户稳定并发。
客观地说,这种海量的真实应用,构成了检验和优化国产算力系统环境的“试炼场”,在解决一个个实际应用问题的过程中,国产芯片的兼容性,系统软件的稳定性,工具链的易用性得以持续打磨和提升。这本质上也是突破封闭技术体系,培育自主算力生态的破局之道。
而国家超算互联网率先上线全国产AI超集群,不仅印证了当前的国产AI算力基础设施已跻身国际领先行列,更体现出超算互联网推动国产算力应用生态发展的责任担当。
总体来看,超算互联网实则代表了一种中国式算力发展的新逻辑。它着眼于构建一个开放、协同、普惠的全国性算力基础设施与服务平台,并以开放生态孕育行业创新,最终探索出一条中国特色的算力发展道路。它也将筑牢我国数字经济发展的“算力长城”,有望续写高铁的神话,成为新数字时代的中国力量。