来源:@21世纪商业评论微博
撰文丨何己派
国产AI算力领域,突传大消息。
2月5日,中科曙光提供的3套万卡超集群系统在国家超算互联网核心节点同时上线试运行,成为全国首个实现3万卡部署、且实际投入运营的最大国产AI算力池。
近年来,AI算力需求井喷,推动AI基础设施的发展步入拐点。万卡级超集群,已成为前沿AI研发与应用的关键载体。
scaleX万卡超集群,不到2个月前刚亮相,如今火速部署上线,无论落地速度还是规模,都刷新了外界对国产AI算力的认知。
国产AI算力走向“实用”“好用”“易用”,新的号角,已经吹响。
多面能手,专打硬仗
先说结论:万卡超集群,已是AI算力基础设施的演进趋势。
现如今,AI成为了现实的生产力,打工人习惯了用AI做PPT、分析报表、写会议纪要,工厂用AI来优化生产策略,数字人主播们在24小时直播带货。
这背后是大模型参数跃升带来的智能革命:2018年,GPT-1只有1.17亿参数,扩大到万亿级,不过5年。
而这同时也掀起了底层算力的硬核比拼,积极构建万卡乃至十万、百万卡级超大规模集群,已成产业共识。
要达成这一目标,算、存、传、软件平台多要素的协同带来巨大挑战。
这样的背景下,中科曙光,带来了两个“超预期”。
一是超集群综合性能强悍,技术实力超预期。
scaleX万卡超集群能集成10240块AI加速卡部署,通过正交架构、浸没相变液冷等技术,单机柜算力密度较业界传统架构提升20倍,同时PUE值低至1.04,算力与节能两手抓。
该超集群在高速互连网络、存储性能优化、系统管理调度等方面实现了多项创新突破,部分技术与能力,甚至超越海外同类产品研发路线图的2027年NVL576里程节点。
二是步入规模化实战的速度超预期。
去年12月,scaleX万卡超集群在HAIC大会首次真机亮相,不到2个月后,即以超过3万AI卡的AI算力规模部署上线,速度惊人。
AI正加速渗透千行百业,AI算力的需求越来越大。
国产大规模智算集群,不能滞缓于概念演示与参数比拼,必须尽快走向“实用”“好用”“易用”,以中科曙光为代表的国产AI算力核心供应商,在钻研技术突破的同时,已阔步迈入规模化实战阶段。
分层解耦,开放协同
当前行业最关注的,是怎么让算力如同水电一样,联网、便宜、好用。这需要持续深化一体化算力网建设,强化算力资源统筹协同与动态优化。
直白点说,AI算力的竞速,从来不是比谁卡多,拼的是调度效率、运维保障和服务能力,这是套系统工程。
那么,凭什么中科曙光scaleX万卡超集群能率先抢到赛点?
很大程度上,归功于其坚定选择的开放协同路线。
现阶段,国产算力在高端AI芯片领域,与海外顶尖厂商仍存在差距,协同发展、集群式创新,可能是更实际的赶超路径。
与此同时,目前已投资建设的大量超算、智算中心,却因供需脱节、软硬件不适配、生态体系不兼容等问题,出现算力闲置现象。算力资源的配置效率,亟待提升。
曙光很早就意识到,传统的紧耦合系统,依赖单一厂商,而开放计算让每一层都有多个优秀厂商共同参与。
这相当于把全产业链的难点分层解耦,每个环节上的优秀企业,可聚焦自身优势,最终形成合力。
基于AI计算开放架构,scaleX万卡超集群能兼容CUDA等主流软件生态,支持多品牌国产AI加速卡混合部署,极大地降低了开发者的迁移门槛,加速了国产算力的规模化应用。
再如,超集群已完成400多个主流大模型、世界模型的适配优化,依托国家超算互联网,更可接入上千款应用,链接更多AI产业生态伙伴。
AI算力供给的范式,正在转移。传统的“硬件堆叠”模式,瓶颈日益显现,软件栈与生态协同,成为下半场的关键答案。
曙光通过开放架构重塑AI体系,切实响应了国家算⼒⼀体化战略,其此次推动全国最大单体国产AI算力池亮相,抛出的是⼤规模⼯程化落地能⼒的成熟⽅案,无论规模还是速度,都足以证明开放路线的高可行性。
独行快,众行远。依托开放路线的内生动能,更有机会摘得价值链高处的果实。
培育沃土,安卓时刻
不建墙的中科曙光,以技术务实的长期主义,推动打造开放架构的国家级“算力样板间”,意义深远。
国家超算互联网核心节点,是国家部委、河南省重点部署的全国一体化算力网络关键基础设施,扮演着中部算力高地与调度枢纽的重要角色。
核心节点率先上线全国产AI超集群,印证了当前国产AI算力基础设施已具备了足够的成熟度与先进性,也为后续更多国产智算基础设施的实践落地,提供了可参考的范本。
据了解,基于scaleX万卡超集群的支撑,核心节点还具备了向十万卡、百万卡规模的灵活扩展能力。
相应的,依托国家超算互联网,该超级群可接入上千款AI应用,对大批应用开发者、创业者来说,他们有望实现应⽤开发效率翻倍、算⼒使⽤成本踝斩,真正让创新加速。
另一层战略价值在于,该超级群的成功实践也将大幅提振整个产业链对构建“协同共生、兼容并蓄”生态的信心。
通过汇聚顶尖力量,产业链协同破解复杂技术难题,是推动中国AI产业可持续发展的可行路径。
以用促建,建用结合,国产算力的蓬勃生态,因地制宜、开放突围的价值路径已经显现。