来源:IT时报
沐曦、天数智芯、燧原、壁仞“一把手”对话
作者/ IT时报记者 孙妍
编辑/ 郝俊慧
全球科技巨头正以惊人的速度迭代模型,模型训练迭代时间已不足3个月。回顾2025年上半年,全球每周几乎都有模型发布或更新,DeepSeek横空出世后,国外巨头更无法“躺平”。
最近,马斯克xAI发布的Grok4直接冲榜至世界第一,事实上马斯克在AI上的积累并不深厚,其团队规模也不大,他凭什么又创造了一个“地表最强模型”?秘诀之一是20万张GPU卡,从一定程度上来说,用算力推动智力的“尺度定律”仍然奏效,算力仍是卡脖子的核心竞争力。
“国产芯片半壁江山都来啦!”
2025世界人工智能大会(简称“WAIC2025”)开幕前夜,四位国产芯片大佬首度同台,沐曦创始人、董事长兼总经理陈维良,天数智芯董事长兼CEO盖鲁江,燧原科技创始人、董事长兼CEO赵立东和壁仞科技创始人、董事长兼CEO张文首度同台,围绕“大模型与芯片的协同与应用落地”进行了一场对话。
当前,大模型正在迈向推理时代,国产AI算力正在进入国际竞争深水区,模型国产大模型与国产AI芯片的协同仍存在痛点,如何双向奔赴,正是国产芯片半壁江山首度同台的重要契机。
国产算力“不普惠”?
“我们一直强调算力普惠,但现在既不普也不惠,这恰恰是国产模型跟国产芯片合作的重要契机。”向来直言不讳的赵立东表示,只有国产大模型和AI芯片企业深度协同优化,实现低成本、高性能,才能用国产算力支撑大模型长远发展。
不管是模型厂商,还是芯片厂商,在应用落地的元年,谈得最多就是降低成本。
壁仞科技创始人、董事长兼CEO张文也提到,成本和产能是所有国产芯片厂商最先需要解决的问题,“首先是成本,伴随着使用成本大幅上升,工程上迫切需要高性价比的方案降低大模型的推理成本,这可能需要与产业链合作伙伴共同努力。其次是供应链,先进AI芯片的产能对于国内AI持续健康发展非常关键”。
2025年初,DeepSeek之所以能点燃中外AI圈,很重要的一个原因是它降低了模型预训练的门槛,让国产芯片迎来了春天。也正因如此,大模型本地化部署成为可能,一时之间,一体机市场如火如荼。
盖鲁江坦言,2025年从年初到现在,芯片的实际出货量在快速增长,尤其是一体机市场,核心原因是应用开始快速发展。
如今,DeepSeek的第一波红利被快速消化了,产业都在等待下一个推理时代的DeepSeek。
在赵立东看来,更大规模的大模型落地将在推理时代发生,因为基于开源大模型进行二次、三次开发的时候,将会有更多针对行业和应用场景的蒸馏版出现。
国产芯片要想抓住推理时代的机会,迎来下一个春天,必然要自我革命,大刀阔斧地降本。
AI“超级工厂”即将来袭
降本是一个系统性工程。在WAIC2025展会上,华为首次线下展出的昇腾384超节点被认为是“算力核弹”,基于超节点架构,实现384个NPU之间的大带宽低时延互联。通过系统工程的优化,让超节点像一台计算机一样工作,这也标志着国产AI芯片从“可用”走向“好用”。
就在四位国产芯片大佬对话的同一天,另一家国产芯片厂商摩尔线程在上海详细描画了“AI工厂”的构想,推动AI训练向十万卡级的“超级工厂”演进。这座“AI工厂”的智能“产能”,由五大核心要素共同决定,摩尔线程将效率公式概括为:AI工厂生产效率=加速计算通用性×单芯片有效算力×单节点效率×集群效率×集群稳定性。
从单芯片运算效率这点来看,摩尔线程基于自研MUSA架构,通过计算、内存、通信三重突破,实现DeepSeekR1推理加速1.5倍。
“生成式AI的门槛很低,大家都知道进入的途径,但生成式AI的门槛又很高,因为算力仍是卡脖子的核心竞争力,而AI芯片工厂也最难做,这是一个系统性工程。”摩尔线程创始人兼CEO张建中感慨道。
国产芯片与国产模型双向奔赴
如何让国产算力真正普惠?国产芯片和国产模型厂商们都不约而同想到了合作,这种合作不是停留在商业采购上,而是深入产品底层架构协同。
国产芯片大佬这一场罕见对话发生在阶跃星辰新一代基础大模型Step3的发布会上。阶跃星辰表示,Step3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,是天然适配国产芯片的模型。
在推理时代,模型性能随思维链的增长而提升,解码效率也成了降低成本的关键。目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。在架构设计阶段,Step3便考量系统与硬件的特性,目标是在广泛硬件平台上实现高效推理。正是系统架构的创新,让Step3实现了行业领先的推理解码效率。
在国产模型主动向国产芯片靠拢时,国产芯片也在关注模型的一举一动,从而前瞻性地规划设计。
张文表示:“国产大模型对国产芯片的发展特别重要,因为阶跃、千问、Deepseek等国产大模型的水平和国外差不多,但国产芯片与国外的差距还比较大。而设计芯片是挺痛苦的事情,从设计到做出来,至少需要两年,所以一定要有前瞻性才能把芯片设计好。对此,适配国产大模型公司,对我们的产品定义有非常大的帮助,其中包括针对大模型的超长文本、MOE架构、多模态、大规模推理等特性需求进行调整。”
“未来在大模型应用过程中,芯片需要对场景针对性提升,以及根据应用情况进行具体迭代和改进。这是一个确定性的方向。”天数智芯董事长兼CEO盖鲁江也提到了芯片与模型共同进步的方向。
现在国产芯片受供应链影响,芯片发展路线图或产品特点与国际芯片并不一样。陈维良更往前想了一步,“芯片企业和模型企业可以在更深度的算子优化上做更多事情,由此形成更高效的模型,同时再跟应用层以同样的方式进行深度合作,利用中国的产业链和数据优势,真真正正打造立足本土、具有中国特色的自主自强解决方案。”
模芯携手翻过“生态大山”
“国产AI芯片的面前有两座大山,一个是高端芯片制造,另一个是生态。”赵立东提到,经过与战略合作伙伴几年磨合,燧原科技产品的性价比做到了英伟达同类芯片的两到三倍。
“算力、模型、应用形成一个集团产业链,产出对行业、企业有价值的整体解决方案,才能为企业带来降本增效,才会形成爆发式的应用。”沐曦创始人、董事长兼总经理陈维良也提到了生态的重要性。
“随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?”阶跃星辰创始人、CEO姜大昕发出产业之问,但落地应用这一难题并非大模型公司一方就能解决,而是需要模型、芯片、平台到应用全产业链拧成一股绳。
WAIC2025前夕,阶跃星辰宣布联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现Step3的搭载和运行,沐曦、天数智芯和燧原科技等已初步实现运行Step3,其它联盟厂商的适配工作正在开展。
组建生态“朋友圈”的意义在于打通芯片、模型和平台全链路技术,为企业和开发者提供高效易用的大模型解决方案,加速应用落地。
国产芯片突围“三件套”
数据、算法、算力是AI三要素。张文认为,中国在数据、算法方面并不落后,按照OpenAI提出的五级AGI(通用人工智能)路线图,终极就如同L5自动驾驶,AI将彻底取代人类来处理各种复杂任务,目前我们的国产大模型大致处在L2水平,也就是协助人类推理的阶段,但算力需要一些时间追赶,相信国产芯片有能力通过时间实现逐步追赶。
自2023年以来,政策面不断加大高科技产品“自主创新”以及国产替代的支持,陆续出台《算力基础设施高质量发展行动计划》《“人工智能+”三年行动方案》等政策,明确要求2025年国产AI芯片市占率超40%。
国际数据公司IDC近期发布的《中国半年度加速计算市场(2024下半年)跟踪》报告显示,2024年,中国加速芯片的市场规模超过270万张,其中国产人工智能芯片厂商的出货量已超过82万张,也就是说,国产芯片已占据超30%的市场份额。
国产芯片要在全球竞争“深水区”快速突围,不仅要“潜得下去”,还要“冲得出去”。
盖鲁江总结了三点关键方向:一是体量突破,芯片规模必须实现量的积累,只有通过大量出货,才能在实践中不断积累经验、提升成熟度;二是成本优化,通过软件手段优化模型训练与推理流程,提升芯片的使用效率、良率和能效比,降低整体token成本,从而实现最终用户的让利;三是生态构建,围绕芯片、模型、平台和应用场景,建立统一的规范和标准体系,有助于减少前期开发与适配成本,加速产业协同发展。
国产AI算力正在从“可用”迈向“好用”。