大模型走到十字路口,未来机会在哪?
创始人
2025-07-28 12:40:29
0

站在十字路口的大模型,既需仰望星空的大胆设想,也离不开脚踏实地的智慧。7月26日,一场聚焦大模型技术路线、数据瓶颈与商业落地的圆桌对话,引发业界高度关注。

在商汤承办的2025WAIC大模型论坛上,商汤科技联合创始人林达华、阶跃星辰首席科学家张祥雨,上海人工智能实验室青年领军科学家、书生大模型负责人陈恺,北京智谱华章科技股份有限公司总裁王绍兰,范式集团联合创始人、首席科学家陈雨强及英伟达全球开发者生态副总裁Neil Trevett,围绕大模型发展至关键十字路口的现状,他们从技术路线抉择、数据瓶颈突破与商业落地路径三大维度,展开了一场关乎AI未来命运的深度思辨。

模型如何像人一样自主探索?

“我们所知的预训练将终结。” 林达华在讨论伊始,就援引了OpenAI前首席科学家Ilya Sutskever在NeurIPS 2024上的论断,直指行业范式迁移——从“预训练+监督微调”走向“强化学习驱动推理”。

“强化学习让模型第一次拥有了‘带反思的思维链’,解决了仅靠压缩语料无法完成的因果推理难题。”阶跃星辰首席科学家张祥雨表示,预训练本质是行为克隆(Behavior Cloning),其固有缺陷无法通过扩大数据或模型解决。

张祥雨进一步预测,下一阶段强化学习将接受自然语言反馈,实现“Test-Time Training”,让模型像人一样在真实环境中自主探索。

上海AI实验室陈恺则揭示了强化学习发展的前置条件:“强化学习大放异彩的背后,恰恰印证了预训练的重要性。RL极度依赖高质量的‘冷启动模型’作为探索基础。”他更警示当前RL面临两大瓶颈:确定性奖励局限(仅适用于数学编程等封闭问题)与基础设施挑战(探索学习需消耗海量算力)。

封面新闻记者在会上注意到,Transformer架构革新也面临“暗流涌动”。当讨论深入到模型架构时,张祥雨抛出“传统Transformer已到瓶颈”的判断。他认为,在即将到来的“智能体时代”,模型需具备“无限上下文”能力,而Transformer的串行生成机制难以胜任。

“RNN类结构会在两年内重回主流,但需要引入深层到浅层的反向交互,以支持持续学习。”张祥雨直言。

“互联网数据枯竭是量的问题,但更致命的是质的问题。”王绍兰认为,基座模型相当于通识教育毕业生,行业落地则需“企业入职培训”——通过行业数据预训练结合RL对齐,使模型掌握专属知识。

“这正是垂类公司的生存壁垒,”王绍兰强调:“当企业拥有独有行业数据和RL训练能力,就无需畏惧基座模型的碾压。”

数据短缺如何破解?

数据枯竭,被视为横亘在AGI面前的“最后一道墙”。

“数据短缺将成为一个关键难题,尤其是对于那些无法获取、成本高昂、不道德、危险或涉及隐私的数据。”Neil Trevett在圆桌中首次系统阐释了英伟达的破局思路:“填补这一缺口的方法之一,就是利用物理仿真来生成模拟场景,用于训练大语言模型。”

“英伟达在机器人和自动驾驶领域长期深耕,通过Cosmos世界基础模型,能够生成极为逼真的场景,从而获得可用于训练的真实世界数据。”Neil Trevett表示,这些数据通常精确且已标注,非常适合训练,尤其擅长生成那些罕见或极端案例——例如车祸,或机器人遭遇异常状况——这些场景在现实世界中几乎无法采集或难以复现。

Neil Trevett也提醒到,合成数据不能包打天下,“必须建立真实世界的反馈闭环,用人在回路持续校准,避免模型崩溃”。他预测,行业将走向“自监督+主动学习+人类验证”的混合管线,从而把数据需求压到最低。

智谱华章总裁王绍兰用“大学生和师傅”的比喻形容产业分工:基座模型如同大学毕业的通才,企业用行业知识库做“二轮预训练”,再用强化学习配“师傅带教”,才能解决真实业务问题。“行业数据既是模型精调的燃料,也是垂类公司最深的护城河。”他呼吁各行业成立数据联盟,把非敏感行业语料共享出来,形成正向循环。

陈雨强则从金融反欺诈案例指出,高敏感场景甚至需要“独立训练”基座模型,企业当务之急是建立统一的开源/闭源模型调度平台,以最快速度吸收前沿能力,同时保护私有数据。

开源仍是“最大鲶鱼” ?

面对“开源是否会削弱商业模型竞争力”的尖锐提问,陈恺直言,开源不会做出最顶尖模型,但能逼迫所有玩家把资源投入到真正差异化的环节,“若闭源模型无法超越开源,就失去存在意义。”

站在产业视角,Neil Trevett直言:开源力量“不可否认”,但每家公司需自行权衡开源带来的成本节省与商业优势流失,“未来不会是非黑即白,而是开放权重、部分闭源和混合架构的长期共存”。他提出混合架构设想——部分组件开源推动生态,核心模块闭源保护商业。

人工智能已不再是单一公司或单一技术的竞赛,而是全人类共同构建AGI生态的伟大协作。随着WAIC 2025的议程推进,这些前沿思考将在实验室、机房与千行百业中加速落地,推动通用人工智能从“下一代”走向“这一代”。

相关内容

热门资讯

APS DNL为韩国光州天桥打... IT之家 6 月 14 日消息,据韩媒 The Elec 报道,APS DNL 公司在韩国光州新岘洞...
迈菲超声申请恒压晶圆减薄装置专... 国家知识产权局信息显示,深圳迈菲超声半导体有限公司申请一项名为“恒压晶圆减薄装置、控制系统及方法”的...
拉马克被嘲笑了200年,结果他... 过去二十几年,自然科学最大的特点不是"发现新东西",而是把旧常识一个个推翻了。比如:基因不只来自父母...
微纳星空6颗“东坡”系列卫星出... IT之家 6 月 14 日消息,微纳星空今日宣布,由微纳星空商业卫星智能化产线批量研制的 6 颗“东...
爱科赛博:完成MW级AIDC测... 来源:上海证券报·中国证券网 上证报中国证券网讯 6月12日,爱科赛博披露投资者关系活动记录表。 公...
主创手记 丨电视剧《星月征途》... 专栏导语 “北京大视听”精品创作工作机制实施以来,首都视听领域创作活力不断增强,一批立足现实、回应时...
中国正在太空布下一盘大棋 央视网6月13日消息,中国正在太空布下一盘大棋。 业内机构预测,到2030年,全球太空经济市场规模将...
不是说要涨价,怎么一到618全... 我算是发现了,厂商们的嘴,骗人的鬼。 年初那会儿,手机厂商、电脑厂商一个个说得跟真的一样:什么成本抗...
AI重塑停车服务链路 鸿蒙元服... 6月13日,在华为开发者大会2026(HDC 2026)期间,“鸿蒙智泊·智慧服务——全场景智慧泊车...
脑机壹周讯|失明患者重见光明、... 本周(06.08-06.12),国内脑机接口企业在脑机行业资讯、脑机融资动态、脑机相关政策方面实现关...