大模型走到十字路口,未来机会在哪?
创始人
2025-07-28 12:40:29
0

站在十字路口的大模型,既需仰望星空的大胆设想,也离不开脚踏实地的智慧。7月26日,一场聚焦大模型技术路线、数据瓶颈与商业落地的圆桌对话,引发业界高度关注。

在商汤承办的2025WAIC大模型论坛上,商汤科技联合创始人林达华、阶跃星辰首席科学家张祥雨,上海人工智能实验室青年领军科学家、书生大模型负责人陈恺,北京智谱华章科技股份有限公司总裁王绍兰,范式集团联合创始人、首席科学家陈雨强及英伟达全球开发者生态副总裁Neil Trevett,围绕大模型发展至关键十字路口的现状,他们从技术路线抉择、数据瓶颈突破与商业落地路径三大维度,展开了一场关乎AI未来命运的深度思辨。

模型如何像人一样自主探索?

“我们所知的预训练将终结。” 林达华在讨论伊始,就援引了OpenAI前首席科学家Ilya Sutskever在NeurIPS 2024上的论断,直指行业范式迁移——从“预训练+监督微调”走向“强化学习驱动推理”。

“强化学习让模型第一次拥有了‘带反思的思维链’,解决了仅靠压缩语料无法完成的因果推理难题。”阶跃星辰首席科学家张祥雨表示,预训练本质是行为克隆(Behavior Cloning),其固有缺陷无法通过扩大数据或模型解决。

张祥雨进一步预测,下一阶段强化学习将接受自然语言反馈,实现“Test-Time Training”,让模型像人一样在真实环境中自主探索。

上海AI实验室陈恺则揭示了强化学习发展的前置条件:“强化学习大放异彩的背后,恰恰印证了预训练的重要性。RL极度依赖高质量的‘冷启动模型’作为探索基础。”他更警示当前RL面临两大瓶颈:确定性奖励局限(仅适用于数学编程等封闭问题)与基础设施挑战(探索学习需消耗海量算力)。

封面新闻记者在会上注意到,Transformer架构革新也面临“暗流涌动”。当讨论深入到模型架构时,张祥雨抛出“传统Transformer已到瓶颈”的判断。他认为,在即将到来的“智能体时代”,模型需具备“无限上下文”能力,而Transformer的串行生成机制难以胜任。

“RNN类结构会在两年内重回主流,但需要引入深层到浅层的反向交互,以支持持续学习。”张祥雨直言。

“互联网数据枯竭是量的问题,但更致命的是质的问题。”王绍兰认为,基座模型相当于通识教育毕业生,行业落地则需“企业入职培训”——通过行业数据预训练结合RL对齐,使模型掌握专属知识。

“这正是垂类公司的生存壁垒,”王绍兰强调:“当企业拥有独有行业数据和RL训练能力,就无需畏惧基座模型的碾压。”

数据短缺如何破解?

数据枯竭,被视为横亘在AGI面前的“最后一道墙”。

“数据短缺将成为一个关键难题,尤其是对于那些无法获取、成本高昂、不道德、危险或涉及隐私的数据。”Neil Trevett在圆桌中首次系统阐释了英伟达的破局思路:“填补这一缺口的方法之一,就是利用物理仿真来生成模拟场景,用于训练大语言模型。”

“英伟达在机器人和自动驾驶领域长期深耕,通过Cosmos世界基础模型,能够生成极为逼真的场景,从而获得可用于训练的真实世界数据。”Neil Trevett表示,这些数据通常精确且已标注,非常适合训练,尤其擅长生成那些罕见或极端案例——例如车祸,或机器人遭遇异常状况——这些场景在现实世界中几乎无法采集或难以复现。

Neil Trevett也提醒到,合成数据不能包打天下,“必须建立真实世界的反馈闭环,用人在回路持续校准,避免模型崩溃”。他预测,行业将走向“自监督+主动学习+人类验证”的混合管线,从而把数据需求压到最低。

智谱华章总裁王绍兰用“大学生和师傅”的比喻形容产业分工:基座模型如同大学毕业的通才,企业用行业知识库做“二轮预训练”,再用强化学习配“师傅带教”,才能解决真实业务问题。“行业数据既是模型精调的燃料,也是垂类公司最深的护城河。”他呼吁各行业成立数据联盟,把非敏感行业语料共享出来,形成正向循环。

陈雨强则从金融反欺诈案例指出,高敏感场景甚至需要“独立训练”基座模型,企业当务之急是建立统一的开源/闭源模型调度平台,以最快速度吸收前沿能力,同时保护私有数据。

开源仍是“最大鲶鱼” ?

面对“开源是否会削弱商业模型竞争力”的尖锐提问,陈恺直言,开源不会做出最顶尖模型,但能逼迫所有玩家把资源投入到真正差异化的环节,“若闭源模型无法超越开源,就失去存在意义。”

站在产业视角,Neil Trevett直言:开源力量“不可否认”,但每家公司需自行权衡开源带来的成本节省与商业优势流失,“未来不会是非黑即白,而是开放权重、部分闭源和混合架构的长期共存”。他提出混合架构设想——部分组件开源推动生态,核心模块闭源保护商业。

人工智能已不再是单一公司或单一技术的竞赛,而是全人类共同构建AGI生态的伟大协作。随着WAIC 2025的议程推进,这些前沿思考将在实验室、机房与千行百业中加速落地,推动通用人工智能从“下一代”走向“这一代”。

相关内容

热门资讯

《新华每日电讯》关注合肥:凌晨... 《新华每日电讯》 2026年2月12日5版 新春走基层·走笔|凌晨上岗!跟着具身智能探“未来” 记者...
青春绽放在祖国需要的地方——“... 青春不负韶华。中央宣传部、人力资源社会保障部近日向全社会公开发布“最美高校毕业生”,9名同志光荣入选...
库犸科技申请电流检测电路和机器... 国家知识产权局信息显示,深圳库犸科技有限公司申请一项名为“电流检测电路和机器人”的专利,公开号CN1...
新春致辞 | 一文速览五大基础... 基础电信企业新春致辞 中国电信 中国电信集团有限公司 董事长、党组书记 柯瑞文: 春回岁聿,福启...
中国南极考察又有新发现!中层鱼... 来源:滚动播报 (来源:千龙网) 中国第42次南极考察又有新消息。目前,“雪龙”号在阿蒙森海的大洋作...
南京一企业研发省内领先性价比“... 城市消防水源“难找、不好用、难监测”,高层消防水压“看不见、测不准、报不出”,一直是城市消防安全管理...
路由器到底怎么摆,网速才更快?... 你家里的路由器是怎么摆放的呢? 有的人把路由器藏起来,有的人会直接放客厅,但很多人可能不知道,路由器...
江苏宏大特种钢机械厂申请带式微... 国家知识产权局信息显示,江苏宏大特种钢机械厂有限公司申请一项名为“带式微波烘干机”的专利,公开号CN...
“亦庄箭”发射“亦庄星” ,捷... 2月12日14时37分,在广东阳江近海海域,北京经济技术开发区(简称“北京经开区”,又称“北京亦庄”...
EnGenius推出BE360... IT之家 2 月 14 日消息,EnGenius 恩硕科技美国加州当地时间本月 12 日宣布推出面向...