大模型走到十字路口,未来机会在哪?
创始人
2025-07-28 12:40:29
0

站在十字路口的大模型,既需仰望星空的大胆设想,也离不开脚踏实地的智慧。7月26日,一场聚焦大模型技术路线、数据瓶颈与商业落地的圆桌对话,引发业界高度关注。

在商汤承办的2025WAIC大模型论坛上,商汤科技联合创始人林达华、阶跃星辰首席科学家张祥雨,上海人工智能实验室青年领军科学家、书生大模型负责人陈恺,北京智谱华章科技股份有限公司总裁王绍兰,范式集团联合创始人、首席科学家陈雨强及英伟达全球开发者生态副总裁Neil Trevett,围绕大模型发展至关键十字路口的现状,他们从技术路线抉择、数据瓶颈突破与商业落地路径三大维度,展开了一场关乎AI未来命运的深度思辨。

模型如何像人一样自主探索?

“我们所知的预训练将终结。” 林达华在讨论伊始,就援引了OpenAI前首席科学家Ilya Sutskever在NeurIPS 2024上的论断,直指行业范式迁移——从“预训练+监督微调”走向“强化学习驱动推理”。

“强化学习让模型第一次拥有了‘带反思的思维链’,解决了仅靠压缩语料无法完成的因果推理难题。”阶跃星辰首席科学家张祥雨表示,预训练本质是行为克隆(Behavior Cloning),其固有缺陷无法通过扩大数据或模型解决。

张祥雨进一步预测,下一阶段强化学习将接受自然语言反馈,实现“Test-Time Training”,让模型像人一样在真实环境中自主探索。

上海AI实验室陈恺则揭示了强化学习发展的前置条件:“强化学习大放异彩的背后,恰恰印证了预训练的重要性。RL极度依赖高质量的‘冷启动模型’作为探索基础。”他更警示当前RL面临两大瓶颈:确定性奖励局限(仅适用于数学编程等封闭问题)与基础设施挑战(探索学习需消耗海量算力)。

封面新闻记者在会上注意到,Transformer架构革新也面临“暗流涌动”。当讨论深入到模型架构时,张祥雨抛出“传统Transformer已到瓶颈”的判断。他认为,在即将到来的“智能体时代”,模型需具备“无限上下文”能力,而Transformer的串行生成机制难以胜任。

“RNN类结构会在两年内重回主流,但需要引入深层到浅层的反向交互,以支持持续学习。”张祥雨直言。

“互联网数据枯竭是量的问题,但更致命的是质的问题。”王绍兰认为,基座模型相当于通识教育毕业生,行业落地则需“企业入职培训”——通过行业数据预训练结合RL对齐,使模型掌握专属知识。

“这正是垂类公司的生存壁垒,”王绍兰强调:“当企业拥有独有行业数据和RL训练能力,就无需畏惧基座模型的碾压。”

数据短缺如何破解?

数据枯竭,被视为横亘在AGI面前的“最后一道墙”。

“数据短缺将成为一个关键难题,尤其是对于那些无法获取、成本高昂、不道德、危险或涉及隐私的数据。”Neil Trevett在圆桌中首次系统阐释了英伟达的破局思路:“填补这一缺口的方法之一,就是利用物理仿真来生成模拟场景,用于训练大语言模型。”

“英伟达在机器人和自动驾驶领域长期深耕,通过Cosmos世界基础模型,能够生成极为逼真的场景,从而获得可用于训练的真实世界数据。”Neil Trevett表示,这些数据通常精确且已标注,非常适合训练,尤其擅长生成那些罕见或极端案例——例如车祸,或机器人遭遇异常状况——这些场景在现实世界中几乎无法采集或难以复现。

Neil Trevett也提醒到,合成数据不能包打天下,“必须建立真实世界的反馈闭环,用人在回路持续校准,避免模型崩溃”。他预测,行业将走向“自监督+主动学习+人类验证”的混合管线,从而把数据需求压到最低。

智谱华章总裁王绍兰用“大学生和师傅”的比喻形容产业分工:基座模型如同大学毕业的通才,企业用行业知识库做“二轮预训练”,再用强化学习配“师傅带教”,才能解决真实业务问题。“行业数据既是模型精调的燃料,也是垂类公司最深的护城河。”他呼吁各行业成立数据联盟,把非敏感行业语料共享出来,形成正向循环。

陈雨强则从金融反欺诈案例指出,高敏感场景甚至需要“独立训练”基座模型,企业当务之急是建立统一的开源/闭源模型调度平台,以最快速度吸收前沿能力,同时保护私有数据。

开源仍是“最大鲶鱼” ?

面对“开源是否会削弱商业模型竞争力”的尖锐提问,陈恺直言,开源不会做出最顶尖模型,但能逼迫所有玩家把资源投入到真正差异化的环节,“若闭源模型无法超越开源,就失去存在意义。”

站在产业视角,Neil Trevett直言:开源力量“不可否认”,但每家公司需自行权衡开源带来的成本节省与商业优势流失,“未来不会是非黑即白,而是开放权重、部分闭源和混合架构的长期共存”。他提出混合架构设想——部分组件开源推动生态,核心模块闭源保护商业。

人工智能已不再是单一公司或单一技术的竞赛,而是全人类共同构建AGI生态的伟大协作。随着WAIC 2025的议程推进,这些前沿思考将在实验室、机房与千行百业中加速落地,推动通用人工智能从“下一代”走向“这一代”。

相关内容

热门资讯

BIRTV展会上观众大呼“太爽... 近日,中影科技携中影CINITY、中影巴可、中影综合业务服务平台,以及汇聚主流高格式电影拍摄用摄影机...
智慧灯杆解决方案(46页 PP... 今天分享的是:智慧灯杆解决方案(46页 PPT) 报告共计:46页 智慧灯杆:点亮智慧城市的"多面手...
在WAIC发布工业智脑,中国联... 在2025世界人工智能大会期间,中国联通携手中国信通院7月27日举办“云擎智造 工赋新元”AI+制造...
全球首个!2025世界人形机器... 当机器人踏上跑道、踢起足球、跳起舞蹈,甚至能精准完成工厂、酒店等多种场景任务……你能想象这超未来的场...
如何监控员工电脑?电脑监控软件... 如何监控员工电脑? 那当然是电脑监控软件了! 电脑监控软件已经成为企业管理不可或缺的一部分。 这些软...
金山云携具身智能等多个AI创新... 7月26日,“智能时代 同球共济”为主题的2025世界人工智能大会(WAIC)在上海开幕。今年是世界...
启明创投发布AI十大展望:首批... 7月28日,由启明创投主办的2025世界人工智能大会(WAIC)“启明创投·创业与投资论坛——创业投...
原创 冥... 今天咱来聊聊一个超有意思的事儿 —— 冥王星上看到的太阳有多大。 咱都知道,地球离太阳平均距离差不多...
腾讯的机器人战略越来越清晰了 作者 | 黄昱 编辑 | 王小娟 在最近的2025世界人工智能大会(WAIC)上,机器人稳居C位,且...
解决Windows系统中微软商... 许多Windows用户在尝试登录微软商店时,常常会遇到页面长时间转圈无法进入的情况。这一问题不仅阻挠...