近日,图灵奖得主、强化学习领域主要奠基人理查德·萨顿教授与石景山企业他山科技在加拿大签约,双方将合作建设“机器人幼儿园”,接下来计划落地北京石景山首钢园。此次合作旨在将强化学习引入具身智能训练体系,打造一套可复用、可共享的具身智能底层基础设施。
他山科技与Openmind Global Research达成战略合作。(左一为理查德·萨顿教授)
何为“机器人幼儿园”?他山科技相关负责人介绍,其实可以理解为一种新型的机器人训练场,在这里,机器人不再跟着人类进行模仿,而是在放置各类真实物品的环境中自主探索、感知结果,并根据反馈调整行为,完成从身体自我认知到运用工具完成复杂任务的迭代进化。
这背后,是区别于大语言模型的另一条独立技术路径,即强化学习,其核心逻辑是让智能体通过与环境互动积累经验、从错误中学习,而非依赖海量标注数据进行模仿。2024年图灵奖获得者萨顿教授,正是这一领域公认的奠基人。
在萨顿看来,大语言模型聚焦于语言模仿与安全对齐,其能力上限受限于人类现有知识。他提出,未来人工智能范式的根本转折在于从“人类数据时代”跨入“经验时代”,智能体不再消费人类生产的数据,而是通过与环境的直接交互产生自身经验,并持续进化。
这一训练模式实现运转,还离不开精准的触觉物理反馈。他山科技自主研发的触觉感知技术,能够对三维力、摩擦力、材质形变等全维度物理信息进行高保真采集与实时反馈。此次联手萨顿教授,双方将紧密围绕产线巡检、精密装配、柔性物流等真实产业场景,联合上下游企业将研究成果在真实或高保真仿真环境中快速测试与迭代,最终的成果通过开源、方案输出等方式向行业推广。
“机器人幼儿园”接下来计划落地北京石景山首钢园。
他山科技供图
来源:北京日报客户端
记者:孙云柯