新突破!新强化学习框架解码人类泛化行为奥秘
创始人
2025-05-21 02:00:33
0

在动态多变的世界中,人类凭借泛化能力自如应对新挑战,从课堂知识迁移到生活实践,泛化能力始终是认知与学习的核心,也因此成为认知神经科学和机器学习领域的重点研究对象。近日,上海交通大学医学院附属精神卫生中心/上海交通大学心理学院方泽鸣博士(张洳源课题组)的重磅研究成果“Humans learn generalizable representations through efficient coding”登上《Nature Communications》杂志,为人类泛化行为研究带来全新突破。

古希腊哲学家赫拉克利特“人不能两次踏进同一条河流” 的名言,揭示了世界永恒变化的本质。在不断变化的现实中,人类适应新环境、解决新问题的关键,在于泛化能力——从过往经验提取知识并应用于新情境的能力。比如孩童在课堂(旧情境)学会四则运算后,就能在小卖部购物时(新情境)灵活计算价格,无需重新学习。泛化能力是知识积累与应用的基石。正因如此,它一直是认知神经科学和机器学习领域的研究热点。

强化学习理论作为理解人类和动物行为学习的重要计算框架,将学习行为看作是追求奖赏最大化的过程,为探究学习过程及其神经机制提供了重要的理论依据。然而,传统强化学习理论在解释泛化行为时存在局限。它只能解释对已经历过的情境的学习行为,面对新情境时,无法阐释人们如何进行有效的泛化。

针对这一局限,方泽鸣及其合作者对经典强化学习理论进行了修正,结合高效编码原则,将学习过程重新定义为:人脑在追求奖赏最大化的同时,会主动构建更加高效、简洁的关于外界刺激的内部表征。该理论强调,人脑并非被动接收外界信息,而是积极将复杂刺激转化为简单、低维的抽象表征。因为这种特性,当遇到新的刺激时,人脑构建的新表征与已有的表征之间往往会存在重叠,而这一重叠部分,正是实现知识提取和泛化的关键所在。

为了验证该理论,研究团队引入信息论概念量化表征简洁程度,并成功推导构建了新理论框架下的计算模型。一系列实验表明,使用高效编码的强化学习模型展现出与人类水平相当的泛化能力,而经典强化学习框架下的计算模型却无法实现这种泛化。不仅如此,新的理论框架还能够解释一些经典认知能力的形成过程。例如,为了追求表征的编码高效性,人们会将相似的事物聚类成更抽象的概念;为了保持表征的编码高效性,人们会选择性地关注部分刺激特征。该结论挑战了传统强化学习模型理论,为人类学习的神经机制提供了新的理论框架。

该论文的第一作者和通讯作者是方泽鸣博士,上海交通大学医学院附属精神卫生中心/国家精神疾病医学中心脑健康研究院和上海交通大学心理学院为共同第一单位。伦斯勒理工学院Chris R. Sims教授有重要贡献。

来源:新民晚报 作者:左妍

相关内容

热门资讯

王兴兴这篇硕士论文何以能“出圈... 来源:滚动播报 (来源:千龙网) 是兴趣驱动王兴兴把理想变为现实,撰写与机器人相关的硕士论文也就“水...
西安固体动力助推 “力箭一号遥... 本报讯(记者 关颖)11月9日11时32分,由航天科技四院商业火箭动力公司抓总提供全部四级固体发动机...
“翻墙”?假猎奇,真危险 在移动互联网时代,通过互联网获取信息资讯已成为我们了解外部世界的普遍方式,但个别网民法律和风险防范意...
人形机器人奏响千年青铜句鑃 ◎本报记者叶青何亮 11月9日晚,第十五届全国运动会开幕式在广东奥林匹克体育中心举行,现场迎来了全球...
巴顿-美焊联合实验室在2025... 10月31日,2025年“女性与太空”国际活动在杭州成功召开。活动由中国宇航学会、亚太空间合作组织、...
大模型助力重庆汽车产业打通上下... 本报讯(记者 李国 实习生 夏桂琰)重庆赛力斯超级工厂,超过3000台机器人在车间内有条不紊地工作,...
透视辅助(德州微扑克辅助)德州... 您好,德州微扑克辅助这款游戏可以开挂的,确实是有挂的,需要了解加微【136704302】很多玩家在这...
aapoker挂!wpk ai... 您好,wpk ai辅助这款游戏可以开挂的,确实是有挂的,需要了解加微【136704302】很多玩家在...
透视透视(wpk有辅助挂)wp... 透视透视(wpk有辅助挂)wpk这个软件真实吗(详细辅助2025新版总结)一贯存在有挂(1)透视透视...
德扑之星有作弊!德扑ai智能,... 1、德扑之星有作弊!德扑ai智能,(德州aapoker俱乐部)一贯是有挂(详细透视安装教程)(UU ...