新突破！新强化学习框架解码人类泛化行为奥秘_科技动态

新突破！新强化学习框架解码人类泛化行为奥秘

创始人

2025-05-21 02:00:33

0次

在动态多变的世界中，人类凭借泛化能力自如应对新挑战，从课堂知识迁移到生活实践，泛化能力始终是认知与学习的核心，也因此成为认知神经科学和机器学习领域的重点研究对象。近日，上海交通大学医学院附属精神卫生中心/上海交通大学心理学院方泽鸣博士（张洳源课题组）的重磅研究成果“Humans learn generalizable representations through efficient coding”登上《Nature Communications》杂志，为人类泛化行为研究带来全新突破。

古希腊哲学家赫拉克利特“人不能两次踏进同一条河流” 的名言，揭示了世界永恒变化的本质。在不断变化的现实中，人类适应新环境、解决新问题的关键，在于泛化能力——从过往经验提取知识并应用于新情境的能力。比如孩童在课堂（旧情境）学会四则运算后，就能在小卖部购物时（新情境）灵活计算价格，无需重新学习。泛化能力是知识积累与应用的基石。正因如此，它一直是认知神经科学和机器学习领域的研究热点。

强化学习理论作为理解人类和动物行为学习的重要计算框架，将学习行为看作是追求奖赏最大化的过程，为探究学习过程及其神经机制提供了重要的理论依据。然而，传统强化学习理论在解释泛化行为时存在局限。它只能解释对已经历过的情境的学习行为，面对新情境时，无法阐释人们如何进行有效的泛化。

针对这一局限，方泽鸣及其合作者对经典强化学习理论进行了修正，结合高效编码原则，将学习过程重新定义为：人脑在追求奖赏最大化的同时，会主动构建更加高效、简洁的关于外界刺激的内部表征。该理论强调，人脑并非被动接收外界信息，而是积极将复杂刺激转化为简单、低维的抽象表征。因为这种特性，当遇到新的刺激时，人脑构建的新表征与已有的表征之间往往会存在重叠，而这一重叠部分，正是实现知识提取和泛化的关键所在。

为了验证该理论，研究团队引入信息论概念量化表征简洁程度，并成功推导构建了新理论框架下的计算模型。一系列实验表明，使用高效编码的强化学习模型展现出与人类水平相当的泛化能力，而经典强化学习框架下的计算模型却无法实现这种泛化。不仅如此，新的理论框架还能够解释一些经典认知能力的形成过程。例如，为了追求表征的编码高效性，人们会将相似的事物聚类成更抽象的概念；为了保持表征的编码高效性，人们会选择性地关注部分刺激特征。该结论挑战了传统强化学习模型理论，为人类学习的神经机制提供了新的理论框架。

该论文的第一作者和通讯作者是方泽鸣博士，上海交通大学医学院附属精神卫生中心/国家精神疾病医学中心脑健康研究院和上海交通大学心理学院为共同第一单位。伦斯勒理工学院Chris R. Sims教授有重要贡献。

来源：新民晚报作者：左妍

上一篇：去年我国卫星导航与位置服务产业总产值达5758亿元

下一篇：重庆女警陈禹汀：数据织网的 “数智” 守护者

新突破！新强化学习框架解码人类泛化行为奥秘

相关内容

热门资讯