首席科学家姚顺雨腾讯首篇论文:道破为何AI死活听不懂人话
创始人
2026-02-04 22:40:50
0

来源:市场资讯

(来源:快科技)

快科技2月4日消息,近日,腾讯混元团队和复旦联合团队发布了首篇论文《CL-bench》。

值得一提的是,这也是姚顺雨入职腾讯首席AI科学家后,首次署名的研究论文。

他在文中提到,当前AI与真正智能之间的鸿沟,不在于知识的多少,而在于学习的能力。

一个装满知识却不会学习的AI,就像一个背了整本字典却不会写作的人,看起来博学,实则僵化。

人类并不只依赖多年前学到的死知识,而是在实时地从眼前的上下文中学习。

在这篇论文里,研究团队提到,大模型在上下文利用上,依然存在显著的能力短板。

为了衡量现有模型距离真正的"上下文学习者"还有多远,研究团队构建了CL-bench。

这是一个专门评测语言模型能否从上下文中学习新知识并正确应用的基准。

CL-bench包含由资深领域专家精心制作的500个复杂上下文、1899个任务和31607个验证标准。

CL-bench只包含一个简单但苛刻的要求:"解决每个任务要求模型必须从上下文中学习到模型预训练中不存在的新知识,并正确应用。"

通过实验发现,世界上排名前十的语言模型在CL-bench上的任务解决率平均只有17.2%。

也就是说即使是如今最强的语言模型,在上下文的利用方面仍然做得不好,甚至可以说是还不会利用上下文,从上下文中学习。

不过这也为大语言模型后续的迭代指出了一个可能的方向,强化模型从上下文中进行学习的能力。

相关内容

热门资讯

字节反击腾讯称“都是卖猪食的,... 近日,有传言称,腾讯副总裁批“低质洗脑短视频像猪食”,字节跳动副总裁反击称:“都是卖猪食的,谁也别看...
手机清空回收站误删数据恢复工具... 请帮帮我!我彻底慌了,手机里的所有文件都丢了!多年的照片、视频、音乐、短信和聊天记录——全都没了!我...
全球首个!我国6G频率获批,有... IT之家 5 月 26 日消息,本月初(5 月 8 日),工业和信息化部发文,为进一步推动我国 6G...
博实结获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示博实结(301608)新获得一项实用新型专利授权,专利名为“一...
原创 刚... 本来今天想给大家跟 OPPO Reno16 系列跟荣耀 600 系列的新机发布会的... 但由于晚...
打工机器人,在杭州“交社保” “各大厂商基本都已推出了2万元左右的消费级新产品,有些小于1米的迷你机器人已下探到千元区间。” 文 ...
神舟二十三号搭载9项太空实验 神舟二十三号载人飞船发射入轨后,于5月25日凌晨成功对接于空间站天和核心舱。记者从中国科学院空间应用...
科美诊断申请化学发光检测试剂专... 国家知识产权局信息显示,科美博阳诊断技术(上海)有限公司、科美诊断技术股份有限公司申请一项名为“一种...
谷光伏太阳能支架设备企业 谷光伏太阳能支架设备企业:支撑绿色能源的隐形脊梁 提到太阳能发电,大家往往首先想到的是那些闪闪发光的...