首席科学家姚顺雨腾讯首篇论文:道破为何AI死活听不懂人话
创始人
2026-02-04 22:40:50
0

来源:市场资讯

(来源:快科技)

快科技2月4日消息,近日,腾讯混元团队和复旦联合团队发布了首篇论文《CL-bench》。

值得一提的是,这也是姚顺雨入职腾讯首席AI科学家后,首次署名的研究论文。

他在文中提到,当前AI与真正智能之间的鸿沟,不在于知识的多少,而在于学习的能力。

一个装满知识却不会学习的AI,就像一个背了整本字典却不会写作的人,看起来博学,实则僵化。

人类并不只依赖多年前学到的死知识,而是在实时地从眼前的上下文中学习。

在这篇论文里,研究团队提到,大模型在上下文利用上,依然存在显著的能力短板。

为了衡量现有模型距离真正的"上下文学习者"还有多远,研究团队构建了CL-bench。

这是一个专门评测语言模型能否从上下文中学习新知识并正确应用的基准。

CL-bench包含由资深领域专家精心制作的500个复杂上下文、1899个任务和31607个验证标准。

CL-bench只包含一个简单但苛刻的要求:"解决每个任务要求模型必须从上下文中学习到模型预训练中不存在的新知识,并正确应用。"

通过实验发现,世界上排名前十的语言模型在CL-bench上的任务解决率平均只有17.2%。

也就是说即使是如今最强的语言模型,在上下文的利用方面仍然做得不好,甚至可以说是还不会利用上下文,从上下文中学习。

不过这也为大语言模型后续的迭代指出了一个可能的方向,强化模型从上下文中进行学习的能力。

相关内容

热门资讯

AI赋能元宵行街会+“非遗+科... 3月3日元宵佳节,2026年杨浦区环同济第二十一届“元宵行街会”暨中华优秀传统文化主题汇演活动隆重举...
下一次是2072年!今晚别忘抬... 正月十五元宵节 又到一年赏月时 🌕 今晚元宵夜 一场月全食将在夜空上演 天文专家表示 月全食落在农历...
《扬州市具身智能产业发展行动方... 记者从近日召开的市工信局新闻发布会了解到,新出炉的《扬州市具身智能产业发展行动方案(2026—202...
技巧知识分享!心悦填大坑作辅助... >>您好:心悦填大坑作辅助下载确实是有挂的,很多玩家在这款心悦填大坑作辅助下载游戏中打牌都会发现很多...
重大通报!新海贝辅助(透视)w... 重大通报!新海贝辅助(透视)wepoker辅助器软件下载(细节方法有挂技巧) 了解更多开挂安装加(1...
6G技术与咖啡机器人双星闪耀M... 来源:滚动播报 (来源:上观新闻) 被誉为“全球通信行业风向标”的2026年欧洲国际移动通讯展(M...
最新通报!开心泉州小程序福州(... 最新通报!开心泉州小程序福州(透视)hh poker透视器下载(总结教程有挂技巧);无需打开直接搜索...
重要通知!红黑大战控制系统(透... 您好:红黑大战控制系统这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌...
科普分享!欢聚水鱼智能辅助教程... 科普分享!欢聚水鱼智能辅助教程(透视)aapoker辅助怎么用(安装教程存在有挂)>>您好:软件加1...
推荐十款!广西老友玩有破解视频... 推荐十款!广西老友玩有破解视频(透视)大菠萝789辅助器下载(软件教程有挂透明挂)【无需打开直接搜索...