潮评丨北大学生与AI对决,丈量技术边界
创始人
2025-12-29 14:20:40
0

潮新闻客户端 特约评论员 胡欣红

图源人民日报微信公号

174名北大学子与全球顶尖AI模型同场竞技,谁能笑到最后?一场特殊的“期中考”引发了舆论关注。 据人民日报官微报道,近日,北京大学化学与分子工程学院联合北大计算中心、计算机学院、元培学院团队,发布了最新成果SUPERChem。参与测试的北大化院大二本科生取得了40.3%的平均准确率。接受测试的顶尖模型,其成绩仅与低年级本科生的平均水平相当。

在“AI威胁论”甚嚣尘上不时引发恐慌的情形下,这场特殊的“期中考”为我们提供了审视人工智能的清醒视角。最强大脑遇上“北大难度”,精心设计的“图灵测试”,绝非为了彰显AI的短板,而是以科学严谨的方式丈量技术边界,考查AI是否真的“懂”化学,最终指向更深远的技术进步与认知升级。

北大科研团队耗时耗力打造500道高难度试题,初衷正是戳破AI的“背书式智能”面纱。化学作为兼具逻辑推演与空间想象的学科,其晶体结构解析、反应机理推演等任务,恰恰考验着AI从一维文本预测转向多维空间推理的真实能力。当测试结果显示,即便是GPT-5、Gemini等顶尖模型,不仅准确率未能超越人类,还在视觉信息转化、高阶逻辑推理中暴露明显短板。这恰恰印证了数学大师丘成桐的判断:“目前人工智能仍然无法实现深度思考,并不具备人类的思考能力,期望它创造崭新观念、实现学科突破目前还不可能。”

AI的“厉害”,归根结底是人类智慧的延伸与投射。北大团队搭建协作平台、引入积分激励系统,历经多轮打磨甚至15次迭代才完成试题设计,这种跨学科协作的创造力与精益求精的科学精神,正是AI所缺乏的核心特质。AI模型在训练中吸纳的海量知识,本质上是人类文明的结晶。其在特定任务中的高效表现,不过是人类编程技术、算法设计与数据积累的集中体现。就像这场对决中,AI的每一次答题尝试,都是对人类预设规则与知识体系的被动响应,而北大学子展现的科学直觉、灵活应变与深度思考,才是推动学科发展与技术革新的根本动力。

更重要的是,这场“期中考”打破了人们对AI的盲目崇拜,让我们看清技术的本质定位。AI确实在信息检索、数据处理等领域展现出强大优势,但在需要严密逻辑链、深刻理解与创新突破的硬核领域,仍与人类存在显著差距。不过,这类评测不是为了给AI“泼冷水”,而是为技术发展提供精准路标——明确了视觉信息转化、深度推理等短板,全球科研者才能有的放矢地攻关突破,推动AI从“记住知识”向“理解世界”跨越。

在AI技术飞速迭代的今天,我们既无需因偶尔的技术突破而盲目乐观,也不必因暂时的能力局限而过度焦虑。北大的这场特殊对决,恰如一面镜子,照见了AI的潜力与局限,更照见了人类的智慧与远见。AI是工具而非对手,是伙伴而非替代者,其发展的高度取决于人类认知的深度与广度。当我们以清醒的认知看待AI,在正视差距中明确方向,在协作创新中补齐短板,才能让这项技术真正服务于人类文明的进步,走出一条更稳健、更长远的发展之路。

北大学生与AI的特殊PK,醉翁之意不在“谁输谁赢”。这场“期中考”的真正价值,正在于让我们在技术狂潮中保持理性,在探索未知中坚守初心。毕竟,推动AI走得更远的,永远是清醒认知下的人类力量。

相关内容

热门资讯

我国卫星捕捉到黑洞“进食”现场 “天关”卫星捕捉到黑洞“进食”现场 记者近日从中国科学院国家天文台获悉,我国“天关”卫星在巡天中,捕...
高端润滑油的智造密码 2026-02-13 10:47:43 作者:狼叫兽 2月9日,润滑油北京有限公司员工加紧节前生...
奔向脑机接口赛道C位 2月5日清晨,北京寒风凛冽,但北京芯智达神经技术有限公司(以下简称芯智达)的研发实验室内却是一番火热...
聚焦量子光学与光场调控——第八... 为助力青年科研人才成长,充分展示创新潜力与科研担当,由中国激光杂志社长沙分社和湖南省光学学会等单位联...
原创 中... 中国互联网行业真的变天了! 阿里、腾讯、百度发红包抢夺AI助手,结果字节跳动冷不丁地放出Seedan...
马上起飞!中国飞行眼科医院将开... 近日,中山大学中山眼科中心(以下简称“中大眼科中心”)飞行医院医疗机——国产C909飞机(注册号-B...
今年山东将力争人工智能核心产业... 2月11日,人工智能赋能新型工业化齐鲁行(青岛站)暨“人工智能+家电、汽车”专场活动举行。记者了解到...
【知识视界】 “年味”里的科学 “年味”里的科学 又是一年辞旧岁,年味渐浓。除了吃吃唱唱、走亲访友,春节还有什么不一样的新玩儿法?...
江苏神通获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示江苏神通(002438)新获得一项实用新型专利授权,专利名为“...
算力需求催“热”冷却液 上市公... 随着AI技术快速迭代,芯片功耗持续攀升,高功耗催生了更高的散热需求。 据上海证券报记者了解,在人工智...