AI已在所有领域达到人类博士水平！那么，教育该走向何方？_科技动态

AI已在所有领域达到人类博士水平！那么，教育该走向何方？

创始人

2025-07-17 02:20:32

0次

AI是知识工作者的挖掘机，大幅提升教学与科研生产力。

——————————————

这几天颇不宁静。

——更准确地说，这两年一直不宁静。

因为，AI的发展实在太快了，

快到所有研究者、开发者都始料未及

更不用说老师等“外行”了！

有一个说法：

人间一天，AI一年。

最近一周以来，

王珏老师连续看到AI的最新发展

其发展速度、其能力实在是令人震惊！

以及令人对人类前途感到心忧！

长期以来，人类对大模型的认知都是：

大模型只是知识复读机，它没有创造力，不能像人类那样解决复杂问题

然而，7月10日马斯克发布的Grok 4，却公然宣称：

Grok 4在所有学术领域的表现均已达到博士级水平

将用它重写人类知识库，添加缺失信息，删除错误内容！

——人类知识，居然需要用AI来重写，如果真能做到的话，就实在太让人震惊了！

以下是Grok 4在数学、科学方面的测试得分：

AIME美国数学邀请赛，满分！

USAMO美国数学奥林匹克竞赛，61.9分！（这个分低了点？不过要知道国际数学奥林匹克竞赛中，金牌线是29分！）

GPQA博士级别科学问题解决，88.9分！

看看这些炸眼的数字，

你有否像我一样震惊、忧虑？

而且，什么AIME、GPQA之类的竞赛，早就不足以测试出大模型超强的知识和能力了。

2025年初，由全球近千名专家联合打造的 “人类终极测试”《Humanity’s Last Exam》（HLE）横空出世，被誉为“人类最后一场闭卷考试”。这项包含100个领域、3000道高难度题目的多模态基准测试。

所有问题既无法在网络上搜到，也不能用简单方法解决，并且即便对于人类专家研究起来也是相当困难的。比如，

数学题：要求计算高阶范畴论中的自然协变换数量。
化学题：解析热周环反应中电环化与环加成类型。
语言学题：基于古希伯来语发音传统划分闭音节。

这些问题不仅需要深度推理，还需结合领域内最新研究成果，确保答案的唯一性和前沿性。

如此广泛和困难的问题，让人类来做，即便是专家恐怕也只能得到个位数，对于普罗大众来说，恐怕个个是零蛋吧……

那么，大模型表现如何呢？

简单说，不到半年的时间里，大模型的最好成绩由2.7分，已经提升到了25.4分！

以下是一些重要大模型的测试成绩：

大名鼎鼎的GPT-4o（2024年5月份发布），其HLE成绩是可怜的2.7分！
今年1月20号发布的DeepSeek R1的HLE成绩，快速提升到了7.5分！
今年5月28号发布的DeepSeek R1-0528，HLE成绩则大幅上升到了14分
到了今年6月5号发布的Google Gemini 2.5 Pro，将其提升到了惊人的21.6分！
而刚刚发布的Grok4，又打破了新的纪录，达到了25.4分。

（以上数据均来自于HLE网址：https://lastexam.ai/）

而在允许“工具调用”（比如通过编程来解决问题）

Grok 4 heavy模式则可达到惊人的44.4分！

远超著名的OpenAI o3的24.9分

以及Google Gemini 2.5 pro的26.9分

Grok 4就够让人震惊的了，

其发布至今还不超过一周，

昨天，更让人震惊的 GPT-5也爆出消息来了！

（中间还有7月12日的Kimi发布了K2版大模型，也是相当炸裂，很多性能超越了DeepSeek R1。不过，和Grok 4、GPT 5相比，实在也算不得什么了，只能说Kimi有点身不逢时了……）

当然，现在GPT-5还没有发布，不过其CEO Sam Altman在6月18日的访谈中明确表示：

GPT-5将在2025年夏季正式发布。

据爆料，GPT-5在所有方面几乎都超过了Grok 4。

比如：AIME25美国数学邀请赛2025版，GPT-5普通模式和推理模式，都能得到100分！和Grok 4一样，委实太厉害了！

GPQA博士级别问题解决，GPT-5分别得到了90分（普通模式）和95分（推理模式），得分超过了Grok 4：

在HLE人类终极测试中，GPT-5再一次将成绩提升到了50分（普通模式）和56分（推理模式），把Grok 4远远甩在了后面：

——————————————

看了以上数据，不知道您是否产生和我相同的感受：

AI对教育教学的最大影响和挑战

从来不是什么“AI赋能教学”

而是：

AI的智能水平已超过了绝大多数人

而且它还在不断快速发展，

也许会有一天真的成为“知识上帝”

——就像AlphaGO成为“围棋上帝”那样

在这样的局面下

人类的命运将向何处去？

以及，

我们该如何教育下一代？

这就是王珏老师在很多场合不断重申的观点：

如果仍按照当下的教育目标、教学方法、学习内容

教育教学仍然以“书面考试”、“找到正确解”作为唯一目标

我们将无法培养出应对AI挑战的下一代

因为，

只要是有正确答案、甚至唯一答案的

绝大多数人肯定干不过AI！

而为了应付中考、高考

老师、学生大多采用大量记忆、刷题的方法

以提高解题能力和熟练度

而这些，

正是AI时代最不重要的能力！

——这句话是上海交大沈辛成老师提出来的，详见：

因此，

教育需要尽快改变人才培养目标、培养方式、更改学习内容，

——这倒是与“新课改”的精神非常吻合！

当然，

不考试、不刷题不能应付当下的考试

可是，

只刷题、只会解题，又不能应对未来世界的挑战

——这才是当下教育中最难解决的问题！

需要老师、家长更有智慧、更有长远眼光，

能够做到既兼顾当下的学习与考试

又能帮助孩子建立适应AI时代长远挑战的能力与素养！

在这方面，新课改确实可以成为教育的指针

——老师不能满足教“知识”，更要教“专家思维方式”

——大力培养学生的思维能力、创造能力、批判性思维能力、洞察力

——大力培养学生在情境中应用知识、解决实际问题的能力

关于这一点，王珏老师也写了一篇文章，或可参考：

上一篇：技术“硬核力”驱动南城奔赴工业“新蓝海”

下一篇：朗安智能取得电机壳体气密性检测工装专利，操作简单测试准确

AI已在所有领域达到人类博士水平！那么，教育该走向何方？

相关内容

热门资讯