henry 发自 凹非寺
量子位 | 公众号 QbitAI
想要实现AGI,技术创新和规模扩展得五五开,缺一不可。
在最新一期播客中,DeepMind掌门人哈萨比斯清晰地勾勒了他心目中通往AGI的一条现实路径:
一半靠规模扩展,另一半靠真正的科学突破。
从世界模型、模拟和智能体,一路聊到材料、超导体,甚至可控核聚变。这期播客里,哈萨比斯几乎是站在谷歌的当下,眺望AGI的全局图景。
以下是哈萨比斯的核心观点速览:
AGI实现需要创新与规模化的双重努力:约50%的努力集中在模型扩展,50%集中在技术创新,二者结合是通向AGI的关键路径。
根节点问题推动科学突破:AlphaFold的成功验证了AI解决基础科学难题的潜力,当前研究正拓展至材料科学(如室温超导体、更优电池)、核聚变及量子计算等领域。
AI在数学等领域的表现存在“锯齿状智能”现象:尽管能在国际数学奥林匹克竞赛中获奖,但在简单逻辑题上仍可能出错,反映出系统在一致性与可靠推理方面的不足,需提升其自我反思与验证能力。
当前模型依赖人类知识,未来需实现自主学习:现有大模型基于互联网知识进行压缩与泛化,类似于AlphaGo;下一步目标是实现类似AlphaZero的自我知识生成与持续在线学习能力。
幻觉问题仍待解决,需引入置信度机制:模型常在不确定时强行作答导致幻觉,未来应借鉴AlphaFold的概率评估方式,发展出能判断自身不确定性并合理拒绝回答的能力。
世界模型弥补语言模型的局限:语言难以描述空间动态与感官体验,世界模型通过模拟物理规律(如重力、流体)增强对现实的理解,对机器人、通用助手及科学模拟至关重要。
仿真环境为训练与科学研究提供新范式:通过将智能体投入由AI生成的动态世界(如Genie),可实现无限任务生成与复杂行为训练,并有望用于探索生命与意识的起源。
需警惕AI商业化带来的社会风险:避免重复社交媒体过度追求用户参与度的错误,应构建具有科学精神、适度反馈且支持个性化调节的AI人格,防止形成“单人回音室”。
工业革命的历史经验可供借鉴:AI引发的社会变革可能比工业革命更快、更剧烈,需提前规划劳动力转型、经济模式调整(如UBI)与社会治理创新,以缓解冲击。
通往超级智能的道路上尚无已知不可计算之事:目前宇宙中未发现非可计算现象,若意识不依赖量子效应,则理论上图灵机可模拟一切心智过程,信息或为宇宙最基础单元。
领导者肩负巨大责任但也充满使命感:身处技术前沿既感兴奋也感压力,尤其关注Agentic AI带来的潜在风险,并致力于推动国际合作与安全治理。
……
以下附上访谈全文,为保证可读性,量子位在不改变原意的前提下,对语言做了适当润色。
2025的进步
Hannah Fry:对AI来说,这是不平凡的一年。我们已经看到AI的重心从大语言模型转移到了智能体AI。AI不仅加速了药物研发,多模态模型也被集成到机器人和无人驾驶汽车中。你认为最大的转变是什么?
Demis Hassabis:这一年发生了太多事情,就好像把十年塞进了一年一样。对我们来说,在模型的进展上,我们刚刚发布了Gemini 3,模型的多模态能力也发展的非常好。
我想,今年夏天让我特别兴奋的事情可能就是世界模型取得了进展。我相信我们会讨论这个问题的。
Hannah Fry:我记得第一次为这个播客采访你时,你谈到了“根节点问题”(root node problems),谈到了可以利用AI来解锁下游效益的想法。我得说,你已经很好地履行了自己的承诺。你能不能给我们更新一下这些项目的进展,哪些项目即将完成,哪些项目你已经差不多解决或者接近解决了。
Demis Hassabis:当然,很明显,最有力的证据就是AlphaFold,我们即将迎来AlphaFold(至少是AlphaFold 2)向世界宣布的五周年纪念日,这简直是件疯狂的事。
我想,这证明了解决这类无根式问题是可行的。
我们正在寻找,现在也在探索其他所有的方向。比如,材料科学方面,我很想研究室温超导体,更好的电池以及其他各类更好的材料。我们也在研究核聚变。
Hannah Fry:因为这是一个新宣布的合作关系。
Demis Hassabis:是的,我们刚刚宣布与一家实力雄厚的公司建立了合作关系。我们之前就与他们有合作,但现在与Commonwealth Fusion的合作要深入得多。
我认为他们可能是至少在传统托卡马克反应堆领域最优秀的初创公司。
所以他们可能最接近拥有可行的成果,我们想帮助加速这一进程,你知道的,帮助他们在磁体中约束等离子体,甚至可能还包括一些材料设计方面的工作。
然后我们也在与量子领域的同事合作,他们在谷歌的量子AI团队中开展着令人惊叹的工作,我们正在用纠错码(error correction codes)帮助他们,在这个过程中我们使用机器学习来助力。然后也许有一天他们会帮助我们。
Hannah Fry:解锁核聚变给世界带来的改变是非常巨大的。
Demis Hassabis:核聚变一直都是圣杯。当然。我觉得太阳能也很有前景,对吧?有效地利用天空中云层里的核聚变反应堆。
但我认为,如果我们能拥有模块化聚变反应堆,这种几乎无限的可再生清洁能源的前景显然将改变一切。当然,这也是我们可以助力气候的方法之一。
Hannah Fry:如果我们能够做到,是否会让我们现有的很多问题在某种程度上迎刃而解呢?
Demis Hassabis:它开辟了很多可能性,这就是为什么我们将其视为根节点。
当然,它直接有助于解决能源、污染等问题,也有助于应对气候危机。
但如果能源真的可再生、清洁且超级便宜,几乎免费,那么许多其他事情也将变得可行,比如获取水资源,因为我们几乎可以在任何地方建造海水淡化厂,甚至还能制造火箭燃料。
大量含有氢和氧的海水。这基本上就是火箭燃料,但要将其分解成氢和氧需要消耗大量能量。
但如果能源既便宜、可再生,又相对清洁,那为什么不这么做呢?你可以一周7天24小时不断的产出。
锯齿状的智能
Hannah Fry:你也看到了,应用于数学领域的AI也发生了很多变化,许多AI在国际数学奥林匹克竞赛中赢得奖牌。然而,这些模型在高中数学中可能会犯相当基础的错误。为什么会存在这样的问题?
Demis Hassabis:是的,我觉得这实际是最迷人的事情之一,而且可能是需要解决的关键问题之一,这也是我们还未实现AGI的原因。
正如你所说,我们在其他团队中取得了很多成功,比如在国际大众奥林匹克竞赛中获得金牌。那些问题都是超级难题,只有世界顶尖的学生才能解答。
另一方面,就像我们在日常生活中使用聊天机器人所经历过的那样。如果你以某种方式提出问题,它可能会在逻辑问题上犯一些相当小的错误。
他们还不太会下像样的国际象棋,这实际挺令人惊讶的。 因此,从一致性方面来看,这些系统仍然存在一些缺失。
我认为,通用智能(而非AGI系统)应具备的特点之一是,它在各个方面都保持一致性。所以有时人们称其为“锯齿状的智能”。
现在的AI在某些事情上真的很擅长,甚至可能达到博士水平,但在其他事情上,他们连高中水平都达不到。
所以,这些系统的表现仍然非常不均衡。他们在某些方面非常出色,但在其他方面仍然相当基础。我们必须缩小这些差距。至于为什么这样,有许多不同的解释。
现在我们已经有了具备「推理时思考」能力的系统,它们愿意花更多时间思考,也更擅长组织并输出答案。
但这些思考是否真的被用来进行有效复核、以及是否能稳定地借助工具校验输出结果,目前仍不够成熟。
换句话说,我们方向走对了,但这条路大概才走了一半。
数学版本的AlphaGo
Hannah Fry:我很好奇AlphaGo和Alpha Zero的故事,在这个故事里,你去掉了所有人类经验,结果发现模型实际上得到了改进。在你们正在创建的模型中,是否存在某种科学或数学版本的那种东西?
Demis Hassabis:我认为我们今天努力构建的东西,更像是AlphaGo。
这些大语言模型、这些基础模型,本质上是从人类已有的全部知识出发——也就是我们几乎把整个互联网所承载的内容都喂给了它们——再将其压缩成一种可用的表示,从中进行检索、归纳与总结。
但我确实认为,我们仍处在一个非常早期的阶段:刚刚开始探索如何在搜索或思考之上,真正有效地使用这些能力。
某种程度上,这很像AlphaGo的做法——它并不是盲目计算,而是借助模型来引导有价值的推理轨迹和规划思路,从而在具体问题上找到最优解。
所以在我看来,当前的限制并不在于人类知识本身——我们并没有像互联网早期那样受制于“有没有内容可用”。
真正的问题在于,我们还没有完全弄清楚,如何才能像使用AlphaGo那样,稳定而可靠地驾驭这些系统。
当然,AlphaGo容易多了,因为那只是个游戏。
不过,一旦我们拥有了类似AlphaGo的系统,就可以像Alpha系列所做的那样,进一步回到一个AlphaZero式的阶段,让模型开始自行探索知识。我认为,那才是真正的下一步。
当然,这一步显然更难。因此,更现实的路径是:先构建一个可靠的、类似AlphaGo的系统作为起点,再去思考如何迈向一个类似AlphaZero的系统。
而当今系统普遍缺失的一个关键能力,正是在线学习与持续学习。
我们把模型训练好、对齐好、完成后训练,然后就让它们走向世界——但它们并不会像人类那样,在真实环境中持续地学习和更新自身。
我认为这是这些系统中另一个缺失的、对AGI来说至关重要的部分。
科学还是商业化?
Hannah Fry:当下正处在一场围绕商业产品的激烈竞争之中。但我也清楚,谷歌DeepMind的根源,始终在于以科学研究为核心的理念。
我还看到你最近说过一句话:如果按照你的设想,我们可能会把AI更长时间地留在实验室里,多做一些像AlphaFold这样的事情,甚至有可能在癌症等重大问题上取得突破。
那你觉得,我们当初没有选择那条更慢一些、但更偏研究的路线,是不是也错过了一些本该发生的东西?
Demis Hassabis:我觉得这是一个有得有失的过程。就我个人而言,我一直认为应该投入更多纯粹的科学研究。至少,这正是我在十五、二十年前最初的设想。
那时,几乎还没有多少人在认真研究 AI,我们才刚刚起步,正准备创立 DeepMind。在很多人看来,这几乎是一件疯狂的事情,但我们自己是深信不疑的。
当时的想法很简单:如果想真正取得进展,就必须一步一步、谨慎地朝着 AGI 推进,认真对待每一个阶段以及相关的安全问题,努力理解系统究竟在做什么、为什么会这么做。
但与此同时,你并不需要等到AGI真正出现,才发现它的价值。你完全可以从这项技术中分化出不同分支,以切实有益于社会的方式加以应用,推动科学与医学的进步。
实际上,我们在AlphaFold上所做的,正是这种尝试。它本身并不是一个基础模型或通用模型,但使用了同样的核心技术——比如Transformer——并将其与特定领域的知识深度结合。
因此,我设想的是,在通往AGI的过程中,能够陆续完成一系列类似的成果。这本身是一场巨大的赌注。
就像AlphaFold那样,把研究成果直接交付给世界,甚至去触碰诸如“治愈癌症”这样的重大问题——而与此同时,我们仍然在实验室中,持续推进更偏向 AGI 本身的研究。现在事实证明,大规模的聊天机器人是可行的,而且人们发现它们很有用。
然后,它们现在已经演变成了这些基础模型。显然,这些模型能做的远不止聊天和文本处理,其中就包括Gemini。他们可以处理图像、视频以及各种事。
而且这在商业和产品方面也都非常成功。我也喜欢这一点。
就像我一直梦想拥有一个终极助手,它能在日常生活中帮助你,让生活更高效,甚至还能帮你节省一点注意力,让你集中精力、进入心流状态等等。
在如今这个社交媒体时代,一切都只是噪音。我认为实际上对你有用的AI可以在这方面帮助我们。不过,这造成了一种相当疯狂的竞争态势,众多商业组织,甚至国家都在竞相提升并试图超越彼此。
这也使得同时开展严谨的科学研究变得困难。我们努力兼顾两者,把握好这种平衡。
另一方面,事情这样发展也有很多好处,有更多资源流入这个领域,这无疑加速了进展。
而且我觉得,这一点对普通大众来说其实非常有意思。在可使用的技术层面,他们往往只比最前沿落后几个月而已。
这意味着,几乎每个人都有机会亲身体验AI的未来形态。我认为这本身是一件好事,也能让各国政府在实践中逐步加深对这项技术的理解。
Scaling并未放缓
Hannah Fry:去年这个时候,我觉得有很多关于Scaling遇到瓶颈,以及数据耗尽的讨论。然而,Gemini 3刚刚发布,它在一系列不同的基准测试中处于领先地位。这是如何做到的呢?不是说Scaling会遇到问题,会碰到瓶颈吗?
Demis Hassabis:我想很多人确实是这么认为的,尤其是在一些公司进展相对放缓的背景下,容易得出这种判断。
但在我看来,我们其实从未真正遇到过所谓的那堵“墙”。也许确实存在收益递减,但当我这么说时,很多人会误以为这就等同于“没有收益”。
现实并不是非黑即白的。人们常常把进展理解成两种极端:要么是指数级增长,要么就是彻底停滞、渐近不前。
但事实上,这两种模式之间存在着非常大的中间地带,而我认为我们正处在这个区间里。
所以,并不是每一次新版本发布,所有基准测试的成绩都会翻倍。
也许在很早的时候——三四年前——确实出现过那样的阶段,但即便现在,进步依然是真实而显著的。
就像我们在Gemini 3上看到的那样,这些改进完全值得持续投入,其投资回报依然可观,而且在这一点上,我们还没有看到任何明显放缓的迹象。
当然,也确实存在一些挑战,比如我们是否会耗尽可用的数据。但这些问题并非无解。
例如,合成数据生成系统已经足够成熟,可以开始生成自己的数据。在某些领域——尤其是编程和数学——由于答案在一定程度上是可验证的,这意味着你几乎可以持续地产生新的、高质量的数据。
归根结底,这些都是研究问题。而我认为,这正是我们一贯以来的优势所在:始终坚持研究优先的理念,并且拥有最广泛、最深入的研究团队。事实也一直如此。
如果你回顾过去十年的进展,无论是Transformer、AlphaGo、AlphaZero,还是我们刚刚讨论过的其他任何事物,它们都出自谷歌或DeepMind。
所以我一直认为,如果需要更多真正的创新,尤其是科学层面的创新,这里依然是最合适的地方。过去十五年中,许多重大的突破正是在这里发生的,而这一点并没有改变。
事实上,我甚至很享受事情开始变得艰难的阶段。因为到了那个时候,问题就不再只是世界级的工程能力所能解决的了。你必须依靠真正的研究和科学本身,而这正是我们的强项。
你需要依靠自己,而这本身就已经足够困难了。但你必须将其与世界一流的研究和科学相结合,而这正是我们的专长所在。
除此之外,我们还拥有世界级基础设施的优势,包括我们长期大量投资的TPU等。
我认为,正是顶级研究能力与顶级基础设施的结合,让我们既能站在创新的最前沿,也能把成果规模化落地。
某种意义上说,我们大约一半的精力放在扩展上,另一半放在创新上——而我敢打赌,想要实现AGI,这两者缺一不可。
Hannah Fry:即使在Gemini 3中,我们仍然能看到的一个一个明显的问题——幻觉现象依然存在。换句话说,在某些本应拒绝作答的情境下,模型仍然会给出看似合理的答案。我们是否能够为这样的系统引入一种机制,让Gemini像AlphaFold那样,对自己的输出给出明确的置信度评分?
Demis Hassabis:是的,我认为我们确实需要这样的机制。这在某种程度上正是当前系统中缺失的一环,不过我觉得我们已经在逐渐接近这个目标了。
随着模型变得越来越完善,它们也会在某种意义上更清楚自己“知道什么、不知道什么”。
如果这种说法成立,那么一种更可靠的路径就是:让模型在推理过程中进行一定程度的自我反省、投入更多思考,并能够主动意识到自己存在不确定性,甚至判断“这个问题本身就不确定”。
接下来真正困难的部分在于训练——如何让模型把这种不确定性,作为一种合理且被允许的输出表达出来,而不是被迫给出一个看似确定的答案。
我们在这方面已经取得了一些进展,但你也知道,模型有时仍然会在本不该回答的情况下强行作答,而这往往正是幻觉产生的来源。我认为,目前相当一部分幻觉都属于这一类型。
所以,这里确实存在一个尚未补齐的关键环节,而且在某种程度上必须被解决。
你说得没错,我们已经在 AlphaFold 中成功处理过类似的问题,只不过那是在一个更加受限、更加可控的应用场景下。
Hannah Fry:可不可能有一种在背后衡量下一个token可能是什么的方法?
Demis Hassabis:是的,它确实是在预测下一个标记——事情本身就是这样运作的。
但这并不会告诉你一个更关键的问题:你对整个判断、整段陈述本身到底有多大信心?
这正是我们需要引入这些机制的原因。我认为,我们必须让模型运用更明确的思考步骤和规划步骤,去回顾和审视自己刚刚给出的输出。
目前的系统在某种程度上,就像是在和一个状态不太好的人对话——他们只是把脑海中冒出的第一件事直接说出来。
大多数时候这没什么问题,但一旦遇到真正复杂或困难的情形,你往往希望对方能停下来,稍作思考,回头检查一下自己要表达的内容,甚至重新调整措辞。
这种对话方式在现实世界中或许正变得越来越少见,但它依然是更好的交流方式。而我认为,这正是这些模型接下来需要显著提升的能力之一。
Genie和仿真
Hannah Fry:我其实也很想和你聊聊模拟世界以及在其中放置智能体的问题——因为我们确实应该找你的Genie团队好好谈一谈。
你为什么如此关心模拟?在你看来,什么样的世界模型,是语言模型本身做不到的?
Demis Hassabis:实际上,除了AI本身之外,最让我抱有热情的就是世界模型和模拟了。而这一点,在我们最近的工作Genie中得到了非常直接的体现。
我确实认为,语言模型对世界的理解能力已经相当惊人,甚至超出了我们最初的预期。
某种程度上,这是因为语言本身可能比我们想象得更加丰富,它对世界的映射能力,也比我们——甚至比语言学家——过去所设想的要强得多,而这些新系统已经证明了这一点。
但与此同时,关于世界的空间动态——比如空间感知、物理环境,以及物体如何在其中以机械方式运作——仍然有大量内容是难以用语言描述的,而且通常也不会出现在语料库中。
这在很大程度上与经验式学习有关,尤其是来自在线、真实体验的学习。有很多东西,你其实根本无法准确描述,只能亲身去体验。
无论是运动的角度、触觉反馈,还是气味等感官信息,这些通过传感器获得的体验,几乎都无法被完整地转译成语言。
正因如此,如果我们真的希望机器人技术发挥作用,或者希望出现一种通用助手。
也许通过眼镜、手机,陪伴你在日常生活中,而不仅仅局限在电脑屏幕前,那么这种对世界的理解就必不可少。
而世界模型正是这一切的核心。
当我们谈论世界模型时,指的是那种能够理解世界运行机制中因果关系与协同效应的模型,也就是一种“直观物理学”:事物如何运动、如何相互作用、如何表现。
你已经可以在当前的视频模型中看到这种能力的雏形。
而检验是否真正具备这种理解的一种方式是:你是否能够构建一个逼真的世界。因为如果你能够生成它,那么在某种意义上,你就已经理解并内化了这个系统的运作规律。
这也正是为什么 Genie、Veo 以及这些模型首先以视频模型的形式出现。我们正在构建的这种交互式世界模型,确实令人印象深刻,也是在向“通用世界模型”迈出的关键一步。
我希望,未来我们能将它们真正应用到机器人技术和通用助理领域。
当然,某个时候,我也一定会把这些能力重新带回到游戏和游戏模拟中——然后,去创造一款终极游戏。
Hannah Fry:科学方面呢?
Demis Hassabis:在科学的复杂领域构建模型——无论是原子层面的材料、生物学,还是像天气这样的物理现象——都需要一种关键方法:构建模拟,并从原始数据中学习这些系统的动态。
比如,你拥有大量关于天气的原始数据,然后训练一个模型,使它能够理解并在一定程度上重现这些动态,而且效率更高。
本质上,这就是用“蛮力”去捕捉复杂系统的规律。因此,我认为模拟与世界模型拥有巨大的潜力,尤其适合用于科学和数学中某些高度专业化的建模任务。
Hannah Fry:你也可以把一个智能体放入那个模拟环境中,对吧?
你的Genie 3团队有一句非常精彩的话,“几乎所有重大发明的前提条件都不是在构思该发明时就已具备的”。
他们正在讨论将智能体投放到这些环境中并让它们执行任务,所以好奇心在某种程度上是他们的主要动力。
Demis Hassabis:这些世界模型还有一个非常令人兴奋的用途,就是用于智能体的模拟。我们有一个名为SIMA的项目,专门用来做这件事。
在SIMA中,你可以创建一个虚拟化身或智能体,并把它放入一个虚拟世界里。
这个世界可以是一款普通游戏,也可以是商业级的大型游戏——比如 无人深空 这样高度复杂的开放世界太空游戏。
接着,你可以直接对这个智能体下达指令。因为它内置了Gemini,你能够像与人对话一样,与智能体交流并分配任务。
后来我们开始想:如果把Genie接入SIMA,再把这个SIMA智能体放进一个由AI实时生成的世界里,会发生什么?
于是现在,你就看到了两个 AI 在彼此的“思维”中产生互动。SIMA 智能体在努力理解并探索这个世界,而对Genie来说,SIMA 只是一个玩家,世界则围绕着这个玩家的行为不断被即时生成。看着这两个系统相互作用,本身就非常神奇。
我认为,这很可能是一个全新训练循环的起点。在这个循环中,你几乎拥有无限的训练样本——因为无论 SIMA 想学什么,Genie都可以即时为它构造出对应的世界与任务。
你可以想象,一个自动设定任务、自动生成环境、自动求解的完整系统,能够在没有人工干预的情况下处理数以百万计、且难度不断提升的任务。
显然,这样的智能体本身就可以成为非常出色的游戏伙伴;而它们在这个过程中学到的能力,也很可能会迁移到更现实的场景中,比如机器人技术等领域。
Hannah Fry:没错,无聊的非玩家角色(NPC)时代结束了。
Demis Hassabis:没错。这些游戏肯定会很棒。
Hannah Fry:在那里创造的那些世界,你如何确保它们真的具有现实感?如何确保不会得出看似合理但实际上错误的物理学结论呢?
Demis Hassabis:这是一个很好的问题,本质上又回到了幻觉的问题上。
有些幻觉实际上是有益的。它意味着模型可能创造出新颖、有趣的东西。
在做创造性任务时,我们希望系统能生成新的想法或方案。在某种意义上,这也是一种“有意的幻觉”。但你肯定不希望它产生错误的物理幻觉,对吧?
当我们尝试训练类似的智能体时,目标是让它们在物理世界中可靠工作。
因此,我们目前做的几乎就是创建一个物理基准:用高度精确的物理模拟游戏引擎生成大量简单的实验场景,就像在A级物理实验课程中做的小实验——让小球沿不同轨道滚动,观察速度和碰撞。
从基础层面看,这相当于剖析牛顿三大定律。无论是Veo还是Genie,它们都还没有完全精确地封装物理原理,目前只是近似。表面上看很逼真,但还不足以直接应用于机器人技术。
所以下一步,就是像我们在所有模型中做的一样:减少幻觉,提高可靠性。
对于物理学,这可能需要生成大量真实数据,例如简单的钟摆视频。你可能知道两个钟摆相互环绕的行为,但很快就会遇到三体问题,而三体问题本质上是无解的。
尽管如此,令人惊叹的是,当你观察像 Veo 这样的视频模型,以及它处理反射和液体的方式时——至少从肉眼来看,它的精确度已经高得令人难以置信。
所以下一步,就是超越人类业余观察的能力——让模型真正经得起严格的物理实验检验。
仿真中的进化
Hannah Fry:你已经思考这些模拟器很长时间了。我回去看了我们第一次访谈的文字记录,其中你非常认同一种观点:意识是进化的产物。
你当时提到,在我们进化历史的某个阶段,能够理解他人的内在状态曾经是一种优势,而这种对他人的理解,后来又被我们反过来用于理解自身。
这是否让你对在模拟环境中运行一种类似进化中的智能体感到好奇?
Demis Hassabis:我的意思是,我非常希望有一天能够做这样一个实验:在某种程度上重新运行进化过程,甚至几乎重现所有社会动态。
这让我想起圣达菲过去常在小型网格世界上做的许多有趣实验。我曾经对其中一些大型组织非常着迷——它们大多由经济学家组成,试图建立微型人造社会。
他们发现,如果让参与者在精心设计的激励机制、市场和银行等复杂环境中运行足够长的时间,就会涌现出各种有趣的行为和现象。
我觉得这不仅很酷,而且有助于探索生命与意识的起源。从一开始,我之所以投身 AI 工作,其中一个主要热情就是:我希望拥有工具来真正理解我们从何而来,以及这些现象本质是什么。
在我看来,模拟是实现这一目标的最强大工具之一。通过统计方法,我们可以在可控条件下重复运行模拟,每次使用略有不同的初始状态,甚至可能运行数百万次,从而以一种非常系统化的方式理解细微差异的作用。
当然,对于我们想回答的任何真正有趣的问题,在现实世界中做到这一点几乎不可能。所以我相信,精确模拟将为科学带来难以想象的巨大价值。
Hannah Fry:考虑到我们对这些模型的涌现特性的发现,我觉得我们在运行这个或进行模拟时,是否也得相当谨慎呢?
Demis Hassabis:确实如此,而这本身也是模拟的另一个重要优势。你可以在相对安全的沙盒环境中运行这些系统,必要时甚至可以对它们进行隔离。
同时,你能够对模拟进行全天候的监测,并访问其中产生的所有数据。从这个角度看,模拟环境在可控性和可观测性上,远远优于现实世界。
不过,问题在于这些模拟本身会变得极其复杂。当你设想大量AI同时在模拟环境中运行时,任何人类科学家都几乎不可能跟上其中发生的一切。
关于AI泡沫
Hannah Fry:上次我们交谈时,你说你认为AI在短期内被过度炒作,但从长期来看却被低估了。我知道今年有很多关于AI泡沫的讨论,如果出现泡沫并破裂会怎样?此后会发生什么。
Demis Hassabis:我依然认为,AI在短期内被过度炒作,而在中长期却被系统性低估。它将带来的变革规模,远比现在大多数讨论所能触及的要深刻。
现在确实有很多关于“AI 泡沫”的争论,但在我看来,这并不是一个非黑即白的问题。
AI生态中的某些局部可能存在泡沫——比如一些几乎尚未起步的初创公司,在种子轮阶段就拿到极高估值,这种情况能持续多久,本身就值得观察。人们真正担心的,其实是这一块。
至于大型科技公司的估值,情况要复杂得多。虽然仍有不确定性,但背后确实有真实业务和长期投入在支撑。
回过头看,几乎所有真正具有颠覆性的技术,都会经历类似过程——从一开始的反应不足,到后来的过度反应。AI可能是其中最深刻的一次。
当年我们开始做DeepMind时,几乎没有人相信这件事是可行的。快进十年、十五年后的今天,它却成了商业世界几乎唯一在讨论的话题。这本身,就是从“低估”到“过热”的自然摆动。
我们在互联网时代、移动互联网时代都见过这一幕,而现在,AI 也正在——或即将——重复同样的路径。
但就我个人而言,我并不太担心“我们是不是正处在泡沫中”。因为我所负责的是谷歌DeepMind,而它本身又是Alphabet旗下谷歌的一部分。
我的工作,是确保无论外部环境如何变化,我们始终保持足够强的技术与研究能力。从这个角度看,我们的定位非常稳固,而且可以说是极其有利的。
如果AI按照现在的速度继续发展,那当然再好不过——我们会继续推进实验、产品和通往 AGI 的长期研究;如果市场出现调整、甚至裁员,也不会改变这一点。
我们之所以处在有利位置,是因为我们拥有完整的体系:自研的TPU,以及一整套成熟且规模巨大的产品生态。
无论是搜索正在被AI概览和搭载Gemini的新模式重塑,还是YouTube、工作区、邮箱,乃至Chrome中不断涌现的AI功能,我们已经看到了大量真实、可落地的价值创造。
当然,也会有新产品出现——比如 Gemini 应用和通用助手的形态,假以时日,它们可能非常有价值。但关键在于:我们并不依赖“押中新产品”才能成功。
仅仅通过提升现有生态系统的效率和能力,就已经能创造巨大价值。而在某种程度上,这正是过去一年里已经发生、而且我们现在做得越来越好的事情。
构建AI伦理
Hannah Fry:我知道你最近说过,不把构建AI的目标设定为最大化用户参与度是多么重要,这样我们就不会重蹈社交媒体的覆辙。人们花大量时间与聊天手机交流,最终陷入自我极化的状态。
你要怎么阻止那件事?如何构建以用户为中心的AI?从很多方面来说,这在某种程度上正是其意义所在,但又不会形成单一观点的回音室。
Demis Hassabis:这是一种非常、你知道的、需要谨慎把握的平衡,我认为这是我们整个行业必须做好的最重要的事情之一。
我觉得我们已经看到了一些过于谄媚的系统会出现什么情况,或者说,你会遇到那种对人非常有害的回音室强化效应。
所以我认为其中一部分,实际上也是我们想用Gemini构建的东西。
我对我们有一个很棒的团队在打造的Gemini角色非常满意,我个人参与了两个,它就像是一种近乎科学的人格,既热情又乐于助人,而且简洁明了,还会以友好的方式反驳那些不合理的事情。
与其强化你认为地球是平的这个观点,并且你还说这是个绝妙的想法,我认为总体上对社会没什么好处。
但你得在这与人们的需求之间找到平衡,因为人们希望这些系统能提供支持,对他们的想法和头脑风暴有所帮助。
我觉得我们正在发展一门关于个性和角色的科学,比如如何衡量它的作用,以及我们希望它在真实性、幽默感等方面达到什么样的程度。
然后你可以想象,它自带一种基本人格。然后每个人都有自己的偏好。
比如希望它更幽默些、没那么幽默,还是更简洁些、更冗长些呢?
人们喜欢不同的东西,所以也在上面添加了额外的个性化层。但仍有一个大家都能理解的核心人格,那就是努力坚持科学方法,而这正是这些的关键所在。
如果我们希望人们将这些用于科学、医学和健康问题等方面。所以我认为这是正确运用这些大语言模型的科学的一部分。我对我们目前的发展方向相当满意。
AGI
Hannah Fry:让我们来具体谈谈AGI。在目前AI领域发生的所有事情中,包括语言模型、世界模型等等,什么最接近你对Agi的愿景?
Demis Hassabis:我认为关键在于这样一种能力的组合:显然有 Gemini 3,它本身已经非常强大;而就在上周,我们还推出了Nana Banana Pro,也就是图像创作工具的高级版本。
真正令人惊叹的是,它的底层同样由Gemini驱动——这意味着它不仅能“看见”图像,还能在语义层面理解图像中正在发生什么。
人们接触它才短短一周,我已经在社交媒体上看到很多非常酷的用法。比如,你可以给它一张复杂结构的示意图,它不仅能标注出所有不同部件,还能把它们清晰地可视化,让整体结构一目了然。
它似乎对力学、物体的组成方式、材料属性等都有相当深入的理解;再加上它如今已经具备非常强的文本处理能力,这在某种意义上,正在朝着一种“用于成像的 AGI”迈进。
我认为,这正在形成一种真正通用的系统——能够处理图像领域中的几乎所有任务。这本身就非常令人兴奋。
与此同时,还有世界模型方向的进展,比如Genie、SIMA,以及我们在相关方向上的一系列工作。
最终,我们需要做的,是把这些目前看起来彼此独立、却又相互交织的项目整合起来,将它们统一进一个更大的模型之中。
到那一步,这个系统或许就会开始成为一种原生AGI的候选形态。
Hannah Fry:你最近读了不少关于工业革命的资料。是否有一些事情是我们可以从那里发生的情况中学到的,从而尝试减轻AGI预期会出现的某些麻烦?
Demis Hassabis:我认为我们有很多可以学习的地方。这是你在英国学校里多少会学一点的东西,但只是非常肤浅的层面。 对我来说,探究这一切是如何发生的、它的起源、背后的原因,以及像纺织业这样的内在原因,真的很有意思。
最初的计算机实际上就是缝纫机,对吧?然后它们变成了早期Fortran计算机(大型机)的穿孔卡片。
有一段时间,它在英国非常成功,成为了纺织业的中心,因为自动化系统使他们能够以极低的成本生产出令人惊叹的高质量产品。然后蒸汽机等一系列发明相继出现。 我认为工业革命带来了许多令人惊叹的进步。儿童死亡率下降,所有现代医学和卫生条件、工作与生活的分工方式以及这一切的运作模式,都是在工业革命期间逐渐形成的。
但这也带来了许多挑战,比如这一过程耗时颇长,大约一个世纪,劳动力的不同部分在某些时期出现了错位,然后必须创造新事物,必须创建像工会这样的新组织和其他事物,以重新平衡这种局面。
就这样,看到整个社会都不得不加班加点地适应,真是非常有趣。然后你就来到了现代世界。
我想,工业革命显然有很多利弊,它为何会发生,但如果你想想它总体上带来的成果,比如西方世界丰富的食物、人口,还有现代医学、现代交通等所有这些,就没人会否认这一切都归功于工业革命。
所以我们不想回到工业革命前的时代。但也许我们可以通过从中学习,提前弄清楚那些麻烦是什么,也许这次能更早或更有效地减轻这些麻烦。
而且我们可能必须这么做,因为这次的不同之处在于,它的规模可能比工业革命大10倍,而且发生的速度可能快10倍。所以更像是在十年内展开,而不是一个世纪。
Hannah Fry:当前的资本体系能够有效地让你用劳动换取资源。在通用人工智能(AGI)之后的社会中,它的运作方式将大不相同。你是否有一个愿景,即社会应该如何重新构建,或者以一种可行的方式进行重新构建?
Demis Hassabis:我现在花更多时间思考后通用人工智能(AGI)时代可能是什么样子,以及我们需要为此做哪些准备。
我认为,总体而言,社会各界,包括经济学家、社会科学家和政府,都需要花更多时间思考这个问题。
就像工业革命一样,整个工作世界、工作周以及一切都从工业革命前的状态发生了改变,那时更偏向农业。而且我认为至少那样程度的变化会再次发生。如果我们需要新的制度、模型来从根本上助力这一转型,并确保例如福利得到广泛分配,以及诸如普遍基本收入之类的措施成为解决方案的一部分,我不会感到惊讶,但这并非全部。
我想这就是我们目前所能模拟出来的,对吧?
因为这几乎是对我们现有内容的补充。
但我认为可能存在更直接的更好的系统。民主类型的系统,在这种系统中,你可以用一定数量的积分或其他方式投票,来决定你希望在当地社区层面实际发生的事情。
这儿有一大笔钱。你希望学校有一个操场、网球场还是一间额外的教室?
然后你让社区对其进行投票,对吧?所以它,然后也许你甚至可以衡量结果,然后那些能够始终如一地为最终更受欢迎的事情投票的人,在下次投票中会有相应更大的影响力。 这里有很多有趣的东西。我的一些朋友正在集思广益探讨这个问题。
如果我们在这方面做更多的工作,那将非常棒。然后还有其哲学层面的问题。
比如,工作会发生变化,诸如此类。但话说回来,也许到那时核聚变问题就已经解决了。所以我们拥有这种丰富的自由能源,进入后稀缺时代。那么钱会怎样呢?也许每个人的生活都变好了,但这样一来,人生目标又会怎样呢,对吧?
因为很多人从工作中找到人生目标,然后养家糊口,这是非常高尚的目标。
所以,你知道的,如果是这样的话,我认为其中一些问题从经济问题逐渐演变成了近乎哲学性的问题。
图灵机
Hannah Fry:从长远来看,在超越AGI(通用人工智能)并迈向ASI(超级人工智能)的过程中,有哪些人类能做到而机器永远无法做到的事情?
Demis Hassabis:我觉得这是一个非常大的问题,它和我最着迷的话题之一图灵机直接相关。
如果有一天我们构建出了 AGI,并把它当作一种心智的模拟,再把这种“人工心智”和真实的人类心智进行对照比较,我们也许就能看清它们之间真正的差异,甚至由此发现人类心智中那些独特、尚未被复制的“剩余特质”。
那可能是创造力,也可能是情感,甚至可能是梦境。
在意识层面,有大量问题仍然悬而未决,其中一个核心争论就是:到底有哪些东西是可计算的,又有哪些不是。
这自然会把我们带回到图灵机的问题上:图灵机的极限究竟在哪里?
说实话,这几乎是我一生中反复思考的核心问题。从我第一次理解Alan Turing和图灵机开始,它就一直萦绕在我心里。
在某种意义上,我们今天所做的一切工作,都是在不断把图灵机能力的边界向前推进——比如蛋白质折叠这样的事情。
但问题在于:我并不确定那个终极极限是否真的存在。也许根本就没有。
当然,量子计算领域的朋友会说,经典计算存在根本局限,你必须使用量子计算机才能真实处理量子系统。但对此,我其实并不完全确信。
我确实和一些量子领域的专家讨论过这个问题,也许我们只是需要来自量子系统的数据,然后在经典计算框架下构建一个足够精确的模拟。
于是问题又回到了原点:这一切究竟是否仍然属于经典计算的范畴,还是说其中确实发生了某种本质上不同的过程?
就像彭罗斯所认为的那样,如果大脑中确实存在某种关键的量子效应,而意识正是与这种效应紧密相关的,那么机器,至少是经典机器,也许永远无法真正拥有意识。除非,我们等来真正成熟的量子计算机。
但如果事实并非如此,如果大脑中并不存在这种不可计算的量子机制,那么也许就根本没有什么硬性的限制。也许,宇宙中的一切最终都是可以被计算和处理的。
如果你从这个角度看问题,那么图灵机或许具备一种极其深远的潜力——它也许能够对宇宙中的一切进行建模。
我现在和你坐在这里,说实话,我个人的直觉是倾向于这一种可能。至少,在物理学明确证明事实并非如此之前,我都会以这个假设为基础,继续我的工作。
Hannah Fry:所以在这类计算中,没有什么是做不到的。
Demis Hassabis:到目前为止,人类在宇宙中还没有发现任何真正不可计算的事物,对吧?
而且我认为,我们已经在实践中展示了,经典计算系统的能力可以远远超出复杂性理论学家传统上所设想的边界——比如围绕P与NP的那些直觉判断。
你看看我们今天在经典计算机上已经做到的事情:蛋白质折叠、围棋、复杂感知系统……这些在过去都被认为几乎不可能。
所以在我看来,没有人真正知道那个极限究竟在哪里。
如果你要用一句话来概括我们在DeepMind和Google所做的一切,那就是:不断向前推经典计算的能力边界。
而我个人正在尝试做的事情,就是去寻找——或者逼近——那个最终的极限。
Hannah Fry:但如果把那种想法推到极限,对吧——我们此刻坐在这里,脸上能感受到灯光的温暖;隐约能听见背景中机器运转的声音;双手放在桌面上,能清楚地感知到它的触感。
是的,这一切体验,原则上都可能是可复制的,并且可以通过经典计算的方法来实现。
Demis Hassabis:我对这件事的看法,其实也正是我喜欢康德的原因之一——以及我最喜欢的两位哲学家:康德和斯宾诺莎。
康德认为,现实在某种意义上是由心灵所构建的。我觉得这一点是成立的。
所以,没错,你提到的所有这些东西——它们进入我们的感官系统,呈现出完全不同的体验,对吧?光线、光的温暖,热的感觉,桌子的触感。
但归根结底,这一切都是信息,而我们本身就是信息处理系统。
我认为,这正是生物学的本质,也是我们试图通过同构去实现和理解的目标。在我看来,最终治愈所有疾病的方式,很可能就是把生物学真正理解为一个信息处理系统。
甚至在更根本的层面上,这也指向了我在业余时间、在那零碎的几分钟里反复思考的一个问题:信息是否才是宇宙中最基本的单位——不是能量,也不是物质,而是信息本身。
如果是这样,那么最终这些东西或许都是可以相互转化的。只是我们以不同的方式去感知它们、体验它们。
但至少据我们目前所知,我们所拥有的这些令人惊叹的感官系统,本身仍然都是可以由图灵机来计算和模拟的。
Hannah Fry:这就是为什么你们模拟的世界如此重要。
Demis Hassabis:没错。因为这将是实现它的途径之一。我们能够模拟的极限是什么?因为如果你能模拟它,那么从某种意义上说,你已经理解它了。
领先是什么滋味?
Hannah Fry:想以一些个人感悟来收尾,谈谈身处这一前沿领域是怎样的体验。我的意思是,这件事的情感分量。是的。每当你情绪低落的时候,是否会感到相当孤立无援?
Demis Hassabis:我睡得并不多,一方面是因为工作实在太多,另一方面我本身也有睡眠问题。要消化和处理这些情绪其实非常复杂,因为它们又令人兴奋到难以置信。
你知道吗,从某种意义上说,我正在做的,几乎就是我一直以来梦想做的一切。我们站在科学的最前沿,在很多方面同时推进应用科学和机器学习。
正如所有科学家都知道的那样,站在前沿、第一次发现新事物的那种感觉是极其令人振奋的。而对我们来说,这样的时刻几乎每个月都会发生一次,这真的非常神奇。
当然,我和谢恩,以及其他长期投入其中的人,可能比任何人都更清楚这种感受。
同时,即将到来的事情所具有的分量,以及它所伴随的问题,其实仍然远未被充分理解。
在未来十年的时间尺度上,将会发生很多事情——包括哲学层面的问题:作为人类意味着什么?什么才是真正重要的?这些问题都会被重新摆到台面上。
所以,这是一项巨大的责任。但幸运的是,我们有一个非常优秀的团队,正在认真思考这些问题。
对我个人而言,人工智能几乎就是我这一生都在为之做准备的事业。从小时候下国际象棋开始,到后来进入计算机领域,再到游戏、模拟以及神经科学的研究,这一切都在一步步指向这一刻。
事情的发展,大体上正如我曾经想象的那样。所以在某种意义上,我应对这一切的方式,其实就是训练本身。
Hannah Fry:不过,其中是否有某些部分给你的冲击比你预期的更大呢?
Demis Hassabis:是的,当然。其实就连 AlphaGo 的比赛也是如此,对吧?你知道,仅仅是看到我们最终成功攻克围棋这件事本身,就已经足够震撼了。
围棋曾经是一个如此美丽、如此神秘的存在,而它的被攻克,在某种意义上改变了一切。所以那种感觉既令人兴奋,又带着一点苦涩与甜蜜交织的复杂情绪。
我想,语言、成像这些相对较新的领域也是一样的问题——它们究竟对“创造力”意味着什么?
我对创意艺术一直怀有极大的敬意和热情。我自己做过游戏设计,也和电影导演有过很多交流。对他们来说,这同样是一个非常微妙、甚至有些矛盾的时刻。
一方面,这些工具确实令人惊叹,它们可以把创意原型的制作速度提升十倍;但另一方面,它们是否也在取代某些原本属于人的创造性技能?
所以我认为,这种权衡几乎无处不在。而对于像AI这样强大、具有深远变革性的技术来说,这种张力几乎是不可避免的——就像过去的电力、电话和互联网一样。
我们都知道,人类的故事本质上就是:我们是会制造工具的动物,而这正是我们一直以来最喜欢做的事情。
出于某种原因,我们还恰好拥有一颗能够理解科学、并持续推进科学的头脑。这本身就已经足够令人惊叹,而且还伴随着几乎无穷无尽的好奇心。
我想,这也许就是“作为人类”最核心的意义所在。我从一开始似乎就有这种“毛病”。而我试图回应这个问题的方式,就是去构建AI。
Hannah Fry:当你和其他AI领袖们同处一室时,你们之间是否有一种团结感,一种大家都清楚利害关系、真正理解这些事情的团结感?还是说竞争在某种程度上让你们彼此疏远了呢?
Demis Hassabis:我们彼此其实都认识。我和他们中的大多数人关系都还不错,当然,也有一些人彼此之间并不怎么合得来。
这件事之所以困难,在于我们正身处人类历史上最激烈的一轮资本主义竞争之中。
你可能也听说过——我那些经历过互联网泡沫年代的投资人和VC朋友都说,从很多方面来看,这一次的竞争强度比当年要凶猛、激烈十倍。
说实话,我并不排斥这种环境。我喜欢竞争,我几乎是在竞争中长大的,从很年轻的时候开始就是这样。
但退一步说,我也希望大家能意识到:现在真正面临风险的,远不只是某家公司谁来接班、谁赢谁输这样的问题。
有一些事情,比企业的兴衰、比个人或公司的成败,要重要得多。
Hannah Fry:当谈到未来几十年,当你仔细思考时,是否有一些重大时刻即将到来,而你个人对此最为担忧?
Demis Hassabis:我觉得目前这些系统,本质上还是被动系统。
作为用户,你输入能量——也就是问题或任务——系统再返回给你一些总结或答案。在很大程度上,这个过程仍然是由人类主导的:投入的是人类的精力、人类的判断和人类的意图。
下一阶段将是基于智能体(agent)的系统。我认为我们已经开始看到它们的雏形了,只是现在还非常原始。
在接下来的几年里,我预计会出现一些真正令人印象深刻、而且足够可靠的产品。如果把它们当作助手来看,它们会非常有用、功能也会极其强大。但与此同时,它们也会变得更加自主。
正因如此,这类系统带来的风险也会显著上升。这也是我非常担心的地方——两三年之后,这些系统可能造成的影响不容忽视。
所以我们已经在着手进行网络防御方面的工作,为一个全新的世界做准备:在那个世界里,可能会有数百万个智能体在互联网上自主行动、相互交互。
Hannah Fry:你最期待的是什么?我的意思是,会不会有一天,你能在某种程度上知道自己的工作已经完成,然后退休呢?还是说,要做的工作比一生的时间还多?
Demis Hassabis:是啊,我一直觉得,嗯,我肯定需要休个学术假。
我会像这样度过,没错,休息一周甚至一天都很好。但我认为我的使命一直都是,某种程度上帮助世界为全人类安全地引领AGI跨越界限。
所以我认为当我们到达那个阶段时,就会有超级智能、AGI,还有我们正在讨论的所有与社会相关的本土事物。
事情,也许我能在某些方面提供帮助,但我认为这将是我使命的核心部分。如果这能更进一步,我的人生使命就算完成了,我是说,这只是个小任务,你知道的,就是让它达标,或者帮助世界让它达标。
而且,我认为这需要合作,就像我们之前谈到的那样,而我是一个很善于合作的人。所以我希望能从我的职位出发,为解决这个问题出一份力。
Hannah Fry:然后你就可以去度假了。
Demis Hassabis:是的,平衡工作和生活。