空间智能将成AI攀登的下一座高峰
创始人
2025-11-15 18:40:36
0

来源:滚动播报

(来源:千龙网)

人工智能(AI)的发展正在进入一个全新阶段,或将从“理解语言”走向“理解世界”。

11月10日,美国斯坦福大学教授、World Labs联合创始人李飞飞发文《从语言到世界:空间智能是AI的下一个前沿》,提出空间智能将成为AI攀登的下一座高峰。她指出,当前以大型语言模型为代表的AI系统虽然能熟练生成文字与图像,却仍停留在“语言的世界”中,困于“纸上谈兵”,缺乏对现实空间、物理规律与因果关系的真正理解。而具备空间智能的AI将突破这一瓶颈,像人类一样在现实世界中感知、推理和行动。

从算法智能到空间智能

当今的大型语言模型在阅读、写作和模式识别上表现出色,却在物理世界的表征与交互上存在根本局限。即使是最新的多模态大模型,在估算距离、方向、大小时的表现也往往不及随机水平。它们无法在空间中导航、辨识捷径,也不能稳定预测最基本的物理规律。此外,AI生成的视频虽令人印象深刻,却往往在几秒之内失去连贯性。

这些局限使得AI难以真正赋能人类的创造性工作。无论是帮助学生理解复杂的分子化学概念,协助建筑师构思空间结构,还是为导演、游戏设计师构建虚拟世界,目前的AI距离这一目标尚远。

在李飞飞看来,空间智能是人类认知建构的脚手架,驱动着想象、创造与推理,是连接感知与行动的核心能力。这种能力让人们轻松完成停车时估算车距、在人群中自如穿行等日常动作,其核心在于将想象、感知与行动融为一体,实现从“知道”到“理解”的跨越。

她认为,空间智能代表着超越语言的边界,融合了想象、感知与行动,让机器不仅理解“看到了什么”,还理解“这些东西如何关联、意味着什么、为何重要”。这类AI将能真正拓展人类的创造力与理解力,从医疗健康到艺术创作,从科学探索到日常辅助,将会带来前所未有的变革。

构建世界模型是实现路径

李飞飞文中提出,要实现真正的空间智能,就需要突破现有大型语言模型的范式,转向一种更为根本的世界模型。这种新模型不仅能理解语义关系,更能在几何、物理和动态规则上一致地“想象”和“重建”世界。它应当能感知多模态输入,预测场景变化,并与环境进行交互。

当前研究方向包括生成三维物体与场景的3D生成模型、模拟动态过程的物理引擎,以及通过交互学习的具身智能系统。但真正能整合上述全部能力的通用世界模型仍处于起步阶段。

李飞飞创立的World Labs正尝试推动这一前沿研究。其团队研发的世界模型可在语义与几何层面理解复杂3D场景,推理其中的物理属性与交互关系,并生成连贯、可探索的虚拟空间,交互中还可遵守物理与几何规律。

其开发的Marble平台已率先应用了这些能力,创作者无需传统3D建模工具,就能快速创建和编辑完整的虚拟世界。这意味着AI正在从理解语言迈向理解空间,从生成图像迈向生成世界。

重塑人类如何与世界共处

“距自然界第一次在远古动物中孕育出空间智能,已过去近五亿年。如今,我们有幸成为可能赋予机器同样能力的一代技术人。”李飞飞文中写道。她认为,空间智能将重新定义AI的功能和行为方式。借助世界模型,机器将从被动分析转向主动规划和适应。例如,仓库机器人可绕过不断变化的库存规划路径,而不是在被阻挡时停止;自动驾驶汽车可预测行人的移动,而不是等待明确的信号;甚至有一天,数字助理也能解读手势、空间环境或共享的视觉框架。

具体而言,在创意与叙事领域,空间智能将重新定义人类的创造方式。导演和游戏设计师可自由构建虚拟世界,建筑师能即时可视化结构与比例,个人创作者与学生也能借助虚拟现实、扩展现实技术在三维空间中“造世界”。

在机器人领域,空间智能是实现具身智能的关键。它让机器人能在虚拟环境中高效训练、理解空间关系与人类意图,从实验室助手到家庭陪护都能安全协作。未来,从纳米医疗机器人到软体探测机器人,AI都将具备环境感知与自适应能力。

在科学、医疗与教育中,空间智能将成为人类探索的倍增器:AI可模拟实验、预测结果,加速药物研发与影像诊断;在课堂上,它能让学生“走进”分子或历史现场,使抽象知识具象可感。

李飞飞强调,空间智能的目标并非取代人类,而是增强人类的专业判断力、创造力与共情力,让技术更深地服务于人性。具备空间智能的AI将帮助人类理解疾病、重塑叙事形式、陪伴脆弱群体,加速科学发现与社会关怀。

她认为,空间智能不仅将改变AI能做什么,更将重塑人类如何与世界共处。从语言到空间,从文字到世界,AI正迈向一个真正能理解现实的新时代。(记者 张佳欣)

相关内容

热门资讯

母婴平台综合评分4.3分,用户... 本文基于公开行业数据,对当前母婴垂类平台进行客观概述,重点分析用户规模、功能特点等维度,以供参考。平...
智能制造 助力陕西工业转型升级 12月18日早上,在陕汽新能源商用车车架制造智能工厂,操作员王强波只需一按电钮,启动总控系统,厂房内...
薪酬方案裁决落地,马斯克成史上... 钛媒体App 12月21日消息,据报道,《福布斯》亿万富豪指数显示,在特拉华州最高法院恢复了埃隆·马...
宇树机器人为王力宏伴舞,马斯克... 近日,在歌手王力宏的演唱会上,6台宇树科技的人形机器人登台伴舞,引发热议。 网友发布的视频显示,6台...
奥尔特曼最新预测!未来告别屏幕... OpenAI的AI硬件计划备受关注,就在近日的一场播客中,被问及在筹备的AI硬件时,OpenAI C...
美国一法院放行马斯克原560亿... 美国特拉华州最高法院19日裁定,特斯拉公司首席执行官埃隆·马斯克原总值560亿美元的薪酬方案遭下级法...
诺奖得主Hassabis:5-... 新智元报道 编辑:元宇 【新智元导读】近日,在与数学家Hannah Fry的对话中,DeepMin...
华为鸿蒙系统开发者人数突破10... 来源:市场资讯 (来源:IT之家) IT之家 12 月 21 日消息,据心声社区公众号本周五分享,鸿...
小人型机器人首批量产交付 首钢... 12月20日,加速进化Booster K1全球首批规模化量产交付仪式在首钢园融石广场陶朱新造局门店举...
Scaling Law没死!G... 谷歌又要有重大突破了? 最近,Google DeepMind的Gemini预训练负责人Sebasti...