AIPress.com.cn报道
10月12日消息,据金融时报报道,埃隆·马斯克的 xAI 正在努力构建所谓的世界模型,与 Meta 和谷歌等竞争对手一起竞相开发能够导航和设计物理环境的人工智能系统。
这家总部位于旧金山的初创公司今年夏天聘请了英伟达的专家来研发这些下一代人工智能模型,这些模型通过机器人的视频和数据进行训练,以了解现实世界。
世界模型可以使人工智能的能力超越以文本训练的大型语言模型,而大型语言模型是 ChatGPT 和 xAI 的 Grok 等流行人工智能工具的基础。
两位知情人士表示,该公司正在构建世界模型,旨在将其应用于游戏领域,从而生成交互式 3D 环境。其中一位知情人士补充说,这些模型还可以应用于机器人的 AI 系统。
xAI聘请了两位来自 Nvidia 的 AI 研究员 Zeeshan Patel 和 Ethan He,他们在世界模型方面拥有丰富的经验。Nvidia 凭借其 Omniverse 平台(该平台可以创建和运行模拟)在开发这项技术方面处于领先地位。
一些科技集团对世界模型抱有远大的期望,认为它能够将人工智能的应用拓展到软件和计算机以外的领域,例如人形机器人等实体产品。
上个月,英伟达向英国《金融时报》表示,世界模型的潜在市场规模可能几乎相当于目前的全球经济规模。
马斯克在 X 的一篇文章中表示,xAI 将在明年年底之前发布一款“出色的人工智能游戏”,这证实了这位亿万富翁去年设定的目标。
周二,xAI 推出了其最新的图像和视频生成模型,据称该模型进行了“大规模升级”并且可以免费使用。
当前的视频生成模型,例如 OpenAI 的 Sora,通过预测从训练数据中学习到的模式来为视频生成图像帧。
世界模型将是一个巨大的进步,因为它们将对物理学以及物体如何在不同环境中实时相互作用有因果理解。
该公司正在招聘图像和视频生成方面的技术人员加入其“全能团队”,该团队“创造超越文本的神奇人工智能体验,实现对图像、视频和音频等各种模式内容的理解和生成”。
这些职位的薪资从18万美元到44万美元不等。该公司还招聘一名“视频游戏导师”,负责培训Grok制作视频游戏,并让“用户探索人工智能辅助游戏设计”,时薪为45美元到100美元。
马斯克效仿了谷歌和 Meta 等其他领先的人工智能实验室,他们也在研究这些系统。
然而,世界模型仍然是一个巨大的技术挑战。事实证明,寻找足够的数据来模拟现实世界并训练这些模型既困难又昂贵。
开发视频游戏《博德之门 3》的Larian Studios的发行主管迈克尔·杜斯 (Michael Douse)本周在 X 上表示,人工智能无法解决游戏行业的“大问题”,即“领导力和愿景”。
他补充说,该行业不需要“更多数学制作、心理训练的游戏循环,而是需要更多人们参与或想要参与的世界的表达”。
xAI、Patel 和他没有回应置评请求。(AI普瑞斯编译)