谷歌DeepMind推出新AI模型 机器人未经训练也能执行现实任务
创始人
2025-03-13 12:00:55
0

3 月 12 日消息,北京时间今晚,谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。

其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。

Gemini Robotics 基于谷歌最新版本的 AI 旗舰模型 ——Gemini 2.0。谷歌 DeepMind 机器人部门高级总监 Carolina Parada 曾表示,Gemini Robotics 依托 Gemini 的多模态世界理解能力,通过加入物理行动的新模态,将其应用到现实世界中。

该模型在谷歌 DeepMind 认为构建高效机器人所需的三大核心领域取得了进展:通用性、互动性和灵活性。除了能够应对新的情境外,Gemini Robotics 在与人类及环境的互动上表现更好,且能够执行更精确的物理操作,比如折纸或打开瓶盖。

另一款则是 Gemini Robotics-ER(具象推理)模型,公司称其为一种先进的视觉语言模型,能够“理解复杂且动态的世界”。

Parada 进一步解释道,当你在装便当盒时,桌上的物品摆放位置和如何操作是你必须考虑的内容。Gemini Robotics-ER 正是为此类推理任务而设计,机器人专家可通过该模型与现有的低级控制系统对接,开启由 Gemini Robotics-ER 驱动的新功能。

谷歌 DeepMind 的研究员 Vikas Sindhwani 表示,公司正在开发一种“分层安全策略”,并称 Gemini Robotics-ER 模型已被训练用于评估在特定情况下某个动作是否安全。公司还发布了新的基准和框架,推动 AI 领域的安全研究。据IT之家了解,去年,谷歌 DeepMind 推出了“机器人宪法”,这是一套受艾萨克・阿西莫夫启发的机器人行为规范。

据外媒 The Verge,谷歌 DeepMind 与 Apptronik 合作,共同致力于“打造下一代人形机器人”。此外,谷歌还向包括 Agile Robots、Agility Robotics、波士顿动力和 Enchanted Tools 在内的“受信任的测试者”开放了 Gemini Robotics-ER 模型。Parada 表示:“我们专注于打造能够理解物理世界并在其中行动的智能,我们非常期待将这一技术应用于多个领域和多种表现形式。”

【来源:IT之家】

相关内容

热门资讯

石家庄市低空经济产业招商推介会... 5月14日,由石家庄市人民政府主办、市投资促进局承办的低空经济产业招商推介会顺利召开。 此次活动全面...
百度成立“模型委员会”,国内大... 红星资本局5月15日消息,日前百度官宣设置“百度模型委员会”(Baidu Model Committ...
给大国工程做CT!我国首颗能源... 上证报中国证券网讯(记者 王子霖)5月15日,我国首颗能源工程专用SAR卫星“电建一号”顺利进入50...
厘米级精度!宿迁近900公里国... 5月13日,宿迁市公路事业发展中心在324省道开展普通国省道三维测量作业,运用前沿数字化技术为全市普...
山东上线“齐鲁制造会客厅” 勾... 济南5月15日电(记者 孙婷婷)山东打造“齐鲁制造会客厅”系列活动,围绕人工智能、机器人、智能终端、...
IT之家采访联发科:智能体无缝... IT之家 5 月 15 日消息,5 月 13 日,联发科在上海举办了以“全域芯智能,体验新无界”为主...
原创 薪... 当第一缕青烟从枯木摩擦处升起,人类便开启了用化学钥匙解锁能源大门的光辉历程。柴薪作为最古老的能源载体...
济南隆超取得便捷式喷涂装置专利... 国家知识产权局信息显示,济南隆超石油机械锻造有限公司取得一项名为“一种便捷式喷涂装置”的专利,授权公...
原创 中... 光谷国际光电子博览会5月18日一开锣,国家信息光电子创新中心展台前就堵住了——不是为拍展板合影,是真...
镜观东莞・智见未来 | 克里特... AI眼镜产业风口正盛 东莞凭借完整产业链与强大制造能力 稳居全球AI眼镜出货量第一 在东莞凤岗,一家...