能折纸,还会灌篮!谷歌发布机器人基座大模型,大幅强化机器人通用性
创始人
2025-03-13 13:20:40
0

通用型机器人发展史上的又一个“里程碑”来了。

3月12日,谷歌旗下的DeepMind公司发布了全新的AI模型,名为Gemini Robotics和Gemini Robotics-ER。 这套模型号称能让机器人更好地适应复杂环境,完成各种高难度任务。

截至昨日,谷歌母公司Alphabet Class C股价收盘小幅上涨1.82%,收于169.00美元。

机器人也能折纸、整理桌面、灌篮? 谷歌DeepMind展示不俗实力!

DeepMind这次发布的AI模型进一步升级,经过新模型训练的机器人,不仅能流畅地折叠纸狐狸。

还能按照语音指令整理桌面。

甚至还能熟练地拉开拉链。

最后还能来个迷你篮球灌篮!

DeepMind还和初创公司Apptronik合作,计划用这项技术打造人形机器人。

X网友表示未来机器人管家真的不是梦了,想喝咖啡让机器人帮忙做一杯。

以往,机器人的动作都需要科学家手动编程,费时费力。现在,得益于新的AI技术,机器人能更好地适应环境,学习新技能的速度也大大加快。Google DeepMind的首席软件工程师Kanishka Rao表示:

Gemini Robotics的通用性是之前最好模型的两倍,真正实现了向通用型机器人的重大飞跃。

Gemini Robotics:让机器人更聪明、更灵活

据悉,Google利用其Gemini 2.0语言模型,专门训练了用于控制机器人的模型。这使得机器人拥有了三大“超能力”:

  • 环境适应能力: 能快速适应各种新情况。
  • 指令理解能力: 能迅速响应口头指令或环境变化。
  • 操作灵活性: 拥有足够的手部灵巧性来操作物体。

这种能力对于机器人技术的发展至关重要,因为机器人之前在实验室表现出色,但在非受控环境下往往“水土不服”。

X网友评论Gemini让机器人变得更酷更有趣了。

加州大学伯克利分校的机器人学教授Ken Goldberg表示:

这项技术无疑是机器人领域令人兴奋的进展,似乎建立在谷歌在大规模数据和计算方面的优势之上。

他还提到,这些新机器人模型最独特的地方在于它们可以在云端流畅运行,这大概是因为它们能够利用谷歌对需要大量计算能力的超大型语言模型的访问。麻省理工学院教授,同时也是丰田研究院机器人研究副总裁的Russ Tedrake认为:

Gemini 是重要的一步。

但他也表示:

通用型机器人要做好投入使用,还有很多工作要做。

科技巨头争相布局,万亿市场蓄势待发

这次DeepMind的动作,也预示着一场机器人领域的“军备竞赛”正在加速。

美银分析师Ming Hsun Lee团队大胆预测,。预计到2030年,全球人形机器人年销量将达到100万台,到2060年,人形机器人总保有量将达到30亿台,相当于届时人均拥有0.3台机器人。

包括特斯拉、OpenAI在内的科技巨头,以及众多初创公司,都在争先恐后地研发AI“大脑”,希望赋予机器人自主操作的能力。

英伟达的CEO黄老板更是直言,这项技术将带来一个价值数万亿美元的巨大市场,甚至可能“开创有史以来最大的科技产业”。

相关内容

热门资讯

雷军:新一代SU7争取春节前部... 今日,小米创始人雷军发文称,新一代SU7卡布里蓝实车非常漂亮,争取春节前部分样车能够进店。 1月...
汉狮光动科技取得智能遮阳系统专... 国家知识产权局信息显示,汉狮光动科技(广东)有限公司取得一项名为“一种智能遮阳系统”的专利,授权公告...
聚合创新力量,赋能科创高地——... 2025年,上海市总部企业发展促进会张江分会(以下简称“张江分会”)在上海市总部企业发展促进会的指导...
2026视频号去水印免费 AP... 2026视频号去水印免费工具推荐榜:微信小程序秒用超实用,干货满满! 前言:2026年去水印需求爆...
心脏能成为“充电宝”?救命神器... “以后再也不用怕 起搏器没电要开刀了!” 最近 中国科学院大学联合清华、北大、 阜外医院等顶尖团队的...
太空旅行要来了,上一次天难不难... 如果给你一张去太空的船票,你会选择去太空旅行吗? 近日,北京穿越者载人航天科技有限公司(以下简称“穿...
俞敏洪:随着人工智能的升级,中... 来源:新浪科技 新浪科技讯 1月24日上午消息,在2026崇礼论坛上,新东方创始人俞敏洪表示,“互联...
“雪龙”号在阿蒙森海开展大洋考... 北京时间1月24日,“雪龙”号大洋队队员丁伟康(左)和宋熙存在舯部甲板开展本次考察阿蒙森海区域首次温...
实现用意念驾驭轮椅 科技广货怎... 肢体障碍运动员使用脑机AI轮椅在赛场穿梭 文/羊城晚报记者 黎秋玲 图/受访者供图 广货...
交互数字CE申请用于帧内预测的... 国家知识产权局信息显示,交互数字CE专利控股有限公司申请一项名为“用于帧内预测的外推”的专利,公开号...