微软研究院发布Rho-alpha机器人模型,融合了视觉、语言和触觉功能
创始人
2026-02-06 22:00:50
0

智行时代——具身智能技术生态

据Robotics & Automation News报道,微软研究院发布了Rho-alpha,这是一款新型机器人模型,旨在帮助机器人理解自然语言指令,并在结构化程度较低的环境中执行复杂的物理任务。

该模型源自微软的Phi系列视觉语言模型,目前正通过微软的早期研究访问计划(REAP)发布。据微软称,Rho-alpha旨在推动新一代机器人系统的发展,使其能够在动态的真实世界环境中进行感知、推理和行动。

几十年来,机器人最擅长在工厂和仓库等严格控制的环境中运行,因为这些环境中的任务是可预测的,并且经过精心编写。然而,近年来智能体人工智能的进步正在催生新的“视觉-语言-动作”模型,使物理系统能够以更高的自主性运行。

Rho-alpha属于此类,它能将自然语言指令转换为控制信号,用于执行双手操作任务的机器人系统。微软将其描述为“VLA+”模型,因为它超越了传统的视觉和语言输入,融合了其他传感方式。

其中一项新增功能是触觉传感。微软研究院表示,Rho-alpha集成了触摸数据,目前正在进行相关研究,以支持其他传感方式,例如力感应。该公司还表示,该模型旨在通过学习用户与机器人互动时提供的反馈,在部署过程中不断改进。

模型训练高度依赖于合成数据。微软研究院开发了一种多阶段训练流程,该流程利用强化学习和仿真技术,基于英伟达的Isaac Sim框架,无需进行大量的实际远程操作即可生成大量训练数据。

参与该项目的研究人员表示,缺乏多样化的真实世界机器人数据仍然是基础模型面临的主要挑战。

华盛顿大学助理教授阿比舍克·古普塔(Abhishek Gupta)表示:“虽然通过远程操作机器人系统生成训练数据已成为一种标准做法,但在许多情况下,远程操作是不切实际的或不可能的。我们正在与微软研究院合作,利用仿真和强化学习相结合的方法,通过各种合成演示来丰富从物理机器人收集的预训练数据集。”

英伟达与微软研究院合作开发了仿真基础设施,并强调了合成数据在加速机器人技术发展中的作用。

英伟达机器人和边缘人工智能副总裁迪普·塔拉(Deepu Talla)表示:“训练能够推理和行动的基础模型需要克服多样化真实世界数据的匮乏问题。通过利用Azure上的Nvidia Isaac Sim生成物理上精确的高保真合成数据集,微软研究院正在加速开发像Rho-Alpha这样能够掌握复杂操作任务的多功能模型。”

微软已开放Rho-alpha研究早期访问计划的注册,并表示将在未来几个月内发布有关其机器人研究工作的更多更新信息。

相关内容

热门资讯

实测 | 选品、比价、省钱、支... 凌晨刷着满屏“618”满减规则,来回切换京东、淘宝、抖音三款App(应用程序),比价、搜索的繁琐,让...
国产之“光”爆单 AI算力拉动... 今年以来,AI算力浪潮席卷全球。如果把AI大模型比作最强大脑,那么光通信就是为它输送海量数据的“高速...
光量子计算机“天衍-P2000... 近日,在中国科学院量子信息与量子科技创新研究院指导下,中国电信旗下中电信量子集团联合九章(济南)量子...
消息称阿里将推出“千问输入法”... 6月18日,据读佳消息,阿里千问团队将推出名为“千问输入法”的独立APP,产品已开发完成,即将上线各...
银行业保险业人工智能安全开发应... 新华社北京6月18日电(记者李延霞、张千千)国家金融监督管理总局6月18日对外发布《关于银行业保险业...
反转!追觅全面回归主业,战略调... 别看追觅现在拿了全球扫地机双第一,国内有科沃斯、石头、云鲸死死咬住份额,技术迭代速度极快,海外又有戴...
苏黎世为Robotaxi开绿灯... 近日,自动驾驶企业文远知行与全球出行巨头 Uber 联合官宣,双方将在瑞士苏黎世落地商业化 Robo...
原创 有... 抬头看星空,我们老问一句话:外星人到底躲在哪儿?这个问题被问了几十年,答案越找越少。 换个思路也许更...
AI下半场,比的不是“懂多少”... 来源:人民邮电报 国家数据局日前印发的《关于推进行业高质量数据集建设的行动实施方案》(以下简称《方案...
如何满足高稳定供电需求场景发电... 高稳定供电场景的核心用电要求 对于供电连续性、可靠性要求极高的公共服务、工业生产、大型活动等场景而言...