21世纪经济报道记者 邓浩 上海报道
机器人无疑是当前资本市场最耀眼的明星,不过也有乱花迷眼的一面。
一方面,模型技术尚未收敛,非共识不断,另一方面,众多公司涌入,大单融资频现。
目前具身智能到底处于什么阶段?
在8月21日的智元机器人首届合作伙伴大会上,公司董事长兼CEO邓泰华给出了他的判断,“2025年具身智能机器人将迎来商用发展的拐点,最终成为继手机和汽车之后的‘下一代海量智能终端’。”
在机器人销量上,邓泰华透露,预计今年有几千台的出货,明年会有数万台,希望未来几年达到每年数十万台规模。
据了解,目前智元机器人已聚焦讲解接待、文娱商演、工业智造、物流分拣、安防巡检、商用清洁、数采训练、科研教育八大场景,推出定制化解决方案并实现多行业规模化应用。
智元机器人合伙人、具身业务部总裁姚卯青在接受21世纪经济报道记者在内的媒体采访时表示,“我们应该能够为整个具身智能产业去快速积累大量真实数据,2年内有希望达到现在语言大模型所应用的规模,真正带来具身智能GPT涌现时刻。”
已达到工人7成效率
工业场景的具身智能,类似于L2级智能辅助驾驶,相对可控,要求数据量也不太多, 成为众多本体公司布局的方向。
不久前,智元就曾官宣与富临精工达成数千万元标的的项目合作,近百台远征A2-W落地富临精工工厂,成为国内首个工业领域具身机器人规模化商业签单案例。
在姚卯青看来,“工业场景是一个有限范围内的通用性,不是无边界的通用性。在特定环境、特定工作任务上能够对它有限范围内做泛化就可以。”
实际上,在刚刚过去的WAIC上,智元就与德马科技直播展示了世界首个真正数据驱动的具身智能机器人物流作业。在1:1复刻的物流作业区,德马飞梭Flash Sorter与智元人形精灵G1协同作业,完成全自动供包与包裹二次分拣任务。
姚卯青表示,“我们和德马在合作的这种上包(物流上包)环节,只要对几百种、几千种包裹的形态达到很好抓取效果,(这意味着)不管是来料怎么放,是随意堆叠,还是翻面、形状、颜色等不同情况,我们都能够成功识别、抓取或翻面。”
姚卯青直言,“我们解决的是和这些设备去配合中人的环节,(也就是)把这些人替代成通用机器人去干。”
德马科技副总裁兼技术中心主任王凯则透露,“现在机器人真正去替代一个工人,虽然效率上估计只有70-75%的水平,(但)也超乎我们的想像。在智能物流装备的领域,我们认为未来一定会存在人机协同,甚至机器来作为总的Commander来控制生产厂,可以去规划每天分拣的数量、设备状态等一系列东西。”
更大价值在上肢作业
对于行业热议的具身智能数据卡点问题,姚卯青颇为乐观。
姚卯青透露,“在过去半年很多场景的客户,都在快速向我们提一些面向真实场景数据需求。这些需求都是代表真实应用案例,也能够帮我们去慢慢积累、扩充数据集。而这类数据大规模的标准化生产和检验标注的环节,也和杭州湾具身智能创新中心的伙伴一起联合推进。从这个角度来讲,我还是比较乐观的,应该能够为整个具身智能产业去快速积累大量真实数据,2年内有希望达到现在大语言模型所应用的规模,真正带来具身智能的GPT涌现时刻。”
“垃圾进,垃圾出”是深度学习领域的黄金法则,一定程度上意味着高质量的多元数据,才是实际竞争的门槛,或许这才是智元不断和产业上下游合作,积累场景数据的根因。
姚卯青就表示,“在大模型技术背景下面,大家拼的就是数据质量、数据配方、数据工程能力,好的数据决定模型上限,差的数据决定模型会有比较差的表现。我相信具身智能将来也是这样的,这个价值更大,因为数据获取难度更高,在物理世界里采集到才是最珍贵的,相信将来真正做AGI的公司会不计代价的获取尽可能多的数据。”
在这里,姚卯青介绍了一个细节,挺有意思。
最近,智元与Google这类的国际大厂AGI团队交流,在询问希望以什么节奏来获取何种数据量时,对方的反馈很直接,“越多越好、越快越好、越丰富越好。”
值得一提的是,姚卯青认为,具身智能将来更大的价值,在于上肢的作业能力。
姚卯青坦言,“运控很重要,你需要稳定的运动、移动,才能配合高效作用,但我们觉得仅仅有这个是不够的,我们需要真正把更难的作业操作问题去解决。这个操作问题就是一个比运动控制难两个数量级、难100倍以上的问题,你需要去沉下心来,花很长时间,从硬件到算法到数据,真正去持续打磨。”
“下半年,我们会陆陆续续发布很多行业应用的震撼展示,真正让大家看到,机器人不仅仅能够提供情绪价值、文娱价值,它最终也会解决生产力问题。”姚卯青称。