南都讯2026年伊始,埃隆·马斯克向世界发出“技术奇点已然来临”的预言,再次点燃了全球对未来的想象。他给出的时间表中,通用人工智能(AGI)将于2026年实现,而到2040年,全球人形机器人数量将突破100亿台。
在这场关乎人类未来的竞速中,无数实验室、企业、工程师正在默默推进着技术的边界。众擎机器人的研发测试场,就是其中一个典型的现场。 推开测试场的大门,极简的白墙、吸震的黑胶垫地面,以及随处可见的机器人。它们有的静默伫立,有的悬挂在调试架上,有的坐在地上等待充电……装饰的极简与机器人的交织,构成了一种独特的赛博工业美学。在这测试场中央,23岁的安鹏举正全神贯注。他是众擎机器人刚刚从“百万英才汇南粤”项目引进的VLA(视觉-语言-动作)算法工程师。他站在一台1.4米高的机器人身旁,手握一只黑色遥控器,清脆的电机咬合声响起,这个几十公斤重的铁家伙在胶垫上稳稳地迈出了一步,开始扭动、跳舞,甚至跳跃,重心平衡得近乎优雅。
人形机器人“寒武纪大爆发”,我就要在场上
这看似轻松的一场“机械舞”,背后是深圳这座城市在具身智能领域积蓄已久的爆发力。2025年,具身智能不再是实验室里的科幻名词。据相关报道,由深圳市人工智能行业协会、深圳市投控数字科技有限公司联合编制的《2025人工智能发展白皮书》显示,截至2024年年底,深圳人工智能相关企业已超2200家,形成龙头企业国际争先、高成长性企业国内一流、初创企业竞相发展的“雁阵式”梯队。在这个被誉为“机器人第一城”的赛场上,像众擎机器人这样全栈自研,涵盖本体核心零部件、小脑运控算法以及大脑具身智能的企业,正成为新质生产力的排头兵。
安鹏举正是被这股时代的巨浪“卷”入深圳的。在同龄人眼中,安鹏举拥有标准的“天花板”履历:本硕分别出自东南大学吴健雄学院和北京大学人工智能专业。在他的简历中,除了各种多模态大模型、无人驾驶等实习经验外,还赫然写着“Google Scholar引用数500+”,他很谦逊地表示,“500在学术大佬面前其实就是个小水花”,但实际上,这意味着在硕士阶段,他的研究就已经被全世界的同行“看见”了。
当被问及为什么不继续读博时,他表示,“以前具身智能的前沿在实验室,但现在,最丰富的数据、最牛的硬件(像 PM01 这种)、最真实的落地场景,都在企业里。我不想在论文里模拟未来,我想在深圳的工厂里亲手制造未来。这几年是人形机器人的‘寒武纪大爆发’,我等不及那几年的博士时光,我必须现在就在场上。”
这种对“在场上”的渴望,让他精准地捕捉到了深圳释放的信号。在“百万英才汇南粤”招聘现场,众擎机器人展位上的一句话瞬间击中了他。那里不招“程序员”,而是招“具身智能的探索者”。“‘探索者’这三个字代表了一种对未知的敬畏与野心,我当时就觉得‘确认过眼神’了。”安鹏举感叹,“深圳的科创密度很高,而且很有活力;我就想:趁年轻,要去中国科创密度最高的地方卷一卷。”
代码不应该只在服务器里空转,应变成物理世界里的动能
如果说“卷”进深圳是出于外界的影响,那么投身具身智能行业,则源于安鹏举内心的“不满足”。“以前玩 ChatGPT,它确实能写诗、写代码,但它永远被困在屏幕里。我当时就想,如果 AI 能有身体,能帮我倒杯水、拿个快递,那才是真正的未来。代码不应该只在服务器里空转,它应该变成物理世界里的动能。”
在实验室的橡胶垫上,安鹏举的角色不仅是代码编写者,更是一位“顶级私教”。
他向记者拆解了这项工作的底层逻辑,这也是他自己的岗位——VLA。究竟什么是VLA?
“Language(语言)让它理解‘我渴了’的语义;Vision(视觉)让它从杂乱的桌面中识别出杯子的三维坐标;而最难的,是Action(动作)。夹爪开合大一分抓不住,用力猛一分杯子会碎。这就像教孩子走路,我要不断去纠正它每一个关节的弧度。”安鹏举说,“我是那个打通机器人‘眼-脑-手’的人,负责把大模型听懂的‘人话’,翻译成机器人能理解的‘肌肉记忆’,让它不仅能看见世界,还能伸出手去改变世界。”
为了实现这种改变,安鹏举每天的工作在“示教”与“炼丹”之间循环。“一部分时间是在示教——我戴着 VR 眼镜或者操作手柄,远程控制机器人做动作(比如叠衣服),机器人会记录下我的动作数据;另一部分时间是在‘炼丹’——把这些数据喂给模型进行‘模仿学习’训练,然后把模型部署到 PM01 身上,进行在线学习,看它学习的效果如何。如果它动作僵硬,我就得去手动控制、调参数,就像教小孩子学走路一样,得一遍遍纠正。” 在这个过程中,他为机器人设定了“奖励函数”。这被他形象地称为机器人的“多巴胺”。“比如它成功拿起了杯子,函数就返回‘+100分’;如果掉了,就‘-100分’。机器人的天性就是追求高分,所以它会为了那个数字,疯狂地在千万次尝试中寻找最优解。”
这种日复一日的训练让安鹏举与机器之间产生了一种奇妙的连接。 有时候,他在训练过程中看到机器人拿东西时翘起的小拇指,或者走路时习惯性地往右偏一点,“我意识到——我采集的数据中包含了很多个人动作偏差,而机器人把它们也学进去了。”安鹏举说,“这就像Ghost in the Shell(躯壳里的灵魂),一刹那,感觉自己的一部分以数字化的形式,在这个钢铁躯壳里永生了。”
在漫长的“灵魂投喂”中,最让他兴奋的莫过于那些“觉醒时刻”。“比如有次我没教它怎么应对推搡,但测试时同事推了它一下,它下意识地退了一步稳住重心。那一刻我觉得它不仅仅是机器,它好像人一样有了‘求生欲’。”
除了觉醒,也有一些“美丽的意外”。有一次,他采集数据时手部产生了一次细微的晃动。本以为这是要被清洗掉的“脏数据”,但最后这组数据意外进入了模型训练。结果令人震惊:机器人竟然学会了通过这种微小的抖动实现自主纠错。“那一刻我意识到,人类的‘不完美’其实包含着很多隐性智慧,大模型把这种‘容错能力’也学去了。”安鹏举感叹道。
深圳就是硬科技创业者的“迪士尼”
安鹏举之所以能如此沉浸地“训练”未来,离不开深圳这片土壤提供的强大支撑。 正如他所说,选择众擎、选择深圳,是因为这里极高的“科创浓度”。
“深圳就是硬科技创业者的迪士尼。”他如此形容。据相关报道,深圳头部人形机器人企业的核心部件国产化率超90%,产业链供应链本地化率最高达60%,强大的配套能力为智能机器人技术进步提供强劲支撑。
站在产业高地上,作为一线工程师的安鹏举对行业发展有着冷静的判断。安鹏举认为,人形机器人真正进入千家万户,“比大家想象的要快,但也比营销号吹的要慢。”安鹏举说,“简单的端茶倒水,可能 3 年内就能在特定场景看到;但要像保姆一样叠衣服、做饭、带孩子,可能还需要 5-10 年。我们现在正处于iPhone 1代发布的前夜,硬件(像众擎PM01)已经准备好了,就差那个杀手级的通用大模型了。”
对于那个即将到来的时刻,安鹏举满怀憧憬:他希望机器人不再是冷冰冰的替代者,而是人类最可靠的“副手”。“我希望它像《星际穿越》里的 TARS,平时幽默、低调,但在你需要的时候,它能毫不犹豫地冲进火场救人,或者在你老了动不了的时候,温柔地把你抱上轮椅。”他看着眼前的机器人坚定地说道,“它应当是,有温度的钢铁。”
采写:南都N视频记者 黄璐
拍摄:南都N视频记者 刘嘉琳 冷锋
编导:南都N视频记者 刘嘉琳