人形机器人自主控制新突破:智元等实现 VLA 驱动全身协同,行走与操作同时完成
最新 12 月 17 日消息,智元 AGIBOT 今日官宣,来自香港大学、智元 AGIBOT、复旦大学和上海创智学院的联合研究团队提出了 WholeBodyVLA,这是一种面向真实世界的人形机器人全身 Vision–Language–Action 框架。

该工作基于智元灵犀 X2 研究发布,将 VLA 扩展至双足人形机器人的全身控制,验证了其在全身 loco-manipulation 任务中的可行性。




与原地操作相比,loco-manipulation 的难点不在于单一技能,而在于行走与操作必须在同一任务中长期、稳定地协同发生。围绕这一挑战,WholeBodyVLA 总结出限制 loco-manipulation 发展的两个核心问题:真机数据稀缺以及运动执行中的不稳定性,并引入两项关键方案:
从人类视频中学习:通过从第一视角人类视频中学习移动与操作的潜在动作表示,模型能够不依赖大规模机器人遥操数据,直接获取对 loco-manipulation 行为的统一语义理解,从而显著缓解人形机器人遥操作数据稀缺、采集成本高的问题。
面向移动操作的 RL 控制器:将通用连续运动控制目标简化为一组离散运动指令,仅保留 loco-manipulation 必要的强化学习训练目标,从而显著提升了控制器在运动执行时的稳定性。
研究团队在智元灵犀 X2 人形机器人上进行了大量真机实验验证,发现 WholeBodyVLA 具有以下能力:
01、大范围、长程移动操作任务

02、距离泛化性
得益于统一潜在动作学习阶段获取的 manipulation-aware locomotion 知识,WholeBodyVLA 能从不同的位置出发、并停止在目标物体处完成操作任务。


03、操作泛化性
得益于统一潜在动作学习阶段获取的 manipulation 知识,WholeBodyVLA 也对不同的场景、物体、位置表现出一定的操作泛化性。


04、地形泛化性
得益于 LMO 改进的运控稳定性,WholeBodyVLA 能够在干扰地形上仍然保持基本准确的移动方向和平衡。


总的来说,WholeBodyVLA 展示了 VLA 扩展到双足人形机器人自主全身控制的可行路径。通过从人类视频中学习,并结合针对移动操作的 RL 控制器,WholeBodyVLA 使机器人能够在真实世界中稳定完成行走与操作交织的长时序任务,为推动人形机器人走向制造、服务、物流等复杂场景提供重要基础。

最新附项目链接如下:
https://opendrivelab.com/WholeBodyVLA/
《人形机器人自主控制新突破:智元等实现 VLA 驱动全身协同,行走与操作同时完成》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
频繁口腔溃疡 可能是用了含SLS的牙膏!99%的人不知道
快科技12月17日消息,日常生活中,有人总是频繁口腔溃疡,即便没有吃辣上火,而诱发原因可能就是使用了含有SLS的牙膏。SLS中文名月桂醇硫酸酯钠,是一种表面活性剂,能让牙膏在刷牙的过程中产... -
全球首个!情感交互人形机器人“爱湫”将发布:龙蜥外形设计
快科技12月17日消息,四川具身人形机器人宣布,将推出全球首款主打情感交互的人形机器人“爱湫-AIQ”。该机器人外形设计灵感源自西南地区特有保护物种龙蜥,在形态上兼具亲和力与独... -
睡多浪费:张朝阳四小时睡眠法被炮轰 中国科学院院士回应!
快科技12月17日消息,近日张朝阳又一次分享了自己的4小时睡眠法,认为睡多就是浪费,而这个言论被行业专家狠批。中国科学院院士,精神医学与睡眠医学家陆林近日接受采访时表示,很多人认为睡眠... -
我国侵入式脑机接口临床试验新进展!从二维到三维物理世界重大转变
快科技12月17日消息,据央视新闻报道,今日,中国科学院脑科学与智能技术卓越创新中心发布该中心与国内科研机构及医疗单位合作开展的第二例侵入式脑机接口临床试验取得的新进展。本次临床试验... -
求求了!别只知道吃榨菜 它的“真身”更好吃
一到冬天,川渝的这道冬季限定菜就会被端上了饭桌。看到是不是有种似曾相识的感觉?其实,它就是我们常吃的榨菜原身——青菜头。图源:某社交平台即便如今的生活非常便利,一年...

















