3月3日,小米董事长兼CEO雷军发文展示了小米人形机器人的近况。在真实汽车工厂里,在汽车工厂压铸车间自攻螺母上件工站中连续自主运行3小时,安装成功率90.2%,同步满足76秒产线节拍。这是小米人形机器人在智能制造领域稳定应用的第一步。
在该任务中,机器人连续从自动送钉设备中精准抓取自攻螺母,并放置在自攻拧紧的定位工装上,配合滑台输送和自攻工位的自动定位锁定,实现汽车一体化压铸后地板零件自攻螺母的自动化自攻拧紧作业。
其中,难度最高的环节集中在自攻螺母的安装过程,需要确保其与定位销轴的精确对准和可靠贴合。而自攻螺母内侧的花键结构,每次抓取不固定的手内姿态,以及定位销轴上磁吸力带来的拉扯影响,都大幅增加了装配难度。
据@小米技术,为应对实际作业中的复杂情况,避免繁琐的规则编程,我们采用了端到端数据驱动的控制方法。在VLA大模型Xiaomi-Robotics-0的基础上,结合强化学习技术,使机器人能够快速适配不同下游工况,并持续从真实物理环境的交互经验中学习,保障其在复杂工况下实现长时间、稳定、高可靠的作业表现。
为支持任务规划决策和提供在线强化学习的奖励信号,我们融合了视觉、触觉以及关节本体感知等多模态信息,对作业过程进行协同感知与综合判断,显著降低复杂工况下的状态误判概率。
以抓取任务为例,仅依赖视觉感知在光照变化或局部遮挡情况下容易产生不确定性,无法准确判断自攻螺母与手指之间的真实接触状态;而仅依赖触觉信息,则可能受到手指与环境或者手指之间非预期接触的干扰。
全身运动控制是机器人稳定作业的基础,我们采用了融合优化控制与强化学习的混合架构,并依据系统稳定性指标对两类控制策略进行选择性执行。在该架构中,优化控制器基于二次规划方法,通过零空间投影机制实现四级严格优先级控制,依次满足平衡约束、安全约束、任务约束以及其他优化指标,单次求解耗时小于 1ms。
强化学习控制器则依托大规模并行仿真平台进行训练。我们对虚拟环境中的数千个机器人进行了上亿次随机扰动与失稳场景的模拟,从而使机器人学会在极端干扰条件下保持平衡的控制策略。该策略可实现零样本迁移部署至真实机器人,保障系统的稳定性与鲁棒性。


