科技日报记者 张梦然
(资料图片仅供参考)
据18日《自然·机器智能》杂志报道,为了解动物如何学会走路和从绊倒中学习,德国马克斯·普朗克智能系统研究所(MPI-IS)研究人员建造了一个四足机器狗“莫蒂”,它仅仅用了一小时就学会了走路。
机器狗莫蒂图片来源:菲利克斯·鲁珀特/MPI-IS动态运动小组
莫蒂充分利用了复杂的腿部力学,通过贝叶斯优化算法指导学习:其足部传感器信息与机器狗中运行的建模虚拟脊髓的目标数据相匹配。机器狗通过不断比较发送的和预期的传感器信息、运行反射循环以及调整其电机控制模式来学习行走。
在人类和动物中,中央模式发生器(CPG)是脊髓中的神经元网络,可在没有大脑输入的情况下产生周期性的肌肉收缩。CPG网络有助于生成有节奏的任务,例如步行、眨眼或消化。此外,反射是由连接腿部传感器和脊髓的硬编码神经通路触发的非自愿运动控制动作。
机器狗莫蒂在大约一小时内比动物更快地优化其运动模式。莫蒂的CPG在控制机器狗腿部运动的小型轻量计算机上进行模拟。这个虚拟脊髓被放置在四足机器狗头背部所在的位置。
在机器狗平稳行走的一小时内,来自其脚部的传感器数据不断与机器狗CPG预测的预期着陆进行比较。如果机器狗绊倒,学习算法会改变腿来回摆动的距离、腿摆动的速度以及腿在地面上的长度。调整后的运动也会影响机器狗利用其腿部力学的能力。
在学习过程中,CPG发送经过调整的电机信号,以便机器狗从此减少绊倒并优化其行走。
论文第一作者、MPI-IS动态运动研究小组的前博士生菲利克斯·鲁珀特表示:“我们的机器狗实际上是‘天生’的,对它的腿部解剖结构或它们的工作原理一无所知。CPG类似于大自然提供的内置自动行走智能,我们已将其转移给机器狗。计算机产生控制腿部电机的信号,机器狗最初会走路和绊倒。数据从传感器流回虚拟脊髓,与CPG数据进行比较,如果传感器数据与预期数据不匹配,则学习算法会改变行走方式,直到机器狗行走良好且不会绊倒。改变CPG输出,同时保持反射活跃并监控机器狗绊倒是学习过程的核心部分。”
机器狗莫蒂图片来源:菲利克斯·鲁珀特/MPI-IS 动态运动小组
总编辑圈点:
中枢模式发生器是产生动物节律运动行为的生物神经环路,是神经振荡器与多重反射回路系统集成在一起组成的一个复杂的分布式神经网络。近些年来,基于CPG的机器人运动控制成为仿生机器人领域新的研究热点。科研人员让四足机器人在极短时间内学会了走路,简单理解,就是边走边学。它的CPG在不断进行模拟,学习算法也不断根据传感器传来的数据和模拟数据的差异进行调整。人工规划的机器人步态太僵硬,而这种生物步态则能让四足机器人更好适应周围环境。