北京工业大学学报
2018年9月JOURNAL OF BEIJING UNIVERSITY OF TECHNOLOGY
Vol.44 No.9 Sept. 2018
基于ZMP判据的仿人机器人步态模仿
于建均i,2,张远u,左国玉u,阮晓钢U2,吴鹏申U2
(1.北京工业大学信息学部,北京100124 ; 2.计算智能与智能系统北京市重点实验室,北
京
100124)
摘要:仿人机器人行走稳定性研究是机器人领域一大研究热点,目前主要依据动力学模型规划稳定步态,但依靠 步态规划形成的运动模式往往需要复杂的运算,并且机器人的运动形式单一.为实现机器人多样化步态的生成,在 模仿学习的框架下对机器人的步态模仿问题展开研究,利用人体行走信息作为示教数据,实现仿人机器人对人体 行走过程的模仿学习,在简化运动规划的同时使机器人的运动步态更具多样化与拟人化.为满足机器人在步态模
zero moment point,ZMP)判据补偿质心偏移,利用滞回曲线确定行走过程中支撑 脚的切换以实现稳定性控制.基于NAO机器人的模仿学习系统仿真研究结果表明:ZMP判据的引入有效地保证了 机器人对人体示教步态模仿的稳定性,基于滞回曲线的支撑脚选取保证了支撑脚切换的平稳.
关键词:仿人机器人;模仿学习;支撑脚选择;零力矩点(ZMP)判据中图分类号:TP242.6
文献标志码:
仿过程中的稳定性,基于零力矩点(
A 文章编号:0254 -0037(2018)09 -1187 -06
doi: 10.11936/bjutxb2017070025
Humanoid Robot Gait Imitation Based on ZMP Criterion
YU Jianjun1,2,ZHANG Yuan1,2,ZUO Guoyu1,2,RUAN Xiaogang1,2,WU Pengshen1,2
(1. Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China;
2. Beijing Key Laboratory of Computational Intelligence and Intelligent System,Beijing 100124,China)
Abstract : Research on walking stability of humanoid robot is a hot spot of robot field, gait planning
based on dynamics model is the main method, but the motion pattern based on gait planning need complex calculation and the form is single. To generate diverse gait of robot, research on the gait of humanoid robot within a framework of imitation learning was launched, human walking information was used as teaching data to realize the imitation of human. The motion planning of humanoid robot was simplified and more diverse and personate behaviors. In order to satisfy the stability of walking process, the cog deviation was compensated based on zero moment point (ZMP) criterion and the switching of the supporting feet in the walking process was determined by using the hysteresis curve to ensure the stability of robot. The simulation of imitation system based on robot NAO indicates that the utilizatin of ZMP criterion ensure the stability in the process of human gait imitation,and the switching of supporting feet based on hysteresis curve ensure the stability of switching supporting foot.
Key words: humanoid robot; imitation learning; support foot selection; zero moment point (ZMP)
criterion
收稿日期:2017-07-17
基金项目:国家自然科学基金资助项目(61375086);高等学校博士学科点专项科研基金资助项目(20101103110007);北京工
业大学智能制造领域大科研推进计划资助项目(JZ041001201702)
作者简介:于建均(1965—),女,副教授,主要从事控制理论与控制工程、智能控制、机器人控制方面的研究,E-mail:
yujianjun@bjut.edu.cn通信作者:左国玉(1971—),男,副教授,主要从事遥操作机器人、仿生机器人、机器学习方面的研究,E-mail:zuoguoyu@
bjut.edu.cn
1188北京工业大学学报2018 年
仿人机器人结构与人体相似,在人类社会环境 中,仿人机器人可代替人类完成各种作业,扩展人类 的能力,并表现出很好的环境适应性.近年来仿人 机器人在服务、医疗、教育、娱乐等多个领域得到广 泛的应用,相关的研究工作也逐步展开.
仿人机器人的步态规划与平衡性控制一直是机 器人领域研究的重点,结合动力学模型与零力矩点 (zero moment point,ZMP)判据的运动规划是主要方 式.Dong等[1]将机器人简化为倒立摆模型对质心 轨迹与关节角进行规划,但行走模式单一.Wang 与ZMP方程相结合,利用人体行走信息规划期望
ZMP轨迹,并结合示教角度信息预估机器人运动过
程的ZMP轨迹信息,通过计算ZMP轨迹的期望与 实际差值以补偿控制机器人运动模仿过程的稳定 性.该方法在确保模仿相似性的同时简化了运算过 程.然后,为实现模仿过程中平稳的支撑脚切换,本 文利用滞回曲线处理人体示教骨骼点信息,确定行
走过程支撑脚的选择.最后,以NAO机器人作为仿 真平台,结合质心偏移补偿角与示教角度驱动机器 人,通过仿真证实模仿行走稳定控制算法的有效性.
等[2]利用外骨骼混合模型分别规划行走时的不同 状态,并利用ZMP判据保持运动平稳性,但规划过 程复杂,计算量大.Yu等[3]针对机器人在具有坡度 的环境下进行了行走规划,通过倒立摆模型规划质 心轨迹,但应用环境单一.
面对依靠模型进行运动规划所产生的计算量 大、运动方式单一等问题,模仿学习这一方式逐渐被 引入到机器人步态规划与运动控制中.令机器人对 示教者运动信息进行学习,并通过模仿实现运动技 能,这种方式大大简化了仿人机器人步态规划的复 杂性,并且依据人体姿态生成的机器人运动形式更 具拟人化,更重要的是赋予仿人机器人模仿学习的 能力,可以增强其在复杂环境下的决策能力,提高智 能性[4].当然将模仿学习引入机器人步态控制中也 存在着难点:由于机器人是对示教者进行直接学习, 人体与机器人质量分布的差异会造成机器人运动姿 态的不稳定,面对行走等对动态性能要求较高的运 动过程时,平衡的控制尤为重要.因此,为实现机器 人对人体运动过程的稳定模仿,需结合示教数据对 机器人进行稳定补偿控制.
Lee等[5]利用体感摄影机对机器人进行示教,
通过关节角控制质心来保持稳定,Boutin等[6]通过 标记关节点获取示教数据,利用列文伯格-马奈尔 特(Levenberg-Marguardt,LM)算法求解动力学问题, 保证质心稳定,但二者未考虑质心加速度的影响.
Hu等[7]利用人体示教数据规划稳定ZMP轨迹,并
结合示教数据利用二次规划优化模仿相似性,但相
似性处理的运算较为复杂.Hou等[8]利用人体示教 数据规划稳定ZMP轨迹,通过有效集算法求解质心 与角度的运动轨迹,但该方式没有充分利用人体示 教角度信息以简化运算.
本文在模仿学习的框架下,围绕仿人机器人对 人体行走过程的模仿学习展开研究.首先,为实现 机器人稳定的运动模仿,本文将人体关节示教角度
1机器人行走模仿的稳定性控制
由于机器人与人体之间存在着质量分布差异,
利用人体行走数据直接驱动机器人进行行走模仿会 造成机器人的不稳定,因此需引入稳定性判据对机 器人进行稳定控制.
1.1基于小车-桌子模型的ZMP方程建立
ZMP判据作为双足机器人稳定行走的重要控制
准则最早由Vukobratovic等[9]提出,其定义沿足底分 布负载的和力矩为零的点为ZMP点,为实现稳定的 动态步行,ZMP点要始终位于支撑的多边形内.在此 基础上,Kajita等[10]将机器人简化为小车-桌子模 型,如图1所示,质量为M的小车在桌面上运动,在 桌底部的任意一点p产生的力矩子可表达为
子=-Mg(c -p) + M ch
(1)
式中:c为小车质心;h为质心等价高度;g为重力加 速度.根据ZMP定义[9],令子=0,即Pzmp = JP,式(1) 可简化为
PZMP = C - g
C'
(2)
即得到简化为小车-桌子模型的机器人ZMP方程.
___________________\\M^~] |
\"____________. (TO
—L-f
图1
小车-桌子模型
Fig. 1 Cart-table model
1. 2
基于ZMP方程的机器人稳定性控制
利用人为规划的理想ZMP轨迹,结合ZMP方
第9期
于建均,等:基于ZMP判据的仿人机器人步态模仿
1189
程获得机器人质心轨迹,并通过逆运动学求解驱 动角度是机器人稳定步态规划的主要方法,但其 运算量较大,并且行走姿态与人体行走姿态有较 大差异.为实现快速的机器人拟人运动步态规划,
本节在模仿学习的框架下,结合ZMP方程研究仿 人机器人的步态稳定性控制,首先通过ZMP方程 确定机器人行走模仿过程中的质心偏移量,其次 结合机器人的质心-角度雅可比矩阵进行补偿控 制,具体方法如下.
通过骨骼点采集器可获得人体示教过程中足部 2基于示教信息的支撑脚识别与质心加速 度的计算
在之前的工作中,已对人体示教数据向机器人
驱动角度的转换以及机器人质心的预估进行了说明 与演算.在此基础上,为实现仿人机器人对人体行 走姿态的模仿学习,还需要从人体示教数据中识别 出支撑脚与机器人质心加速度用于质心补偿量的 计算.
2.1基于滞回曲线的支撑脚选取
的运动轨迹,因为机器人与示教者之间存在着身高 差异,所以利用缩小后的足部运动轨迹作为行走模 仿过程中ZMP的期望轨迹,记为,ef.在由示教数 据驱动机器人的条件下,机器人的质心偏移会影响 ZMP轨迹,因此本文通过补偿质心偏移满足ZMP方 程,即
,f=c+Ac-g
ic
(3)
式中:c为机器人质心;Ac为质心补偿量;h为机器 人质心等价高度;g为重力加速度.令,“为机器人 实际ZMP点,可有
p res
= c -—h ■■ g
c
(4)
此时式(3)可转换为
Ac = pref ■
- p res
(5)
即质心补偿量的计算可由期望ZMP与机器人实际
ZMP的差值求得.
在确定质心补偿量后,需对机器人进行补偿控 制以保持机器人的行走平衡.对于机器人而言,机 器人质心的变化本质上是连杆位姿的变化,而连杆 位姿的变化本质上是关节角度的变化,因此,为通过 质心补偿实现机器人的动态平衡,需利用机器人质 心-角度雅可比矩阵J[11]表达质心位置与关节角的 关系并通过二次规划对补偿角度进行求解,数学描 述为
min ( -2- 啄qTWbq ) (6)s. t. Jbq = 8c
(7)解得
8q = W-1JT(JW-1JT) -18c
(8)
式中:8q为角度变化量;8c为质心变化量;W为一 个权值矩阵.通过调整权值矩阵W便可优化模仿 行为,完成质心校正,从而进行平衡性控制.
在仿人机器人行走过程中,支撑脚的合理选择 与切换是实现稳定行走的前提.在骨骼点采集时, 由于环境或设备影响会造成数据波动,通过判别两 脚在空间中的竖直高度来确定支撑脚的选取可能会 造成支撑脚的频繁切换,从而造成机器人行走的不 稳定,因此本文引入滞回曲线规划机器人模仿学习 过程中支撑脚的变化.如图2所示,k表示人体示教 数据中左右两脚竖直方向上的差值,通过设置参数
flag判别支撑脚状态,定义右脚支撑时,令flag = 1,
左脚支撑时,令flag =0.在flag = 1,即右脚支撑时, 若k< -0.01 m,则令flag =0,即切换为左脚支撑. 在flag = 0,即左脚支撑时,若k >0. 01 m,则令flag =
1,即切换为右脚支撑.通过滞回曲线选取支撑脚可
有效抑制因数据波动造成的不稳定.
-0.05 0------0.03 '------0.01 -----0.01
-----0.03 1-----0.05
1
k/m
图2
用于支撑脚选择的滞回曲线
Fig. 2 Hysteresis curve for the choice of support foot
2.2基于示教数据的机器人质心加速度预估
由1.2小节可知,为计算质心补偿量需得到机 器人质心及其加速度的量值,在之前的工作中,已提 出了一种在模仿学习架构下的机器人质心位置预估 方法,本文在此基础上,利用预估得到的质心空间坐 标点求取质心加速度,用于质心补偿量的计算.由于骨骼点采集的是离散的空间位置坐标点,
经计算可得到质心空间坐标点的一组离散值,因此 在t时刻的质心加速度为
1190北京工业大学学报2018 年
3.1人体示教过程中支撑脚的识别
利用Kinect2. 0作为人体示教动作采集器,将人
式中:T为采样周期;c为质心的空间位置坐标;C为 求取的机器人质心加速度.
体行走作为示教动作,如图5所示.在仅通过双脚 高度确定支撑脚的情况下,支撑脚的选取结果如图 6所示,利用2. 1小节中的滞回曲线识别人体示教 过程中支撑脚的选取,结果如图7所示.
3仿真设计与分析
NAO机器人是由Aldebaran Robotics公司研发
的小型仿人机器人.NAO机器人拥有13个关节,共 25个自由度,很适合作为机器人控制算法研究的平 台,其模型也被WEBOTS机器人仿真平台所收录, 以更好地进行动力学测试与分析.因此搭建的NAO 机器人行走模仿系统,骨骼点信息采集及示教数据
的获取采用C#语言开发实现,示教数据的处理基于
Matlab环境开发实现,将计算得到的运动信息发送
到WEBOTS的NAO机器人模型中,实现对人体行 走过程模仿.系统结构图如图3所示.
图3
机器人动作模仿的系统结构
Fig. 3 Structure of robot imitation system
Kinect2. 0是微软发布的最新一代的体感摄影
机,其具备完善的人体骨骼跟踪功能,因此本文利用
Kinect作为采集器进行示教数据的采集.Kinect的
骨骼跟踪数据由25个关节空间坐标组成,S = [S1, ^,…,^[其中〜:^^^丄如图斗所示.
图4
Kinect2. 0提取的人体骨骼信息
Fig. 4 Skeleton point information of human body
extracted from Kinect2. 0
⑷片段一
(1〕)片段二 (c)片段三
(d)片段四
图5
人体示教动作
Fig. 5 Human 爷 s demonstration
图6
基于双脚高度的支撑脚选取
Fig. 6 Support foot select based on height between
each foot
图7
基于滞回曲线的支撑脚选取
Fig. 7 Support foot select based on hysteresis curve
由仿真结果可以看出,仅通过人体脚部空间 高度选取支撑脚会造成支撑脚错误的切换,这会 引起行走过程的不稳定.而利用滞回曲线确定支 撑脚的选取可有效地避免因采集数据波动造成支 撑脚错误的切换,以便进行后续的稳定性控制.3.2仿人机器人对人体行走过程的模仿学习
在支撑脚确定的条件下,将示教数据转换为机 器人驱动角度,在不结合ZMP判据进行补偿控制 下,令机器人对人体步态进行模仿学习,其ZMP轨
第9期
于建均,等:基于ZMP判据的仿人机器人步态模仿
1191
迹如图8所示.
图8未进行补偿调整的机器人ZMP轨迹
Fig. 8 ZMP trajectory of robot before compensation
从结果可以看出,在不引入ZMP判据的情况 下,由于示教动作是行走这一对动态性能要求较高
的动作,因此在不考虑机器人质心加速度的影响时, 机器人行走模仿过程中,ZMP轨迹波动剧烈,图中 方框表示机器人足部支撑范围,显然ZMP轨迹偏离 足部支撑中心较大,这会造成机器人运动的不稳定, 无法完成运动过程的模仿.
接着利用本文提出的方法进行机器人行走仿真 测试,将缩小后的人体示教过程中足部的运动轨迹 作为行走模仿过程中ZMP的期望轨迹,并对机器人 质心轨迹进行预估,从而进行质心补偿控制后,可得 到行走模仿的过程,如图9所示,从结果可以看出, 经补偿控制后的行走模仿过程中,ZMP轨迹波动较 小,并且更靠近足部支撑范围的中心,因此稳定性更 好.在WEBOTS中的NAO机器人模型上进行步态 模仿测试,如图10所示,机器人能够稳定地进行人 体行走过程的模仿.
分析模仿学习过程中关节角度的变化,以右胯 俯仰角为例,如图11所示,绿色虚线表示人体示教 运动中的关节角度变化,红色实线表示模仿学习过 程中引入ZMP判据后的机器人关节角度变化.从 结果可以看出,通过调整权值矩阵可使机器人在保 证平稳模仿的过程中与人体关节示教角度保持相 似,这一特点可令机器人的模仿过程更具拟人化,凸 显了模仿学习的意义.
最后,在机器人可对人体行走步态进行平稳 模仿的前提下,考察对非典型的人体运动步态的
图9进行补偿调整后的机器人ZMP轨迹
Fig. 9摇 ZMP trajectory of robot after compensation
(a)步态
(b)步态 (c)步态片段一片段二 (d)步态片段三片段四
图1
0仿人机器人行走步态 Fig. 10 Gait of humanoid robot
图Trajectory of rhippitch before 1
1右胯俯仰角调整前后的轨迹
Fig.11 adjustment and
after adjustment through balance algorithm
模仿能力.以左右摇摆幅度较大的人体原地踏步 行走过程作为示教运动,如图12所示,在
WEBOTS中的NAO机器人模型上进行步态模仿测
试,结果如图13所示,经支撑脚选取与稳定性算 法调整后,NAO机器人能够完成非典型人体步态 的平稳模仿.
1192北京工业大学学报2018 年
[C]椅 35th Chinese Control Conference. New York: IEEE,2016: 6019-6024.
[3] YU Z,CHEN X,HUANG Q,et al. Gait planning of
omnidirectional walk on inclined ground for biped robots [J]. IEEE Transactions on Systems Man & Cybernetics Systems,2015,46(7): 1-10.
[4] EREZ T,LOWREY K,TASSA Y,et al. An integrated (a)片段一 (1〕)片段二 (c)片段三 (d) ^段四
system for real-time model predictive control of humanoid 图12人体示教动作
robots [ C ]椅 Ieee-Ras International Conference on Fig. 12 Human 爷 s demonstration
Humonolod Robots. NewYork: IEEE,2013: 292-299.[5] LEE D W, LEE M J, KIM M S. Whole body imitation of
(a)步态 (b)步态 (c)步态 (d)步态片段一 片段二 片段三 片段四图13仿人机器人非典型步态的模仿 Fig. 13 Atypical gait imitation of humanoid robot4结论
1) 仿真结果表明,通过质心补偿可以有效地将 ZMP点控制在稳定区域,从而满足对人体运动姿态 模仿学习的稳定性.
2) 利用滞回曲线选取支撑脚可有效地减少数
据波动所造成的影响,使机器人对人体姿态的模仿
学习更加平稳.
3) 不足之处在于,由于要对示教动作进行整体
的分析与计算,因此无法实现机器人对人体运动姿
态的实时模仿学习.下一步希望通过引入回归算法
对示教信息与机器人驱动信息进行回归处理,从而 利用训练后的模型进行机器人对人体运动姿态的实 时模仿学习[12].参考文献:
[1] DONG E,WANG D,CHEN C,et al. Realization of biped
robot gait planning based on NAO robot development
platform [ C ]椅 IEEE International Conference on
Mechatronics and Automation. New York: IEEE,2016:
1073-1077.
[2] WANG X,WANG H,TIAN Y. Gait planning and hybrid
model based tracking control of lower extremity exoskeleton
human motion with humanoid robot via ZMP stability criterion [C]椅 IEEE-RAS, International Conference on Humanoid Robots. New York: IEEE,2015: 1003-1006.[6] BOUTIN L,EON A,ZEGHLOUL S,et al. An auto
adaptable algorithm to generate human-like locomotion for different humanoid robots based on motion capture data
[C]椅IEEE/ RSJ International Conference on Intelligent Robots and Systems. New York: IEEE,2010: 1256
1261.[7] HU K, OTT C, LEE D. Online human walking imitation in task and joint space based on quadratic programming
[C]椅 IEEE International Conference on Robotics and Automation. New York: IEEE,2014: 3458-3464.
[8] HOU Y, ZHAO M. Follow my step: a framework for biped robots to imitate human walking [C]椅 IEEE International Conference on Robotics and Biomimetics. New York: IEEE,2014: 2471-2476.[9] VUKOBRATOVIC M,SEPANEKO Y. On the stability of
anthropomorphic systems [ J] . Mathematical Biosciences,
2004, 15(1): 1-37.
[10] KAJITAS,KANEHIRO F,KANEKO K,et al. Biped
walking pattern generation by using preview control of zero-moment point [C]椅 IEEE International Conference on Robotics and Automation. New York: IEEE Xplore,
2003: 1620-1626.
[11] SUGIHARA T,NAKAMURA Y. Whole-body cooperative balancing of humanoid robot using COG Jacobian [C]椅 IEEE/RSJ International Conference on Intelligent Robots and Systems. New York: IEEE, 2002: 2575-2580.[12] FERREIRA J P,CRISOSTOMO M M,COIMBRA A P. SVR versus neural-fuzzy network controllers for the sagittal balance of a biped robot [ J] . Neural Networks IEEE Transactions on,2009,20(12): 1885-1897.(责任编辑吕小红)
因篇幅问题不能全部显示,请点此查看更多更全内容