基于DDPG算法的双轮腿机器人运动控制研究
TP242.6; 轮腿式机器人兼具轮式和足式机器人的机动性和灵活性,在多种场景中具有广泛的应用前景.针对双轮腿机器人在崎岖地形运动控制缺陷、高度依赖于精确动力学模型、无法自适应求解等问题,提出一种基于深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法的双轮腿机器人控制方法.首先,分析了双轮腿机器人模型及其模糊动力学模型;然后,使用DDPG算法生成双轮腿机器人在崎岖地面的运动控制策略;最后,为了验证控制器性能,分别进行了 3组运动控制对比实验.仿真实验表明,在缺少地面状况先验知识的条件下,采用DDPG算法生成的运动控制策略实现了双轮腿式机器人...
Saved in:
Published in | 系统工程与电子技术 Vol. 45; no. 4; pp. 1144 - 1151 |
---|---|
Main Authors | , , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
东南大学自动化学院,江苏南京211189%东南大学网络空间安全学院,江苏南京211189%东南大学自动化学院,江苏南京211189
01.04.2023
南京应用数学中心,江苏南京211135%电子科技大学基础与前沿研究院,四川成都610054 |
Subjects | |
Online Access | Get full text |
ISSN | 1001-506X |
DOI | 10.12305/j.issn.1001-506X.2023.04.23 |
Cover
Summary: | TP242.6; 轮腿式机器人兼具轮式和足式机器人的机动性和灵活性,在多种场景中具有广泛的应用前景.针对双轮腿机器人在崎岖地形运动控制缺陷、高度依赖于精确动力学模型、无法自适应求解等问题,提出一种基于深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法的双轮腿机器人控制方法.首先,分析了双轮腿机器人模型及其模糊动力学模型;然后,使用DDPG算法生成双轮腿机器人在崎岖地面的运动控制策略;最后,为了验证控制器性能,分别进行了 3组运动控制对比实验.仿真实验表明,在缺少地面状况先验知识的条件下,采用DDPG算法生成的运动控制策略实现了双轮腿式机器人在崎岖地面快速稳定运动的功能,其平均速度相比双轮机器人提高了约29.2%,姿态角偏移峰值相比双足机器人分别减小了约43.9%、66%、50%. |
---|---|
ISSN: | 1001-506X |
DOI: | 10.12305/j.issn.1001-506X.2023.04.23 |