基于强化学习的波动鳍推进水下作业机器人悬停控制

本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性....

Full description

Saved in:
Bibliographic Details
Published in控制理论与应用 Vol. 39; no. 11; pp. 2092 - 2099
Main Authors 马睿宸, 白雪剑, 王宇, 王睿, 王硕
Format Journal Article
LanguageChinese
Published 中国科学院大学人工智能学院,北京100049%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 01.11.2022
中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190
中国科学院大学,北京100049
Subjects
Online AccessGet full text
ISSN1000-8152
DOI10.7641/CTA.2022.11054

Cover

More Information
Summary:本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性.
ISSN:1000-8152
DOI:10.7641/CTA.2022.11054