基于强化学习的波动鳍推进水下作业机器人悬停控制

本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性....

Full description

Saved in:

Bibliographic Details
Published in	控制理论与应用 Vol. 39; no. 11; pp. 2092 - 2099
Main Authors	马睿宸, 白雪剑, 王宇, 王睿, 王硕
Format	Journal Article
Language	Chinese
Published	中国科学院大学人工智能学院,北京100049%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 01.11.2022 中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 中国科学院大学,北京100049
Subjects	强化学习神经网络悬停控制波动鳍水下作业机器人
Online Access	Get full text
ISSN	1000-8152
DOI	10.7641/CTA.2022.11054

Cover

More Information
Summary:	本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性.
ISSN:	1000-8152
DOI:	10.7641/CTA.2022.11054