基于强化学习的波动鳍推进水下作业机器人悬停控制
本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性....
Saved in:
Published in | 控制理论与应用 Vol. 39; no. 11; pp. 2092 - 2099 |
---|---|
Main Authors | , , , , |
Format | Journal Article |
Language | Chinese |
Published |
中国科学院大学人工智能学院,北京100049%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190
01.11.2022
中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 中国科学院大学,北京100049 |
Subjects | |
Online Access | Get full text |
ISSN | 1000-8152 |
DOI | 10.7641/CTA.2022.11054 |
Cover
Summary: | 本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性. |
---|---|
ISSN: | 1000-8152 |
DOI: | 10.7641/CTA.2022.11054 |