基于强化学习的波动鳍推进水下作业机器人悬停控制
本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性....
        Saved in:
      
    
          | Published in | 控制理论与应用 Vol. 39; no. 11; pp. 2092 - 2099 | 
|---|---|
| Main Authors | , , , , | 
| Format | Journal Article | 
| Language | Chinese | 
| Published | 
            中国科学院大学人工智能学院,北京100049%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190
    
        01.11.2022
     中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 中国科学院大学,北京100049  | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 1000-8152 | 
| DOI | 10.7641/CTA.2022.11054 | 
Cover
| Abstract | 本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性. | 
    
|---|---|
| AbstractList | 本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性. | 
    
| Author | 王宇 王睿 白雪剑 王硕 马睿宸  | 
    
| AuthorAffiliation | 中国科学院大学,北京100049;中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190;中国科学院大学人工智能学院,北京100049%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 | 
    
| AuthorAffiliation_xml | – name: 中国科学院大学,北京100049;中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190;中国科学院大学人工智能学院,北京100049%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 | 
    
| Author_FL | WANG Shuo BAI Xue-jian WANG Rui WANG Yu MA Rui-chen  | 
    
| Author_FL_xml | – sequence: 1 fullname: MA Rui-chen – sequence: 2 fullname: BAI Xue-jian – sequence: 3 fullname: WANG Yu – sequence: 4 fullname: WANG Rui – sequence: 5 fullname: WANG Shuo  | 
    
| Author_xml | – sequence: 1 fullname: 马睿宸 – sequence: 2 fullname: 白雪剑 – sequence: 3 fullname: 王宇 – sequence: 4 fullname: 王睿 – sequence: 5 fullname: 王硕  | 
    
| BookMark | eNotjz1Lw0Ach2-oYK1d_Qwuiff_55K7jCXUFyi41Llc4kXUkIJBJG6Kg_jSUbAGFAftoCBUpAbFL5OL-i2M6PQMP3h-PDOkFvdjRcgcUJM7DBa8bstEimgCUJvVSB0opYYAG6dJM0k2fUqrBbkNddLW13mRD_Rbrs8u9ONd8XrzOTwqx7f6ZPQ9Pi8Ho6-Pq_LpuZicFu9ZMRmWWa4vR0Wel4cP-iArB_f6-GWWTIUySlTznw2yttjuestGZ3VpxWt1jASohQZn0hYC0A58JYFy5vvK5Qq5I0DIkILAUAVCMJepgCNzbaDAOSpLrmPghFaDzP9592Qcynijt9Xf3Ymrx972fhSlafqbXbUBWj9thWbs | 
    
| ContentType | Journal Article | 
    
| Copyright | Copyright © Wanfang Data Co. Ltd. All Rights Reserved. | 
    
| Copyright_xml | – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved. | 
    
| DBID | 2B. 4A8 92I 93N PSX TCJ  | 
    
| DOI | 10.7641/CTA.2022.11054 | 
    
| DatabaseName | Wanfang Data Journals - Hong Kong WANFANG Data Centre Wanfang Data Journals 万方数据期刊 - 香港版 China Online Journals (COJ) China Online Journals (COJ)  | 
    
| DatabaseTitleList | |
| DeliveryMethod | fulltext_linktorsrc | 
    
| Discipline | Engineering | 
    
| DocumentTitle_FL | Hovering control of an underwater vehicle-manipulator system propelled by undulatory fins via reinforcement learning | 
    
| EndPage | 2099 | 
    
| ExternalDocumentID | kzllyyy202211012 | 
    
| GrantInformation_xml | – fundername: (国家自然科学基金); (国家自然科学基金); (国家自然科学基金); (国家自然科学基金); (国家自然科学基金); (中国科学院国际合作局对外合作重点项目) funderid: (国家自然科学基金); (国家自然科学基金); (国家自然科学基金); (国家自然科学基金); (国家自然科学基金); (中国科学院国际合作局对外合作重点项目)  | 
    
| GroupedDBID | -01 -0Y 2B. 4A8 5XA 5XJ 92H 92I 93N ABJNI ACGFS ALMA_UNASSIGNED_HOLDINGS CCEZO CCVFK CUBFJ CW9 PSX TCJ TGT U1G U5S UY8  | 
    
| ID | FETCH-LOGICAL-s1032-74a588125cbea1074bbe97e276818af0182fec88494ec72495101772e3ad2c6f3 | 
    
| ISSN | 1000-8152 | 
    
| IngestDate | Thu May 29 04:08:30 EDT 2025 | 
    
| IsPeerReviewed | true | 
    
| IsScholarly | true | 
    
| Issue | 11 | 
    
| Keywords | 强化学习 神经网络 悬停控制 波动鳍 水下作业机器人  | 
    
| Language | Chinese | 
    
| LinkModel | OpenURL | 
    
| MergedId | FETCHMERGED-LOGICAL-s1032-74a588125cbea1074bbe97e276818af0182fec88494ec72495101772e3ad2c6f3 | 
    
| PageCount | 8 | 
    
| ParticipantIDs | wanfang_journals_kzllyyy202211012 | 
    
| PublicationCentury | 2000 | 
    
| PublicationDate | 2022-11-01 | 
    
| PublicationDateYYYYMMDD | 2022-11-01 | 
    
| PublicationDate_xml | – month: 11 year: 2022 text: 2022-11-01 day: 01  | 
    
| PublicationDecade | 2020 | 
    
| PublicationTitle | 控制理论与应用 | 
    
| PublicationTitle_FL | Control Theory & Applications | 
    
| PublicationYear | 2022 | 
    
| Publisher | 中国科学院大学人工智能学院,北京100049%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 中国科学院大学,北京100049  | 
    
| Publisher_xml | – name: 中国科学院大学,北京100049 – name: 中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190 – name: 中国科学院大学人工智能学院,北京100049%中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190  | 
    
| SSID | ssib001102751 ssib002258297 ssib023646306 ssib057620041 ssib051372463 ssj0042201 ssib023167526  | 
    
| Score | 2.3890142 | 
    
| Snippet | 本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数-力映射模型,建立了基于马尔可夫决... | 
    
| SourceID | wanfang | 
    
| SourceType | Aggregation Database | 
    
| StartPage | 2092 | 
    
| Title | 基于强化学习的波动鳍推进水下作业机器人悬停控制 | 
    
| URI | https://d.wanfangdata.com.cn/periodical/kzllyyy202211012 | 
    
| Volume | 39 | 
    
| hasFullText | 1 | 
    
| inHoldings | 1 | 
    
| isFullTextHit | |
| isPrint | |
| journalDatabaseRights | – providerCode: PRVEBS databaseName: Inspec with Full Text issn: 1000-8152 databaseCode: ADMLS dateStart: 20170701 customDbUrl: isFulltext: true dateEnd: 99991231 titleUrlDefault: https://www.ebsco.com/products/research-databases/inspec-full-text omitProxy: false ssIdentifier: ssib057620041 providerName: EBSCOhost  | 
    
| link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV1LaxRBEB7i5qIH8YlvItjHjfPonu4-9sxOCGK8mEBuYWYyq2BYwSSH5KZ4EB85CsaA4kFzUBAikiyKf2Zn1X9hVc3M7uQhRC_DbHV1Pb4qerqWfljWNZXZqUgcvyk011CgzKdNDYNg00vbGbe5nBe0Q27qlj85w2_MitmRxk5t1dLyUjKerh64r-R_ogo0iCvukv2HyA6EAgHeIb7whAjD81AxZpFgeoIFhkUcnypCShASRTAVMu3ji2kx4xOPZsZmkWQamDmLfBZ4zLjEbJhRLNJIUS1sAmlIUSyYYDogZpsFnOQopgJ6aTEdlhSQCTy60q41dSfDAmpSLjMh6XKoV6FCEgW0-PWJ8v5WMttmykeTTFR5rSqvDdOceDjorfIIHTKa1EJLC11BPKB3jUWireAJ8IKfpsAO3p06C2hBl6nz8ONdaynl1_9GgQrc2fU3SmkxxAMBCkipRCe1U4uTJuwoKoaXEAxDaEp8A-goCHFNFADCI4H75LhhlQ2ylGBCh6o25op_NAm0yAqiImMGeSYxt4oYAOQYMB9hVHbpSJFVABLkAfBAngUEGzwhibEXxNuphXkQ3f2pMDC1CCZZCIYpMh7kQ6IXTTqiFDBoZEEBS_4CiFNcKVt-o_EwBOWIXR_x4kSsarBy6p9ku7hssZze4Vbxg6YO0uc4dQinzTimB26PKU4333Mc-73VhYWVlRXkcfBsvCPWqAsTCrthjZrW1M3bw1rEwRUBtbmxK3Abe_XbxSMoxLD2wYscfG-45EE4nnRrV1UIVGLzwfo17rp0t_sAjeJEWnTj-m4naDtipx137tRmztMnrONlyTtmivHrpDWyeveUdax2EOppK8rfdHvdtfxbN3_-Mv_0vrfz9uf64_7Wu_zp5u-tF_21zV8_Xvc_f-ltP-t93-htr_c3uvmrzV6323_0MX-40V_7kD_5esaamYimw8lmecFLcxHP8WxKHgsFFYZIkyzGleFJkmmZAZ5QRsRt21FuO0uV4ppnKaChaQIh3cyL593Ub3tnrUbnfic7Z40pnsRSZvNeEmdceFwnsef7SZwkbZ60tXfeulqCMFcO4Itze0N54RA8F62jw9HjktVYerCcXYayZCm5UibAH1ZA4P4 | 
    
| linkProvider | EBSCOhost | 
    
| openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E7%9A%84%E6%B3%A2%E5%8A%A8%E9%B3%8D%E6%8E%A8%E8%BF%9B%E6%B0%B4%E4%B8%8B%E4%BD%9C%E4%B8%9A%E6%9C%BA%E5%99%A8%E4%BA%BA%E6%82%AC%E5%81%9C%E6%8E%A7%E5%88%B6&rft.jtitle=%E6%8E%A7%E5%88%B6%E7%90%86%E8%AE%BA%E4%B8%8E%E5%BA%94%E7%94%A8&rft.au=%E9%A9%AC%E7%9D%BF%E5%AE%B8&rft.au=%E7%99%BD%E9%9B%AA%E5%89%91&rft.au=%E7%8E%8B%E5%AE%87&rft.au=%E7%8E%8B%E7%9D%BF&rft.date=2022-11-01&rft.pub=%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E9%99%A2%E5%A4%A7%E5%AD%A6%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E5%AD%A6%E9%99%A2%2C%E5%8C%97%E4%BA%AC100049%25%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E9%99%A2%E8%87%AA%E5%8A%A8%E5%8C%96%E7%A0%94%E7%A9%B6%E6%89%80%E5%A4%8D%E6%9D%82%E7%B3%BB%E7%BB%9F%E7%AE%A1%E7%90%86%E4%B8%8E%E6%8E%A7%E5%88%B6%E5%9B%BD%E5%AE%B6%E9%87%8D%E7%82%B9%E5%AE%9E%E9%AA%8C%E5%AE%A4%2C%E5%8C%97%E4%BA%AC100190&rft.issn=1000-8152&rft.volume=39&rft.issue=11&rft.spage=2092&rft.epage=2099&rft_id=info:doi/10.7641%2FCTA.2022.11054&rft.externalDocID=kzllyyy202211012 | 
    
| thumbnail_s | http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fkzllyyy%2Fkzllyyy.jpg |