基于DQN的旋翼无人机着陆控制算法

V448.2; 针对无人机的着陆控制问题,研究了一种基于深度强化学习理论的旋翼无人机着陆控制算法.利用深度强化学习训练生成无人机智能体,根据观测结果给出动作指令,以实现自主着陆控制.首先,基于随机过程理论,将旋翼无人机的着陆控制问题转化为马尔可夫决策过程.其次,设计分别考虑无人机横向和纵向控制过程的奖励函数,将着陆控制问题转入强化学习框架.然后,采用深度Q网络(deep Q network,DQN)算法求解该强化学习问题,通过大量训练得到着陆控制智能体.最后,通过多种工况下的着陆平台进行大量的数值模拟和仿真分析,验证了算法的有效性....

Full description

Saved in:
Bibliographic Details
Published in系统工程与电子技术 Vol. 45; no. 5; pp. 1451 - 1460
Main Authors 唐进, 梁彦刚, 白志会, 黎克波
Format Journal Article
LanguageChinese
Published 国防科技大学空天科学学院,湖南长沙410073 01.05.2023
空天任务智能规划与仿真湖南省重点实验室,湖南长沙410073%中国人民解放军31102部队,江苏南京210000
Subjects
Online AccessGet full text
ISSN1001-506X
DOI10.12305/j.issn.1001-506X.2023.05.21

Cover

Abstract V448.2; 针对无人机的着陆控制问题,研究了一种基于深度强化学习理论的旋翼无人机着陆控制算法.利用深度强化学习训练生成无人机智能体,根据观测结果给出动作指令,以实现自主着陆控制.首先,基于随机过程理论,将旋翼无人机的着陆控制问题转化为马尔可夫决策过程.其次,设计分别考虑无人机横向和纵向控制过程的奖励函数,将着陆控制问题转入强化学习框架.然后,采用深度Q网络(deep Q network,DQN)算法求解该强化学习问题,通过大量训练得到着陆控制智能体.最后,通过多种工况下的着陆平台进行大量的数值模拟和仿真分析,验证了算法的有效性.
AbstractList V448.2; 针对无人机的着陆控制问题,研究了一种基于深度强化学习理论的旋翼无人机着陆控制算法.利用深度强化学习训练生成无人机智能体,根据观测结果给出动作指令,以实现自主着陆控制.首先,基于随机过程理论,将旋翼无人机的着陆控制问题转化为马尔可夫决策过程.其次,设计分别考虑无人机横向和纵向控制过程的奖励函数,将着陆控制问题转入强化学习框架.然后,采用深度Q网络(deep Q network,DQN)算法求解该强化学习问题,通过大量训练得到着陆控制智能体.最后,通过多种工况下的着陆平台进行大量的数值模拟和仿真分析,验证了算法的有效性.
Author 白志会
唐进
梁彦刚
黎克波
AuthorAffiliation 国防科技大学空天科学学院,湖南长沙410073;空天任务智能规划与仿真湖南省重点实验室,湖南长沙410073%中国人民解放军31102部队,江苏南京210000
AuthorAffiliation_xml – name: 国防科技大学空天科学学院,湖南长沙410073;空天任务智能规划与仿真湖南省重点实验室,湖南长沙410073%中国人民解放军31102部队,江苏南京210000
Author_FL LIANG Yangang
LI Kebo
TANG Jin
BAI Zhihui
Author_FL_xml – sequence: 1
  fullname: TANG Jin
– sequence: 2
  fullname: LIANG Yangang
– sequence: 3
  fullname: BAI Zhihui
– sequence: 4
  fullname: LI Kebo
Author_xml – sequence: 1
  fullname: 唐进
– sequence: 2
  fullname: 梁彦刚
– sequence: 3
  fullname: 白志会
– sequence: 4
  fullname: 黎克波
BookMark eNo9j7tKA0EYRqeIYIx5Cythx_-f2dnZKSVeISiCgl2Y2Z0NWWQCjuKlshARhHSyKIp2djaCxSL4MskuvoURxerAV5yPM0cabugsIQsIFBkHsZTTgfeOIgAGAqJ9yoBxCoIybJDm_zxL2t4PDAjkUoAMmySYPJXjcrSys1XfX1bFTf35URXP47KsHsr68eLr7qoavUyu3-vXonq7nSczmT7wtv3HFtlbW93tbATd7fXNznI38Dh1BwalMoyzSFluITZoVAbcWskwSUNASGzCUYaptFpHkWYqlhZVxkwEKHjMW2Tx13uiXaZdv5cPjw_d9LF3etRPztLz3P8EggCG_Bvgelio
ClassificationCodes V448.2
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.12305/j.issn.1001-506X.2023.05.21
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Engineering
DocumentTitle_FL Landing control algorithm of rotor UAV based on DQN
EndPage 1460
ExternalDocumentID xtgcydzjs202305021
GrantInformation_xml – fundername: 国家自然科学基金
  funderid: (12002370)
GroupedDBID -0Y
2B.
4A8
5XA
5XJ
92E
92I
93N
ABJNI
ACGFS
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CUBFJ
CW9
PSX
TCJ
TGP
U1G
U5S
ID FETCH-LOGICAL-s1051-b179b23269e3e08b1b9f03ee721cd4010cec3174d7eaa66a2987e19f2b6015383
ISSN 1001-506X
IngestDate Thu May 29 04:00:31 EDT 2025
IsPeerReviewed false
IsScholarly true
Issue 5
Keywords 着陆控制
深度Q网络算法
深度强化学习
旋翼无人机
马尔可夫决策过程
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1051-b179b23269e3e08b1b9f03ee721cd4010cec3174d7eaa66a2987e19f2b6015383
PageCount 10
ParticipantIDs wanfang_journals_xtgcydzjs202305021
PublicationCentury 2000
PublicationDate 2023-05-01
PublicationDateYYYYMMDD 2023-05-01
PublicationDate_xml – month: 05
  year: 2023
  text: 2023-05-01
  day: 01
PublicationDecade 2020
PublicationTitle 系统工程与电子技术
PublicationTitle_FL Systems Engineering and Electronics
PublicationYear 2023
Publisher 国防科技大学空天科学学院,湖南长沙410073
空天任务智能规划与仿真湖南省重点实验室,湖南长沙410073%中国人民解放军31102部队,江苏南京210000
Publisher_xml – name: 国防科技大学空天科学学院,湖南长沙410073
– name: 空天任务智能规划与仿真湖南省重点实验室,湖南长沙410073%中国人民解放军31102部队,江苏南京210000
SSID ssib051375074
ssib002263377
ssib001102898
ssib057620160
ssib023168126
ssib023646287
ssj0042237
Score 2.3982267
Snippet V448.2; 针对无人机的着陆控制问题,研究了一种基于深度强化学习理论的旋翼无人机着陆控制算法.利用深度强化学习训练生成无人机智能体,根据观测结果给出动作指令,以实现自...
SourceID wanfang
SourceType Aggregation Database
StartPage 1451
Title 基于DQN的旋翼无人机着陆控制算法
URI https://d.wanfangdata.com.cn/periodical/xtgcydzjs202305021
Volume 45
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
journalDatabaseRights – providerCode: PRVEBS
  databaseName: Inspec with Full Text
  issn: 1001-506X
  databaseCode: ADMLS
  dateStart: 20180801
  customDbUrl:
  isFulltext: true
  dateEnd: 99991231
  titleUrlDefault: https://www.ebsco.com/products/research-databases/inspec-full-text
  omitProxy: false
  ssIdentifier: ssib057620160
  providerName: EBSCOhost
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV3NaxUxEA-1BdGD-InfFGyOW5Nskk2O2b4tRWxBbKG3srtvt8XDE-wraE8eRASxNymKojdvXgQPD8F_pn0P_wtnstvdBYtUL0s2mWRmMi87v3lMEkLmVKZTkXIblJmEAKWMiiBVKg24LUKpS5ErgXuHl1f00pq8t67Wp0696WQt7Qyz-Xz32H0l_2NVqAO74i7Zf7BsMyhUQBnsC0-wMDxPZGOaKGoXaexoIvFpkt6DFZpE1EJZ0kRTG1ETY00MZAt1jWM1PXaEmgVfgF49zHtILLWWGo1NJqEuQi7G0FgjjUtwBGiKQ1rdW3kEbT2XkMYVuxgFg44xdFG-o_GSAF-DwyI7KCukcT1qmWfnvABeJNekHHstpScxqIeN2xZNnQAw7Dn1qNO1rNa1JBGqA41IsuiFlzgVXRKL8qJQ0Fl5Mb1-TnT_ExGdDET_K_ZyxX5omDIQTXg9gR_vKAPqyXoSXSUh0Fg_41WT7fRqaJqCNwboKLzxYnitdOx5TeDVa4VNAiglZqOEHUeDqWyK-VscG09UHaxZrzjVcSt4nXIHooB3Y8e6P4gnlfd_yGO-4TGPc4QH1Areuv0mGfPpcDN_1t99tI1UTDE8lmFGgJNk02TG9ZbvP2zxNcLRTnwO2D0M243MAm9B4y2ex8sJtGjxv-IhANQ23lDIhGN8XkEnCVjV34Z0JPhpMnek1t2_KOU33A3KdLDZwYar58m5OqibddUKvUCmdrcukrOdoz4vkeDw0-hgtAfrc_L-xXj_9eTnj_H-54PRaPxhNPn4_Ne7l-O9L4evvk--7o-_vb1M1haT1YWloL6qJNiGAIUHGfi1DIITDZ-4gpmMZ7ZkYVFEgud9yTjLixyQuuxHRZpq-DxaExXcliLTDDFHeIVMDx4PiqtkNi-5TgG3yygF6F2wrG9Sa3KjUt63_Ty7Ru7Uym7Un6LtjT9NeP1EVDfImXb53CTTwyc7xS0A2cPsdm3632PqlqY
linkProvider EBSCOhost
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8EDQN%E7%9A%84%E6%97%8B%E7%BF%BC%E6%97%A0%E4%BA%BA%E6%9C%BA%E7%9D%80%E9%99%86%E6%8E%A7%E5%88%B6%E7%AE%97%E6%B3%95&rft.jtitle=%E7%B3%BB%E7%BB%9F%E5%B7%A5%E7%A8%8B%E4%B8%8E%E7%94%B5%E5%AD%90%E6%8A%80%E6%9C%AF&rft.au=%E5%94%90%E8%BF%9B&rft.au=%E6%A2%81%E5%BD%A6%E5%88%9A&rft.au=%E7%99%BD%E5%BF%97%E4%BC%9A&rft.au=%E9%BB%8E%E5%85%8B%E6%B3%A2&rft.date=2023-05-01&rft.pub=%E5%9B%BD%E9%98%B2%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6%E7%A9%BA%E5%A4%A9%E7%A7%91%E5%AD%A6%E5%AD%A6%E9%99%A2%2C%E6%B9%96%E5%8D%97%E9%95%BF%E6%B2%99410073&rft.issn=1001-506X&rft.volume=45&rft.issue=5&rft.spage=1451&rft.epage=1460&rft_id=info:doi/10.12305%2Fj.issn.1001-506X.2023.05.21&rft.externalDocID=xtgcydzjs202305021
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fxtgcydzjs%2Fxtgcydzjs.jpg