基于图卷积深度强化学习的协同空战机动决策方法
TG142.71; 针对多无人机智能协同空战对抗决策问题,提出了一种基于长短期记忆与竞争图卷积深度强化学习的多机协同空战机动对抗决策方法.首先,对多机协同空战对抗问题进行描述;其次,在竞争Q网络中,引入长短期记忆网络用于处理带有强时序相关性的空战信息,接着,搭建图卷积网络作为多机之间的通信基础,提出基于长短期记忆与竞争图卷积深度强化学习算法的协同空战训练框架,并对协同空战决策训练算法进行了设计.二对一空战仿真结果验证了本文所提出的协同智能对抗决策方法的有效性,其具有决策速度快、学习过程稳定的特点以及适应空战环境快速变化下的协同策略学习能力....
Saved in:
Published in | 工程科学学报 Vol. 46; no. 7; pp. 1227 - 1236 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Chinese |
Published |
空基信息感知与融合全国重点实验室,洛阳 471000
01.07.2024
厦门大学航空航天学院,厦门 361102%中国空空导弹研究院,洛阳 471000%厦门大学航空航天学院,厦门 361102 |
Subjects | |
Online Access | Get full text |
ISSN | 2095-9389 |
DOI | 10.13374/j.issn2095-9389.2023.09.25.004 |
Cover
Summary: | TG142.71; 针对多无人机智能协同空战对抗决策问题,提出了一种基于长短期记忆与竞争图卷积深度强化学习的多机协同空战机动对抗决策方法.首先,对多机协同空战对抗问题进行描述;其次,在竞争Q网络中,引入长短期记忆网络用于处理带有强时序相关性的空战信息,接着,搭建图卷积网络作为多机之间的通信基础,提出基于长短期记忆与竞争图卷积深度强化学习算法的协同空战训练框架,并对协同空战决策训练算法进行了设计.二对一空战仿真结果验证了本文所提出的协同智能对抗决策方法的有效性,其具有决策速度快、学习过程稳定的特点以及适应空战环境快速变化下的协同策略学习能力. |
---|---|
ISSN: | 2095-9389 |
DOI: | 10.13374/j.issn2095-9389.2023.09.25.004 |