基于图卷积深度强化学习的协同空战机动决策方法

TG142.71; 针对多无人机智能协同空战对抗决策问题,提出了一种基于长短期记忆与竞争图卷积深度强化学习的多机协同空战机动对抗决策方法.首先,对多机协同空战对抗问题进行描述;其次,在竞争Q网络中,引入长短期记忆网络用于处理带有强时序相关性的空战信息,接着,搭建图卷积网络作为多机之间的通信基础,提出基于长短期记忆与竞争图卷积深度强化学习算法的协同空战训练框架,并对协同空战决策训练算法进行了设计.二对一空战仿真结果验证了本文所提出的协同智能对抗决策方法的有效性,其具有决策速度快、学习过程稳定的特点以及适应空战环境快速变化下的协同策略学习能力....

Full description

Saved in:

Bibliographic Details
Published in	工程科学学报 Vol. 46; no. 7; pp. 1227 - 1236
Main Authors	欧洋, 郭正玉, 罗德林, 缪克华
Format	Journal Article
Language	Chinese
Published	空基信息感知与融合全国重点实验室,洛阳 471000 01.07.2024 厦门大学航空航天学院,厦门 361102%中国空空导弹研究院,洛阳 471000%厦门大学航空航天学院,厦门 361102
Subjects	多机协同 maneuver decision making 深度强化学习空战决策 multi-unmanned aerial vehicle 无人机 air combat decision-making deep reinforcement learning multimachine collaboration 机动决策
Online Access	Get full text
ISSN	2095-9389
DOI	10.13374/j.issn2095-9389.2023.09.25.004

Cover

More Information
Summary:	TG142.71; 针对多无人机智能协同空战对抗决策问题,提出了一种基于长短期记忆与竞争图卷积深度强化学习的多机协同空战机动对抗决策方法.首先,对多机协同空战对抗问题进行描述;其次,在竞争Q网络中,引入长短期记忆网络用于处理带有强时序相关性的空战信息,接着,搭建图卷积网络作为多机之间的通信基础,提出基于长短期记忆与竞争图卷积深度强化学习算法的协同空战训练框架,并对协同空战决策训练算法进行了设计.二对一空战仿真结果验证了本文所提出的协同智能对抗决策方法的有效性,其具有决策速度快、学习过程稳定的特点以及适应空战环境快速变化下的协同策略学习能力.
ISSN:	2095-9389
DOI:	10.13374/j.issn2095-9389.2023.09.25.004