基于深度强化学习的UAV航路自主引导机动控制决策算法

V249.4; 针对无人机(unmanned aerial vehicle,UAV)航路终端约束情况下航路自主引导机动控制决策问题,采用Markov决策过程模型建立UAV自主飞行机动模型,基于深度确定性策略梯度提出UAV航路自主引导机动控制决策算法,拟合UAV航路自主引导机动控制决策函数与状态动作值函数,生成最优决策网络,开展仿真验证.仿真结果表明,该算法实现了UAV在任意位置/姿态的初始条件下,向航路目标点的自主飞行,可有效提高UAV机动控制的自主性....

Full description

Saved in:

Bibliographic Details
Published in	系统工程与电子技术 Vol. 42; no. 7; pp. 1567 - 1574
Main Authors	张堃, 李珂, 时昊天, 张振冲, 刘泽坤
Format	Journal Article
Language	Chinese
Published	西北工业大学电子信息学院,陕西西安710072 01.07.2020 光电控制技术重点实验室,河南洛阳471000%西北工业大学电子信息学院,陕西西安,710072
Subjects	Markov决策过程深度确定性策略梯度法机动控制决策深度强化学习自主引导
Online Access	Get full text
ISSN	1001-506X
DOI	10.3969/j.issn.1001-506X.2020.07.19

Cover

More Information
Summary:	V249.4; 针对无人机(unmanned aerial vehicle,UAV)航路终端约束情况下航路自主引导机动控制决策问题,采用Markov决策过程模型建立UAV自主飞行机动模型,基于深度确定性策略梯度提出UAV航路自主引导机动控制决策算法,拟合UAV航路自主引导机动控制决策函数与状态动作值函数,生成最优决策网络,开展仿真验证.仿真结果表明,该算法实现了UAV在任意位置/姿态的初始条件下,向航路目标点的自主飞行,可有效提高UAV机动控制的自主性.
ISSN:	1001-506X
DOI:	10.3969/j.issn.1001-506X.2020.07.19