一种基于深度强化学习的频率捷变雷达智能频点决策方法

TN958; 自卫式干扰机发射的瞄准干扰使多种基于信号处理的被动干扰抑制方法失效,对现代雷达产生了严重威胁,频率捷变作为一种主动对抗方式为对抗瞄准干扰提供了可能.针对传统随机跳频抗干扰性能不稳定、频点选取自由度有限、策略学习所需时间长等问题,该文面向频率捷变雷达,提出了一种快速自适应跳频策略学习方法.首先设计了一种频点可重复选取的频率捷变波形,为最优解提供了更多选择.在此基础上,通过利用雷达与干扰机持续对抗收集到的数据,基于深度强化学习的探索与反馈机制,不断优化频点选取策略.具体来说,通过将上一时刻雷达频点及当前时刻感知到的干扰频点作为强化学习输入,神经网络智能选取当前时刻各子脉冲频点,并根据...

Full description

Saved in:
Bibliographic Details
Published in雷达学报 Vol. 13; no. 1; pp. 227 - 239
Main Authors 张嘉翔, 张凯翔, 梁振楠, 陈新亮, 刘泉华
Format Journal Article
LanguageChinese
Published 北京理工大学信息与电子学院雷达技术研究所 北京 100081%北京理工大学信息与电子学院雷达技术研究所 北京 100081 2024
北京理工大学长三角研究院(嘉兴) 嘉兴 314000%北京理工大学信息与电子学院雷达技术研究所 北京 100081
卫星导航电子信息技术教育部重点实验室(北京理工大学) 北京 100081
北京理工大学重庆创新中心 重庆 401120
Subjects
Online AccessGet full text
ISSN2095-283X
DOI10.12000/JR23197

Cover

More Information
Summary:TN958; 自卫式干扰机发射的瞄准干扰使多种基于信号处理的被动干扰抑制方法失效,对现代雷达产生了严重威胁,频率捷变作为一种主动对抗方式为对抗瞄准干扰提供了可能.针对传统随机跳频抗干扰性能不稳定、频点选取自由度有限、策略学习所需时间长等问题,该文面向频率捷变雷达,提出了一种快速自适应跳频策略学习方法.首先设计了一种频点可重复选取的频率捷变波形,为最优解提供了更多选择.在此基础上,通过利用雷达与干扰机持续对抗收集到的数据,基于深度强化学习的探索与反馈机制,不断优化频点选取策略.具体来说,通过将上一时刻雷达频点及当前时刻感知到的干扰频点作为强化学习输入,神经网络智能选取当前时刻各子脉冲频点,并根据目标检测结果以及信干噪比两方面评价抗干扰效能,从而优化策略直至最优.从提高最优策略收敛速度出发,设计的输入状态不依赖历史时间步、引入贪婪策略平衡搜索-利用机制、配合信干噪比提高奖励差异.多组仿真实验结果表明,所提方法能够收敛到最优策略且具备较高的收敛效率.
ISSN:2095-283X
DOI:10.12000/JR23197