语义通信下基于强化学习的无人机通信容错协同控制
TP393; 无人机集群技术近年在各类军民应用中得到了广泛应用.为了提高无人机执行任务的成功率,无人机集群的通信与协同成为重要技术研究方向.然而,在通信不确定的环境下,无人机通信与协同可能受到主观或客观环境因素带来的通信干扰,无法正确地收发信息,导致协同任务失败.为解决这一问题,针对通信受限环境下"长机-僚机"伴飞跟随的需求,提出语义通信下基于强化学习的无人机通信容错协同方法.该方法在基于强化学习的僚机跟随策略基础上,引入语义通信机制和基于近端策略优化算法的长机行为预测算法.在正常通信时,僚机会接收长机通信信息并执行相应指令操作;而在通信受限时,僚机利用历史通信信息提取语义...
        Saved in:
      
    
          | Published in | 网络与信息安全学报 Vol. 10; no. 2; pp. 69 - 80 | 
|---|---|
| Main Authors | , , , | 
| Format | Journal Article | 
| Language | Chinese | 
| Published | 
            南京航空航天大学计算机科学与技术学院,江苏南京 211106%武汉理工大学计算机与人工智能学院,湖北武汉 430070
    
        01.04.2024
     | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 2096-109X | 
| DOI | 10.11959/j.issn.2096-109x.2024025 | 
Cover
| Summary: | TP393; 无人机集群技术近年在各类军民应用中得到了广泛应用.为了提高无人机执行任务的成功率,无人机集群的通信与协同成为重要技术研究方向.然而,在通信不确定的环境下,无人机通信与协同可能受到主观或客观环境因素带来的通信干扰,无法正确地收发信息,导致协同任务失败.为解决这一问题,针对通信受限环境下"长机-僚机"伴飞跟随的需求,提出语义通信下基于强化学习的无人机通信容错协同方法.该方法在基于强化学习的僚机跟随策略基础上,引入语义通信机制和基于近端策略优化算法的长机行为预测算法.在正常通信时,僚机会接收长机通信信息并执行相应指令操作;而在通信受限时,僚机利用历史通信信息提取语义信息,匹配自身的语义通信模型以推测长机的未来目标.同时结合对长机行为模式的学习预测模型,决策僚机自身前进方向.在无额外通信抗干扰设备负载的条件下,一定程度上能抵御通信干扰,实现对长机的不间断跟随,从而提高通信受限环境下任务协同效率.通过实验证明,相较传统方法,基于语义通信的强化学习无人机通信抗干扰方法能更好地适应复杂环境,实现更佳的僚机跟随效果,有效提升通信间断情况下的任务成功率,为无人机在通信受限环境下的协同应用提供了可行的解决方案. | 
|---|---|
| ISSN: | 2096-109X | 
| DOI: | 10.11959/j.issn.2096-109x.2024025 |