改进U-net++的遥感图像语义分割方法
TP391; 遥感图像语义分割在土地资源规划、智慧城市等领域有着广泛的应用.由于高分辨率遥感的图像存在边界分割不清、小尺寸目标分割不清等问题,为此提出了一种基于U-net++的改进网络TU-net,该模型通过优化网络结构加强模型的特征提取能力,引入特征头细化模块,通过构建了两条通道来增强通道特征表示和空间特征表示,提升了对高层语义信息的解析能力;引入基于Transformer的注意力聚合模块来捕捉全局上下文信息,设计了十字窗交互模块,显著降低了计算复杂度;在解码器末端设计了一个动态特征融合块,以此得到多类、多尺度的语义信息,增强最终的分割效果.TU-net在两个数据集上进行实验,其中OA、mI...
        Saved in:
      
    
          | Published in | 计算机工程与应用 Vol. 60; no. 13; pp. 255 - 265 | 
|---|---|
| Main Authors | , , | 
| Format | Journal Article | 
| Language | Chinese | 
| Published | 
            贵阳铝镁设计研究院有限公司,贵阳 550009
    
        01.07.2024
     贵州大学 大数据与信息工程学院,贵阳 550025%贵州大学 大数据与信息工程学院,贵阳 550025  | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 1002-8331 | 
| DOI | 10.3778/j.issn.1002-8331.2304-0151 | 
Cover
| Summary: | TP391; 遥感图像语义分割在土地资源规划、智慧城市等领域有着广泛的应用.由于高分辨率遥感的图像存在边界分割不清、小尺寸目标分割不清等问题,为此提出了一种基于U-net++的改进网络TU-net,该模型通过优化网络结构加强模型的特征提取能力,引入特征头细化模块,通过构建了两条通道来增强通道特征表示和空间特征表示,提升了对高层语义信息的解析能力;引入基于Transformer的注意力聚合模块来捕捉全局上下文信息,设计了十字窗交互模块,显著降低了计算复杂度;在解码器末端设计了一个动态特征融合块,以此得到多类、多尺度的语义信息,增强最终的分割效果.TU-net在两个数据集上进行实验,其中OA、mIoU、mF1分数均高于主流模型,Vaihingen数据集中小尺寸目标车的IoU和F1分数分别为0.896和0.962,比次优模型提升了5%和15.8%;Potsdam数据集中树的IoU和F1分数分别为0.913和0.936,比次优模型提升了6.3%和4.3%,实验结果表明该模型能够更精准地分割小尺寸目标及目标边界. | 
|---|---|
| ISSN: | 1002-8331 | 
| DOI: | 10.3778/j.issn.1002-8331.2304-0151 |