基于BiLevelNet的实时语义分割算法
TP394.1%TH691.9; 针对语义分割网络参数量过大导致其难以部署在内存受限的边缘设备等问题,本文提出一种基于BiLevelNet的轻量级实时语义分割算法.首先,利用空洞卷积扩大感受野,并结合特征复用策略增强网络的区域感知能力.接着,嵌入两阶段的PBRA注意力机制,建立远距离相关物体之间的依赖关系以增强网络的全局感知能力.最后,引入结合浅层特征的FADE算子以改善图像上采样效果.实验结果表明,在输入图像分辨率为 512×1024的情况下,本文网络在Cityscapes数据集上以121 f/s的速率获得了75.1%的平均交并比,模型大小仅为0.7 M.同时在输入图像分辨率为360×480...
        Saved in:
      
    
          | Published in | 光电工程 Vol. 51; no. 5; pp. 中插2 - 33 | 
|---|---|
| Main Authors | , , , , | 
| Format | Journal Article | 
| Language | Chinese | 
| Published | 
            福州大学 先进制造学院,福建 泉州 362200%福州大学 先进制造学院,福建 泉州 362200
    
        2024
     中国福建光电信息科学与技术创新实验室,福建 福州 350116  | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 1003-501X | 
| DOI | 10.12086/oee.2024.240030 | 
Cover
| Summary: | TP394.1%TH691.9; 针对语义分割网络参数量过大导致其难以部署在内存受限的边缘设备等问题,本文提出一种基于BiLevelNet的轻量级实时语义分割算法.首先,利用空洞卷积扩大感受野,并结合特征复用策略增强网络的区域感知能力.接着,嵌入两阶段的PBRA注意力机制,建立远距离相关物体之间的依赖关系以增强网络的全局感知能力.最后,引入结合浅层特征的FADE算子以改善图像上采样效果.实验结果表明,在输入图像分辨率为 512×1024的情况下,本文网络在Cityscapes数据集上以121 f/s的速率获得了75.1%的平均交并比,模型大小仅为0.7 M.同时在输入图像分辨率为360×480的情况下,在Camvid数据集上取得68.2%的平均交并比.同当前其他实时语义分割方法相比,该网络性能取得速度与精度的均衡,符合自动驾驶应用场景对实时性的要求. | 
|---|---|
| ISSN: | 1003-501X | 
| DOI: | 10.12086/oee.2024.240030 |