基于并行混合注意力的复杂背景小尺度手部检测方法
TP391; 针对复杂背景中手部特征不明显及尺度变化较大,难以满足高精度水平检测,易出现误检、漏检的问题,以YOLOv5为基础结构提出一种小尺度手部检测方法.将并行混合机制的注意力模块(parallel mixed attention mechanism,PMAM)嵌入到主干网络中,提高对手部特征的提取能力;设计一种结合路径聚合网络(path aggregation network,PAN)和加权双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)改进的特征融合网络PB-FPN(path bidirectional-feature pyr...
        Saved in:
      
    
          | Published in | 计算机工程与应用 Vol. 60; no. 22; pp. 209 - 218 | 
|---|---|
| Main Authors | , , | 
| Format | Journal Article | 
| Language | Chinese | 
| Published | 
            兰州交通大学 电子与信息工程学院,兰州 730070%兰州交通大学 电子与信息工程学院,兰州 730070
    
        15.11.2024
     甘肃省人工智能与图形图像处理工程研究中心,兰州 730070  | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 1002-8331 | 
| DOI | 10.3778/j.issn.1002-8331.2307-0302 | 
Cover
| Summary: | TP391; 针对复杂背景中手部特征不明显及尺度变化较大,难以满足高精度水平检测,易出现误检、漏检的问题,以YOLOv5为基础结构提出一种小尺度手部检测方法.将并行混合机制的注意力模块(parallel mixed attention mechanism,PMAM)嵌入到主干网络中,提高对手部特征的提取能力;设计一种结合路径聚合网络(path aggregation network,PAN)和加权双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)改进的特征融合网络PB-FPN(path bidirectional-feature pyramid network),引入新的路径参与底部特征融合,提高算法对小尺度手部目标的检测能力;通过将骨干网络中的空间金字塔池化(spatial pyramid pooling-fast,SPPF)引入特征融合网络并与模型预测头连接,进一步提高算法的性能.在此基础上,使用FReLU作为网络模型的激活函数,增强网络的空间敏感度,提高网络鲁棒性.为验证所提方法的有效性,构建了更符合研究背景的新的数据集TV-COCO-Hand,并在此数据集上进行了相关实验,结果表明,改进后的模型在构建的数据集上mAP达到91.4%,比基线网络模型提高了 3.8个百分点,且检测效果优于目前主流检测网络模型.在公开数据集上进行了数据集对比实验以及真实场景的检测实验,验证了模型的泛化性. | 
|---|---|
| ISSN: | 1002-8331 | 
| DOI: | 10.3778/j.issn.1002-8331.2307-0302 |