基于并行混合注意力的复杂背景小尺度手部检测方法

TP391; 针对复杂背景中手部特征不明显及尺度变化较大,难以满足高精度水平检测,易出现误检、漏检的问题,以YOLOv5为基础结构提出一种小尺度手部检测方法.将并行混合机制的注意力模块(parallel mixed attention mechanism,PMAM)嵌入到主干网络中,提高对手部特征的提取能力;设计一种结合路径聚合网络(path aggregation network,PAN)和加权双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)改进的特征融合网络PB-FPN(path bidirectional-feature pyr...

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 60; no. 22; pp. 209 - 218
Main Authors 梁超, 王阳萍, 王文润
Format Journal Article
LanguageChinese
Published 兰州交通大学 电子与信息工程学院,兰州 730070%兰州交通大学 电子与信息工程学院,兰州 730070 15.11.2024
甘肃省人工智能与图形图像处理工程研究中心,兰州 730070
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2307-0302

Cover

More Information
Summary:TP391; 针对复杂背景中手部特征不明显及尺度变化较大,难以满足高精度水平检测,易出现误检、漏检的问题,以YOLOv5为基础结构提出一种小尺度手部检测方法.将并行混合机制的注意力模块(parallel mixed attention mechanism,PMAM)嵌入到主干网络中,提高对手部特征的提取能力;设计一种结合路径聚合网络(path aggregation network,PAN)和加权双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)改进的特征融合网络PB-FPN(path bidirectional-feature pyramid network),引入新的路径参与底部特征融合,提高算法对小尺度手部目标的检测能力;通过将骨干网络中的空间金字塔池化(spatial pyramid pooling-fast,SPPF)引入特征融合网络并与模型预测头连接,进一步提高算法的性能.在此基础上,使用FReLU作为网络模型的激活函数,增强网络的空间敏感度,提高网络鲁棒性.为验证所提方法的有效性,构建了更符合研究背景的新的数据集TV-COCO-Hand,并在此数据集上进行了相关实验,结果表明,改进后的模型在构建的数据集上mAP达到91.4%,比基线网络模型提高了 3.8个百分点,且检测效果优于目前主流检测网络模型.在公开数据集上进行了数据集对比实验以及真实场景的检测实验,验证了模型的泛化性.
ISSN:1002-8331
DOI:10.3778/j.issn.1002-8331.2307-0302