融合空间与通道重构卷积和注意力的轻量型动物姿态估计

TP391; 动物姿态估计在行为生态学、动物健康监测、野生动物保护等领域的重要性不断凸显.然而,目前主流的动物姿态估计算法过于关注准确率,导致网络复杂度和计算成本不断攀升,这使得在移动设备和嵌入式平台上的应用受到了限制.针对该问题,提出融合空间与通道重构卷积和金字塔分割注意力的多尺度动物姿态估计网络SPANet.使用金字塔分割注意力与坐标注意力机制,重新设计了高分辨率网络的瓶颈层EPSAneck,在减轻过度使用大卷积核带来的计算成本的同时,增强了网络对有用特征的提取能力;提出了基于空间和通道重构卷积以及坐标注意力机制的SCCAblock基础模块,在显著减少计算冗余和内存访问的同时,增强了通道与...

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 61; no. 6; pp. 282 - 294
Main Authors 宰清鹏, 徐杨
Format Journal Article
LanguageChinese
Published 贵阳铝镁设计研究院有限公司,贵阳 550009 15.03.2025
贵州大学 大数据与信息工程学院,贵阳 550025%贵州大学 大数据与信息工程学院,贵阳 550025
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2311-0057

Cover

More Information
Summary:TP391; 动物姿态估计在行为生态学、动物健康监测、野生动物保护等领域的重要性不断凸显.然而,目前主流的动物姿态估计算法过于关注准确率,导致网络复杂度和计算成本不断攀升,这使得在移动设备和嵌入式平台上的应用受到了限制.针对该问题,提出融合空间与通道重构卷积和金字塔分割注意力的多尺度动物姿态估计网络SPANet.使用金字塔分割注意力与坐标注意力机制,重新设计了高分辨率网络的瓶颈层EPSAneck,在减轻过度使用大卷积核带来的计算成本的同时,增强了网络对有用特征的提取能力;提出了基于空间和通道重构卷积以及坐标注意力机制的SCCAblock基础模块,在显著减少计算冗余和内存访问的同时,增强了通道与空间之间的信息交互;利用反卷积模块对网络输出的特征融合方式进行重新设计,进一步提升了网络的准确率.实验结果表明,提出的网络模型相较于高分辨率网络在AP10K测试集上的平均精度提升了1.8个百分点,同时浮点运算量降低了48.5%、模型参数量减少了67.0%.在AnimalPose数据集上,浮点运算量降低49.5%,模型参数量降低67.0%.实验数据表明,该网络可在降低模型复杂度的同时实现预测精度的小范围提升.
ISSN:1002-8331
DOI:10.3778/j.issn.1002-8331.2311-0057