基于特征相似性和特征规范化的注意力模块

TP391.4; 近年来,注意力机制在图像分类、目标检测和语义分割等领域取得了巨大成功,但现有的注意力机制大多只能在通道或空间维度上实现特征融合,这极大限制了其在通道和空间维度上变化的灵活性,导致无法充分利用特征信息.为此,文中提出一种基于特征相似性和特征规范化的、可同时利用特征图各维度信息的卷积神经网络注意力模块FSNAM.该模块由特征相似性模块(FSM)和特征规范化模块(FNM)两部分组成,FSM利用输入特征图的通道特征信息和局部空间特征信息生成一个二维的特征相似性权重图;FNM利用输入特征图的全局空间特征信息生成一个三维的特征规范化权重图;两个模块生成的权重图融合在一起,生成一个三维的注...

Full description

Saved in:
Bibliographic Details
Published in华南理工大学学报(自然科学版) Vol. 52; no. 7; pp. 62 - 71
Main Authors 杜启亮, 汪益民, 田联房
Format Journal Article
LanguageChinese
Published 华南理工大学 珠海现代产业创新研究院,广东 珠海 519170 01.07.2024
华南理工大学 广东省发展改革委工程中心,广东 广州 510031
华南理工大学 自动化科学与工程学院,广东 广州 510640
华南理工大学 中新国际联合研究院,广东 广州 510555
华南理工大学 自主系统与网络控制教育部重点实验室,广东 广州 510640%华南理工大学 自动化科学与工程学院,广东 广州 510640%华南理工大学 自动化科学与工程学院,广东 广州 510640
Subjects
Online AccessGet full text
ISSN1000-565X
DOI10.12141/j.issn.1000-565X.230313

Cover

More Information
Summary:TP391.4; 近年来,注意力机制在图像分类、目标检测和语义分割等领域取得了巨大成功,但现有的注意力机制大多只能在通道或空间维度上实现特征融合,这极大限制了其在通道和空间维度上变化的灵活性,导致无法充分利用特征信息.为此,文中提出一种基于特征相似性和特征规范化的、可同时利用特征图各维度信息的卷积神经网络注意力模块FSNAM.该模块由特征相似性模块(FSM)和特征规范化模块(FNM)两部分组成,FSM利用输入特征图的通道特征信息和局部空间特征信息生成一个二维的特征相似性权重图;FNM利用输入特征图的全局空间特征信息生成一个三维的特征规范化权重图;两个模块生成的权重图融合在一起,生成一个三维的注意力权重图,以此实现通道特征信息和空间特征信息的融合.为证明FSNAM的可行性和有效性,进行了消融实验,结果表明:在图像分类任务方面,FSNAM模块对分类网络在CIFAR数据集上的性能提升明显优于其他主流注意力模块;在目标检测任务方面,使用FSNAM模块的目标检测网络对VOC数据集中的小目标和中等大小目标的检测准确率分别提高了3.9和1.2个百分点;在语义分割任务方面,使用FSNAM模块可以提高HRNet模型的性能,在SBD数据集上模型的平均像素准确率提高了0.58个百分点.
ISSN:1000-565X
DOI:10.12141/j.issn.1000-565X.230313