基于独立注意力机制的图像检索算法

TP391; 近年来,深度学习的方法在基于内容的图像检索领域已经占据主导地位.为了改善主干网络提取出的特征,使得网络能计算出更具区分度的图像描述,提出了一种独立于输入特征的注意力模块ICSA(Independent Channel-wise and Spatial At-tention).该模块与其他的注意力机制的主要区别在于它的注意力权重在输入不同特征时保持一致,传统注意力模块通过对输入特征进行处理得到注意力,因此它的模型更为精简,其参数大小仅有6.7 kB,为SENet 大小的5.2%和CBAM 的2.6%,运行时间与SENet 基本一致,为CBAM 的14.9%.ICSA 的注意力分为通...

Full description

Saved in:
Bibliographic Details
Published in计算机科学 Vol. 50; no. z1; pp. 318 - 323
Main Authors 张舜尧, 李华旺, 张永合, 王新宇, 丁国鹏
Format Journal Article
LanguageChinese
Published 中国科学院微小卫星创新研究院 上海201210 2023
上海科技大学 上海2 01210
中国科学院大学 北京100094
中国科学院大学 北京100094%中国科学院微小卫星创新研究院 上海201210
Subjects
Online AccessGet full text
ISSN1002-137X
DOI10.11896/jsjkx.220300092

Cover

More Information
Summary:TP391; 近年来,深度学习的方法在基于内容的图像检索领域已经占据主导地位.为了改善主干网络提取出的特征,使得网络能计算出更具区分度的图像描述,提出了一种独立于输入特征的注意力模块ICSA(Independent Channel-wise and Spatial At-tention).该模块与其他的注意力机制的主要区别在于它的注意力权重在输入不同特征时保持一致,传统注意力模块通过对输入特征进行处理得到注意力,因此它的模型更为精简,其参数大小仅有6.7 kB,为SENet 大小的5.2%和CBAM 的2.6%,运行时间与SENet 基本一致,为CBAM 的14.9%.ICSA 的注意力分为通道和空间注意力两部分,分别储存输入特征不同方向上的权重.在Pittsburgh 数据集上进行实验,实验结果表明,对于不同的主干网络,在添加了ICSA 模块后Recall@1 有0.1%~2.4%的提升.
ISSN:1002-137X
DOI:10.11896/jsjkx.220300092