基于Transformer的小样本细粒度图像分类方法

TP391.41; 针对小样本细粒度图像分类任务中存在的相似性度量单一以及细粒度特征提取效果不佳的问题,提出了一种基于Transformer的小样本细粒度图像分类方法,克服了小样本学习在细粒度图像分类中由于样本数量较少从而分类效果较差的问题.构建以多轴注意力模块与卷积算子为基本组件的新模块CBG Transformer Block,通过该模块的重复堆叠提高了网络的特征提取能力;采用关系网络和余弦网络组成的双相似度模块进行相似性度量,避免了在训练数据量较小的情况下单一度量造成的相似性偏差;通过计算两个相似度得分的平均值得出最终预测结果.实验结果表明,提出的方法在CUB-200-2011、Stan...

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 59; no. 23; pp. 219 - 227
Main Authors 陆妍, 王阳萍, 王文润
Format Journal Article
LanguageChinese
Published 兰州交通大学 电子与信息工程学院,兰州 730070%兰州交通大学 电子与信息工程学院,兰州 730070 01.12.2023
轨道交通信息与控制国家级虚拟仿真实验教学中心,兰州 730070
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2207-0005

Cover

More Information
Summary:TP391.41; 针对小样本细粒度图像分类任务中存在的相似性度量单一以及细粒度特征提取效果不佳的问题,提出了一种基于Transformer的小样本细粒度图像分类方法,克服了小样本学习在细粒度图像分类中由于样本数量较少从而分类效果较差的问题.构建以多轴注意力模块与卷积算子为基本组件的新模块CBG Transformer Block,通过该模块的重复堆叠提高了网络的特征提取能力;采用关系网络和余弦网络组成的双相似度模块进行相似性度量,避免了在训练数据量较小的情况下单一度量造成的相似性偏差;通过计算两个相似度得分的平均值得出最终预测结果.实验结果表明,提出的方法在CUB-200-2011、Stanford Cars和Stanford Dogs三个公开细粒度图像数据集上的5-way 5-shot任务分类精度分别达到了82.70%、74.22%和69.68%,可见在小样本细粒度图像分类任务中取得了优异效果.
ISSN:1002-8331
DOI:10.3778/j.issn.1002-8331.2207-0005