基于Transformer的小样本细粒度图像分类方法

TP391.41; 针对小样本细粒度图像分类任务中存在的相似性度量单一以及细粒度特征提取效果不佳的问题,提出了一种基于Transformer的小样本细粒度图像分类方法,克服了小样本学习在细粒度图像分类中由于样本数量较少从而分类效果较差的问题.构建以多轴注意力模块与卷积算子为基本组件的新模块CBG Transformer Block,通过该模块的重复堆叠提高了网络的特征提取能力;采用关系网络和余弦网络组成的双相似度模块进行相似性度量,避免了在训练数据量较小的情况下单一度量造成的相似性偏差;通过计算两个相似度得分的平均值得出最终预测结果.实验结果表明,提出的方法在CUB-200-2011、Stan...

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 59; no. 23; pp. 219 - 227
Main Authors 陆妍, 王阳萍, 王文润
Format Journal Article
LanguageChinese
Published 兰州交通大学 电子与信息工程学院,兰州 730070%兰州交通大学 电子与信息工程学院,兰州 730070 01.12.2023
轨道交通信息与控制国家级虚拟仿真实验教学中心,兰州 730070
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2207-0005

Cover

Abstract TP391.41; 针对小样本细粒度图像分类任务中存在的相似性度量单一以及细粒度特征提取效果不佳的问题,提出了一种基于Transformer的小样本细粒度图像分类方法,克服了小样本学习在细粒度图像分类中由于样本数量较少从而分类效果较差的问题.构建以多轴注意力模块与卷积算子为基本组件的新模块CBG Transformer Block,通过该模块的重复堆叠提高了网络的特征提取能力;采用关系网络和余弦网络组成的双相似度模块进行相似性度量,避免了在训练数据量较小的情况下单一度量造成的相似性偏差;通过计算两个相似度得分的平均值得出最终预测结果.实验结果表明,提出的方法在CUB-200-2011、Stanford Cars和Stanford Dogs三个公开细粒度图像数据集上的5-way 5-shot任务分类精度分别达到了82.70%、74.22%和69.68%,可见在小样本细粒度图像分类任务中取得了优异效果.
AbstractList TP391.41; 针对小样本细粒度图像分类任务中存在的相似性度量单一以及细粒度特征提取效果不佳的问题,提出了一种基于Transformer的小样本细粒度图像分类方法,克服了小样本学习在细粒度图像分类中由于样本数量较少从而分类效果较差的问题.构建以多轴注意力模块与卷积算子为基本组件的新模块CBG Transformer Block,通过该模块的重复堆叠提高了网络的特征提取能力;采用关系网络和余弦网络组成的双相似度模块进行相似性度量,避免了在训练数据量较小的情况下单一度量造成的相似性偏差;通过计算两个相似度得分的平均值得出最终预测结果.实验结果表明,提出的方法在CUB-200-2011、Stanford Cars和Stanford Dogs三个公开细粒度图像数据集上的5-way 5-shot任务分类精度分别达到了82.70%、74.22%和69.68%,可见在小样本细粒度图像分类任务中取得了优异效果.
Author 王文润
王阳萍
陆妍
AuthorAffiliation 兰州交通大学 电子与信息工程学院,兰州 730070%兰州交通大学 电子与信息工程学院,兰州 730070;轨道交通信息与控制国家级虚拟仿真实验教学中心,兰州 730070
AuthorAffiliation_xml – name: 兰州交通大学 电子与信息工程学院,兰州 730070%兰州交通大学 电子与信息工程学院,兰州 730070;轨道交通信息与控制国家级虚拟仿真实验教学中心,兰州 730070
Author_FL LU Yan
WANG Wenrun
WANG Yangping
Author_FL_xml – sequence: 1
  fullname: LU Yan
– sequence: 2
  fullname: WANG Yangping
– sequence: 3
  fullname: WANG Wenrun
Author_xml – sequence: 1
  fullname: 陆妍
– sequence: 2
  fullname: 王阳萍
– sequence: 3
  fullname: 王文润
BookMark eNo9jbtKA0EYRqeIYIx5CTuLXf-Z37lsKcEbBGxiHWbX2ZBFZ2EHka2VYGVA0CIKWllZeCnEDfg0zu5rGFCsPjhwzrdCWja3hpA1CiFKqTaycOycDSkACxQiDRkDGQAAb5H2P10mXefGMXCKkkuM2kT5h-q7uhoU2ro0L05M0cwu_Mu0fvyo75-b-aR5u_bVk7_78udTfzlpXuf17Wf9frNKllJ97Ez3bzvkcGd70NsL-ge7-72tfuAoCBbEmEgVSdSGGmG04IkyEaZScVSbqeAxiiPNGWiOEBsRA1LGIx0vPMFSo7BD1n-7Z9qm2o6GWX5a2MXjMHPZKCnLkgFDhsAY_gBkw14f
ClassificationCodes TP391.41
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.3778/j.issn.1002-8331.2207-0005
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Engineering
DocumentTitle_FL Transformer-Based Few-Shot and Fine-Grained Image Classification Method
EndPage 227
ExternalDocumentID jsjgcyyy202323022
GrantInformation_xml – fundername: (国家自然科学基金); (教育部人文社会科学研究项目); (中央引导地方科技发展专项资金项目); (甘肃省高等学校产业支撑计划项目); (甘肃省知识产权计划项目); (甘肃省重点人才项目); (甘肃省科技计划项目); (甘肃省科技计划项目); (中国高校产学研创新基金-北创助教项目)
  funderid: (国家自然科学基金); (教育部人文社会科学研究项目); (中央引导地方科技发展专项资金项目); (甘肃省高等学校产业支撑计划项目); (甘肃省知识产权计划项目); (甘肃省重点人才项目); (甘肃省科技计划项目); (甘肃省科技计划项目); (中国高校产学研创新基金-北创助教项目)
GroupedDBID -0Y
2B.
4A8
5XA
5XJ
92H
92I
93N
ABJNI
ACGFS
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CUBFJ
CW9
PSX
TCJ
TGT
U1G
U5S
ID FETCH-LOGICAL-s1062-b3c78973ae1e6ea65c8e93f785384f65b36da520a530be6b031259abb3c62fe83
ISSN 1002-8331
IngestDate Thu May 29 04:10:54 EDT 2025
IsPeerReviewed false
IsScholarly false
Issue 23
Keywords multi-axis attention
dual similarity
细粒度图像分类
双相似度
fine-grained image classification
小样本学习
CBG Transformer Block
conv-block-grid(CBG)Transformer Block
多轴注意力
few-shot learning
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1062-b3c78973ae1e6ea65c8e93f785384f65b36da520a530be6b031259abb3c62fe83
PageCount 9
ParticipantIDs wanfang_journals_jsjgcyyy202323022
PublicationCentury 2000
PublicationDate 2023-12-01
PublicationDateYYYYMMDD 2023-12-01
PublicationDate_xml – month: 12
  year: 2023
  text: 2023-12-01
  day: 01
PublicationDecade 2020
PublicationTitle 计算机工程与应用
PublicationTitle_FL Computer Engineering and Applications
PublicationYear 2023
Publisher 兰州交通大学 电子与信息工程学院,兰州 730070%兰州交通大学 电子与信息工程学院,兰州 730070
轨道交通信息与控制国家级虚拟仿真实验教学中心,兰州 730070
Publisher_xml – name: 兰州交通大学 电子与信息工程学院,兰州 730070%兰州交通大学 电子与信息工程学院,兰州 730070
– name: 轨道交通信息与控制国家级虚拟仿真实验教学中心,兰州 730070
SSID ssib051375739
ssib001102935
ssj0000561668
ssib023646291
ssib057620132
Score 1.9666002
Snippet TP391.41; 针对小样本细粒度图像分类任务中存在的相似性度量单一以及细粒度特征提取效果不佳的问题,提出了一种基于Transformer的小样本细粒度图像分类方法,克服了小样本学...
SourceID wanfang
SourceType Aggregation Database
StartPage 219
Title 基于Transformer的小样本细粒度图像分类方法
URI https://d.wanfangdata.com.cn/periodical/jsjgcyyy202323022
Volume 59
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
journalDatabaseRights – providerCode: PRVEBS
  databaseName: Inspec with Full Text
  issn: 1002-8331
  databaseCode: ADMLS
  dateStart: 20200501
  customDbUrl:
  isFulltext: true
  dateEnd: 99991231
  titleUrlDefault: https://www.ebsco.com/products/research-databases/inspec-full-text
  omitProxy: false
  ssIdentifier: ssib057620132
  providerName: EBSCOhost
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMw1V07bxQxELaiSwMF4ineihCuogu79vpVei97ihDQkEjpovXdXlCKQyJJkbSgiIpISFAAElRUFDwKxEXi17B3f4MZry97Sg4p0NGs5uzx-LPn1jNejceE3HYCvAaMnup2EtdMEuWajjnVdKKb8I4ysct9lO8DubSS3F0VqzONuYmope0tt9DZnXqu5F-0CmWgVzwl-xeaPRQKBUCDfuEJGobniXRMM0FNm6aWZgk-dbY89kNBE5miBsoS5Eojqts0k9RGNFVImBa1LeRJU6qlJxg1zDNbaqWXndI0Q0Jz3xwIPWaOsSHKkTQ1SKScVhdZjn1dmmlqM2pj5AfCjPtFvAJhWOGrQGbqRwBEFgCYxONPoHb8n6CZocb4_gUC1It1jcKWKAVYNEKBvk00ncVj1h5MChMiJz98MH4kiMQP2s9fBdlkYa5tgp1hnIgfDfy0yhOLIHI-gE9FKAIs9QCBaPtpARgxte1psxEEhTFbBq_CcSjzeA2AiigT_wPMCfvnDeT4EF0wkCFle7UQMD7F3FWeE6uyPBw1ylwp7Y0y9rBw2MMCY_iVPIpE7YocBohubG6sd3Z2dlDvsElm4GTNMrDbUYPM2sX79x7WLj94yKZ2-fE-BMnq_E8i5kqoOvOtQCEhW2nI_y9jGU7MBmRVbmKEfefPoP0hv34v769P-KPLZ8mZsJGcs9WqcI7M7D46T05PpBe9QHT5fvBr8GJiTRi9eVZ-3h9--D5892l0sDf6-rIcfCzf_iyf7pfP90ZfDoavfwy_vbpIVtrZcmupGW5KaW7GkWRNB8uqNornRVzIIpeiowvDewp8cZ30pHBcdnPBolzwyBXSgSVnwuQO2knWKzS_RBr9x_3iMpnjeEdKAZsG2NclPWUcNIddjotULnnBOlfIrTDutbASbq4d09bVkzBdI6fq1_o6aWw92S5ugIe_5W4GJf8Gtiix_A
linkProvider EBSCOhost
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8ETransformer%E7%9A%84%E5%B0%8F%E6%A0%B7%E6%9C%AC%E7%BB%86%E7%B2%92%E5%BA%A6%E5%9B%BE%E5%83%8F%E5%88%86%E7%B1%BB%E6%96%B9%E6%B3%95&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E5%B7%A5%E7%A8%8B%E4%B8%8E%E5%BA%94%E7%94%A8&rft.au=%E9%99%86%E5%A6%8D&rft.au=%E7%8E%8B%E9%98%B3%E8%90%8D&rft.au=%E7%8E%8B%E6%96%87%E6%B6%A6&rft.date=2023-12-01&rft.pub=%E5%85%B0%E5%B7%9E%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6+%E7%94%B5%E5%AD%90%E4%B8%8E%E4%BF%A1%E6%81%AF%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%2C%E5%85%B0%E5%B7%9E+730070%25%E5%85%B0%E5%B7%9E%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6+%E7%94%B5%E5%AD%90%E4%B8%8E%E4%BF%A1%E6%81%AF%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%2C%E5%85%B0%E5%B7%9E+730070&rft.issn=1002-8331&rft.volume=59&rft.issue=23&rft.spage=219&rft.epage=227&rft_id=info:doi/10.3778%2Fj.issn.1002-8331.2207-0005&rft.externalDocID=jsjgcyyy202323022
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fjsjgcyyy%2Fjsjgcyyy.jpg