跨视图时序对比学习的自监督视频表征算法

TP391.41%TP183; 现有的自监督表征算法主要关注视频帧之间的短期运动特性,但是帧间动作序列的变化幅度较小,而且单视图数据因语义受限影响深度特征表达能力,视频动作中丰富的多视图信息未被充分利用.为此提出基于跨视图语义一致性的时序对比学习算法,自监督学习RGB帧和光流场两种数据中蕴含的动作时序变化特性,主要思路为:设计局部时序对比学习方法,采用不同正负样本划分策略,挖掘同一实例不重叠片段之间的时序相关性和判别可分性,增强细粒度特征表达能力;研究全局对比学习方法,通过跨视图语义协同训练来增加正样本,学习多实例不同视图的语义一致性,提高模型的泛化能力.通过两个下游任务对模型效果进行评估,在...

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 60; no. 18; pp. 158 - 166
Main Authors 王露露, 徐增敏, 张雪莲, 蒙儒省, 卢涛
Format Journal Article
LanguageChinese
Published 桂林安维科技有限公司,广西桂林 541010%桂林安维科技有限公司,广西桂林 541010%武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室,武汉 430205 15.09.2024
广西应用数学中心(桂林电子科技大学),广西 桂林 541004%桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004
广西应用数学中心(桂林电子科技大学),广西 桂林 541004
桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2312-0033

Cover

Abstract TP391.41%TP183; 现有的自监督表征算法主要关注视频帧之间的短期运动特性,但是帧间动作序列的变化幅度较小,而且单视图数据因语义受限影响深度特征表达能力,视频动作中丰富的多视图信息未被充分利用.为此提出基于跨视图语义一致性的时序对比学习算法,自监督学习RGB帧和光流场两种数据中蕴含的动作时序变化特性,主要思路为:设计局部时序对比学习方法,采用不同正负样本划分策略,挖掘同一实例不重叠片段之间的时序相关性和判别可分性,增强细粒度特征表达能力;研究全局对比学习方法,通过跨视图语义协同训练来增加正样本,学习多实例不同视图的语义一致性,提高模型的泛化能力.通过两个下游任务对模型效果进行评估,在UCF101和HMDB51数据集的实验结果表明,所提方法在动作识别和视频检索任务上,较前沿主流方法平均提升了2~3.5个百分点.
AbstractList TP391.41%TP183; 现有的自监督表征算法主要关注视频帧之间的短期运动特性,但是帧间动作序列的变化幅度较小,而且单视图数据因语义受限影响深度特征表达能力,视频动作中丰富的多视图信息未被充分利用.为此提出基于跨视图语义一致性的时序对比学习算法,自监督学习RGB帧和光流场两种数据中蕴含的动作时序变化特性,主要思路为:设计局部时序对比学习方法,采用不同正负样本划分策略,挖掘同一实例不重叠片段之间的时序相关性和判别可分性,增强细粒度特征表达能力;研究全局对比学习方法,通过跨视图语义协同训练来增加正样本,学习多实例不同视图的语义一致性,提高模型的泛化能力.通过两个下游任务对模型效果进行评估,在UCF101和HMDB51数据集的实验结果表明,所提方法在动作识别和视频检索任务上,较前沿主流方法平均提升了2~3.5个百分点.
Abstract_FL The existing self-supervised representation algorithms mainly focus on the short-term motion characteristics between video frames,but the variation range of the action sequence between frames is small,and the depth feature expression ability of single-view data is affected due to semantic limitations,so the rich multi-view information in video actions is not fully utilized.Therefore,a temporal contrast learning algorithm based on cross-view semantic consistency is proposed to self-supervised learn the action temporal variation characteristics embedded in both RGB frames and optical flow field data.The main ideas are as follows:to design a local temporal contrast learning method,adopt different posi-tive and negative sample division strategies to explore the temporal correlation and discriminative differentiability between non-overlapping segments of the same instance,and enhance the fine-grained feature expression capability;to study the global contrast learning method to increase the positive samples by cross-view semantic co-training,learn the semantic consistency of different views of multiple instances,and improve the generalization ability of the model.The model per-formance is evaluated through two downstream tasks,and the experimental results on UCF101 and HMDB51 datasets show that the proposed method improves on average 2~3.5 percentage points over cutting-edge mainstream methods on action recognition and video retrieval tasks.
Author 徐增敏
卢涛
蒙儒省
王露露
张雪莲
AuthorAffiliation 桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004;广西应用数学中心(桂林电子科技大学),广西 桂林 541004%桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004;广西应用数学中心(桂林电子科技大学),广西 桂林 541004;桂林安维科技有限公司,广西桂林 541010%桂林安维科技有限公司,广西桂林 541010%武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室,武汉 430205
AuthorAffiliation_xml – name: 桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004;广西应用数学中心(桂林电子科技大学),广西 桂林 541004%桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004;广西应用数学中心(桂林电子科技大学),广西 桂林 541004;桂林安维科技有限公司,广西桂林 541010%桂林安维科技有限公司,广西桂林 541010%武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室,武汉 430205
Author_FL ZHANG Xuelian
WANG Lulu
MENG Ruxing
XU Zengmin
LU Tao
Author_FL_xml – sequence: 1
  fullname: WANG Lulu
– sequence: 2
  fullname: XU Zengmin
– sequence: 3
  fullname: ZHANG Xuelian
– sequence: 4
  fullname: MENG Ruxing
– sequence: 5
  fullname: LU Tao
Author_xml – sequence: 1
  fullname: 王露露
– sequence: 2
  fullname: 徐增敏
– sequence: 3
  fullname: 张雪莲
– sequence: 4
  fullname: 蒙儒省
– sequence: 5
  fullname: 卢涛
BookMark eNo9jctKw0AYRmdRwVr7Eu5cJP6TfzKTLKV4g4IbXZdJMlMaZAoOIlkKokspKAWL4AW0CNqFoNRFn8ZcfAsLiqsPDofzLZGa6RtFyAoFF4UI1lK3Z61xKYDnBIjU9ZB6DgBijdT_6SJpWtuLwKcofIFhnYTVx7h6OstHs2L4nn9e5JNpMbnMXx6_prfl9Wl1_lyOBuXNw9z5vh9Ud-N8dlK-Dou3q2WyoOWBVc2_bZD9zY291rbT3t3aaa23HUuBM0ch0xFPUEmMaRgIUCqiPgIXGjSLOEfOYtCai0QxCFWEHGKQDBIqQhnH2CCrv91jabQ03U7aPzo088dOatNunGWZBx6jAVCGP7K1Yoo
ClassificationCodes TP391.41%TP183
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.3778/j.issn.1002-8331.2312-0033
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Engineering
DocumentTitle_FL Cross-View Temporal Contrastive Learning for Self-Supervised Video Representation
EndPage 166
ExternalDocumentID jsjgcyyy202418014
GrantInformation_xml – fundername: (广西自然科学基金项目); (国家自然科学基金); (国家自然科学基金); (广西科技基地和人才专项); (广西科技基地和人才专项); (广西重点研发计划项目)
  funderid: (广西自然科学基金项目); (国家自然科学基金); (国家自然科学基金); (广西科技基地和人才专项); (广西科技基地和人才专项); (广西重点研发计划项目)
GroupedDBID -0Y
2B.
4A8
5XA
5XJ
92H
92I
93N
ABJNI
ACGFS
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CUBFJ
CW9
PSX
TCJ
TGT
U1G
U5S
ID FETCH-LOGICAL-s1064-e34fb6d3ea3c19870eeb153067f0f4b66364c0ff67de409eb360c0a40d179acc3
ISSN 1002-8331
IngestDate Thu May 29 04:10:55 EDT 2025
IsPeerReviewed false
IsScholarly false
Issue 18
Keywords 时序对比学习
自监督学习
局部对比学习
video representation learning
temporal contrastive learning
跨视图协同
local contrastive learning
self-supervised learning
cross-view co-training
视频表征学习
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1064-e34fb6d3ea3c19870eeb153067f0f4b66364c0ff67de409eb360c0a40d179acc3
PageCount 9
ParticipantIDs wanfang_journals_jsjgcyyy202418014
PublicationCentury 2000
PublicationDate 2024-09-15
PublicationDateYYYYMMDD 2024-09-15
PublicationDate_xml – month: 09
  year: 2024
  text: 2024-09-15
  day: 15
PublicationDecade 2020
PublicationTitle 计算机工程与应用
PublicationTitle_FL Computer Engineering and Applications
PublicationYear 2024
Publisher 桂林安维科技有限公司,广西桂林 541010%桂林安维科技有限公司,广西桂林 541010%武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室,武汉 430205
广西应用数学中心(桂林电子科技大学),广西 桂林 541004%桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004
广西应用数学中心(桂林电子科技大学),广西 桂林 541004
桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004
Publisher_xml – name: 广西应用数学中心(桂林电子科技大学),广西 桂林 541004%桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004
– name: 桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室,广西桂林 541004
– name: 广西应用数学中心(桂林电子科技大学),广西 桂林 541004
– name: 桂林安维科技有限公司,广西桂林 541010%桂林安维科技有限公司,广西桂林 541010%武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室,武汉 430205
SSID ssib051375739
ssib001102935
ssj0000561668
ssib023646291
ssib057620132
Score 1.9905722
Snippet TP391.41%TP183; 现有的自监督表征算法主要关注视频帧之间的短期运动特性,但是帧间动作序列的变化幅度较小,而且单视图数据因语义受限影响深度特征表达能力,视频动作中丰富...
SourceID wanfang
SourceType Aggregation Database
StartPage 158
Title 跨视图时序对比学习的自监督视频表征算法
URI https://d.wanfangdata.com.cn/periodical/jsjgcyyy202418014
Volume 60
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
journalDatabaseRights – providerCode: PRVEBS
  databaseName: Inspec with Full Text
  issn: 1002-8331
  databaseCode: ADMLS
  dateStart: 20200501
  customDbUrl:
  isFulltext: true
  dateEnd: 99991231
  titleUrlDefault: https://www.ebsco.com/products/research-databases/inspec-full-text
  omitProxy: false
  ssIdentifier: ssib057620132
  providerName: EBSCOhost
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwzR1Na9RQMNT2ogfxE78p4juVrfl4L--9Y5LNUsQKYgu9lSRNKj2sYNtDexNEj1JQChbBD9AiaA-CUg_9NW53_RfOzMtu0laleuolDJN5851kJrwPy7qRJNz3ZKYansigQSnSpJHKTDbc3M9VnnNV0O78k3f8iWl-a0bMDI3crc1aWl5Kx7PV364r-Z-oAg7iiqtk_yGyA6aAABjiC1eIMFwPFWMWKxZKFigEAsmUz2LBdMjCmMU-05KFhAkDploIBC0WarwFgOaEabIAaDjiA5vFkmkg5shQAeeAMCHTDgFA7NVkwRCXbgHGITUEilZEHMSoAMgKPWZOuOwXwUQf45A6mY5QT-QASEG3QIeQdAMgLg1BtSVeg8EkXETAfaTVxMYdABUJaaZtshmUNg4S4Jc9JBE5QaPJaDvJrXNRTMNgjbTgJIBRl4iZ82D6f09cjlM9zPpRynfyuMOUS0KNwQItVxoZhBAwsgrcit70mQpwBopxCtJolGmUVzAwIqCFfnEJhuCFLXKrIGC_uDHB4aVoM1ccNVVM-kGSOMT9YPRBBkdtqlz9S_IM9K4n9iB5DnI2NGRSYFTUxAcIPBY296Ql0ihiGBDGR1M1PV8qIjXKVECG8OyoJuWlS08cuRiTTmNeqajEgGnotf1-GOMe9FeiVjBQRdFfdVhWFOaEjP6bU9XqA8ecU1CWmo45cGh_FeNJqaiKQQnjAwnj0Iq5DTx8sardBjNqFxYX5rOVlRXMcQd3hDpmjbhQ6NjD1kjQnLx9r-qRoKXQVY-EB0j4brVhlnA8KWS1VbBAJuX2ruWBCT7obZYYl5qZzZxR7Zt_VppWRbaLpD1fK-CnTlkny857NDCv0dPW0Or9M9aJ2n6sZy3d-7bZ-_Cks7Gzu_618_1ZZ2t7d-t559P7H9uvuy8f955-7G6sdV-9A5qfb9d6bzY7O4-6n9d3v7w4Z0234qloolGeLdNYdKALa-QefJf8OS9PvAz_u9o5FK0C_58UdsFT6MN8ntlF4cu5nNs6Tz3fzuyE23NQwSRZ5p23htsP2vkFazQRvkzchEuZw8hCpfCVy7CVErlKdOpctK6Xhs-W347F2QPhunQYosvW8eoddsUaXnq4nF-FnmgpvVZG-RcgxfVe
linkProvider EBSCOhost
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E8%B7%A8%E8%A7%86%E5%9B%BE%E6%97%B6%E5%BA%8F%E5%AF%B9%E6%AF%94%E5%AD%A6%E4%B9%A0%E7%9A%84%E8%87%AA%E7%9B%91%E7%9D%A3%E8%A7%86%E9%A2%91%E8%A1%A8%E5%BE%81%E7%AE%97%E6%B3%95&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E5%B7%A5%E7%A8%8B%E4%B8%8E%E5%BA%94%E7%94%A8&rft.au=%E7%8E%8B%E9%9C%B2%E9%9C%B2&rft.au=%E5%BE%90%E5%A2%9E%E6%95%8F&rft.au=%E5%BC%A0%E9%9B%AA%E8%8E%B2&rft.au=%E8%92%99%E5%84%92%E7%9C%81&rft.date=2024-09-15&rft.pub=%E6%A1%82%E6%9E%97%E5%AE%89%E7%BB%B4%E7%A7%91%E6%8A%80%E6%9C%89%E9%99%90%E5%85%AC%E5%8F%B8%2C%E5%B9%BF%E8%A5%BF%E6%A1%82%E6%9E%97+541010%25%E6%A1%82%E6%9E%97%E5%AE%89%E7%BB%B4%E7%A7%91%E6%8A%80%E6%9C%89%E9%99%90%E5%85%AC%E5%8F%B8%2C%E5%B9%BF%E8%A5%BF%E6%A1%82%E6%9E%97+541010%25%E6%AD%A6%E6%B1%89%E5%B7%A5%E7%A8%8B%E5%A4%A7%E5%AD%A6%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%E6%99%BA%E8%83%BD%E6%9C%BA%E5%99%A8%E4%BA%BA%E6%B9%96%E5%8C%97%E7%9C%81%E9%87%8D%E7%82%B9%E5%AE%9E%E9%AA%8C%E5%AE%A4%2C%E6%AD%A6%E6%B1%89+430205&rft.issn=1002-8331&rft.volume=60&rft.issue=18&rft.spage=158&rft.epage=166&rft_id=info:doi/10.3778%2Fj.issn.1002-8331.2312-0033&rft.externalDocID=jsjgcyyy202418014
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fjsjgcyyy%2Fjsjgcyyy.jpg