基于扩散模型数据增广的域泛化方法

TP39; 域泛化是计算机视觉领域中一个重要且具有挑战性的问题,该问题源于现实场景中的数据分布偏移.在实际应用中,通常会遇到训练数据和测试数据来自不同的数据域的情况,这种数据分布的差异会导致测试时准确率下降.因此,提出了一种基于隐空间数据增广的域泛化方法,与传统图像级数据增广方法不同,该方法在隐空间中引入扩散模型,以实现对特征的精细控制和多样性生成,从而提升模型在目标域上的泛化能力.具体来说,基于分类器的隐式扩散模型在隐空间训练后可以条件生成准确且丰富的源域特征,并利用高效的采样方法加速生成增广特征.实验结果表明,新提出的方法在各种域泛化任务上取得了显著的性能提升,在真实场景中有较好的有效性和...

Full description

Saved in:
Bibliographic Details
Published in智能科学与技术学报 Vol. 5; no. 3; pp. 380 - 388
Main Authors 童煜钧, 王荷清, 罗悦恒, 宁文欣, 关曼丹, 喻雯晴, 黄柯彦, 张加迅, 马占宇
Format Journal Article
LanguageChinese
Published 北京邮电大学人工智能学院,北京 100876%北京空间飞行器总体设计部,北京 100094 15.09.2023
POSTS&TELECOM PRESS Co., LTD
Subjects
Online AccessGet full text
ISSN2096-6652
DOI10.11959/j.issn.2096-6652.202334

Cover

More Information
Summary:TP39; 域泛化是计算机视觉领域中一个重要且具有挑战性的问题,该问题源于现实场景中的数据分布偏移.在实际应用中,通常会遇到训练数据和测试数据来自不同的数据域的情况,这种数据分布的差异会导致测试时准确率下降.因此,提出了一种基于隐空间数据增广的域泛化方法,与传统图像级数据增广方法不同,该方法在隐空间中引入扩散模型,以实现对特征的精细控制和多样性生成,从而提升模型在目标域上的泛化能力.具体来说,基于分类器的隐式扩散模型在隐空间训练后可以条件生成准确且丰富的源域特征,并利用高效的采样方法加速生成增广特征.实验结果表明,新提出的方法在各种域泛化任务上取得了显著的性能提升,在真实场景中有较好的有效性和鲁棒性.该方法的创新点在于将数据增广焦点转移到隐空间级别,并引入扩散模型进行增广,为解决域泛化问题提供了一种新的思路.
ISSN:2096-6652
DOI:10.11959/j.issn.2096-6652.202334