GAN图像对抗样本生成方法

TP393; 为了提高生成对抗网络模型对抗样本的多样性和攻击成功率,提出了一种GAN图像对抗样本生成方法.首先,利用原始样本集整体训练一个深度卷积对抗生成网络G1,模拟原始样本集分布;其次,在黑盒攻击场景下,利用模型蒸馏方法对目标模型进行黑盒复制,获取目标模型的本地复制;然后以G1的输出作为输入,以蒸馏模型作为目标模型,训练生成对抗网络G2,在有目标攻击情况下还需输入目标类别,G2用以生成输入数据针对目标类别的扰动;最后将样本与扰动相加并以像素灰度值区间进行规范化,得到对抗样本.实验结果表明,在相同输入条件下该方法产生图像对抗样本平均SSIM指标、MI指标和Cosin相似度分别降低50.7％、...

Full description

Saved in:

Bibliographic Details
Published in	计算机科学与探索 Vol. 15; no. 4; pp. 702 - 711
Main Authors	王曙燕, 金航, 孙家泽
Format	Journal Article
Language	Chinese
Published	西安邮电大学计算机学院,西安 710121 01.04.2021
Subjects	神经网络生成对抗网络(GAN) 对抗样本模型蒸馏图像多样性
Online Access	Get full text
ISSN	1673-9418
DOI	10.3778/j.issn.1673-9418.2005022

Cover

More Information
Summary:	TP393; 为了提高生成对抗网络模型对抗样本的多样性和攻击成功率,提出了一种GAN图像对抗样本生成方法.首先,利用原始样本集整体训练一个深度卷积对抗生成网络G1,模拟原始样本集分布;其次,在黑盒攻击场景下,利用模型蒸馏方法对目标模型进行黑盒复制,获取目标模型的本地复制;然后以G1的输出作为输入,以蒸馏模型作为目标模型,训练生成对抗网络G2,在有目标攻击情况下还需输入目标类别,G2用以生成输入数据针对目标类别的扰动;最后将样本与扰动相加并以像素灰度值区间进行规范化,得到对抗样本.实验结果表明,在相同输入条件下该方法产生图像对抗样本平均SSIM指标、MI指标和Cosin相似度分别降低50.7％、10.96％和28.7％,平均均方误差值(MSE)和图像指纹的海明距离分别提升7.6％和1974.80,同时MNIST数据集和CIFAR10数据集下模型平均攻击成功率在95％以上.
ISSN:	1673-9418
DOI:	10.3778/j.issn.1673-9418.2005022