平衡可迁移与不可察觉的对抗攻击

Balancing Transferability and Imperceptibility for Adversarial Attacks

下载PDF

导出

摘要基于数据驱动的深度学习模型由于无法覆盖所有可能样本数据,导致面临着精心设计的对抗样本的攻击问题。现有主流的基于RGB像素值的L_(p)范数扰动攻击方法虽然达到了很好的攻击成功率和迁移性,但是所生成的对抗样本存在极易被人眼感知的高频噪声,而基于扩散模型的攻击方法兼顾了迁移性和不可察觉性,但是其优化策略主要从对抗模型的角度展开,缺乏从代理模型的角度对可迁移性和不可察觉性的深入探讨和分析。为了进一步探索分析可迁移性和不可察觉性的控制来源,以基于代理模型的攻击方法为框架,提出了一种新的基于潜在扩散模型的对抗样本生成方法。该方法中,在基本的对抗损失约束条件下,设计了可迁移注意力约束损失和不可察觉一致性约束损失,实现了对可迁移性与不可察觉性的平衡。在ImageNet-Compatible,CUB-200-2011和Stanford Cars这3个公开数据集上,与已有方法相比,所提方法生成的对抗样本具有很强的跨模型迁移攻击能力和人眼不易觉察扰动的效果。 Data-driven deep learning models face the problem of well-designed adversarial attacks due to their inability to cover all possible sample data.The existing main L_(p)-norm perturbation attack methods based on RGB pixel space have achieved great attack success rates and transferability,but the generated adversarial samples have high-frequency noise that is easily perceived by the human eye.The attack methods based on diffusion models balance transferability and imperceptibility,but their optimization strategies mainly focus on the perspective of adversarial models.Those researches lack deep exploration and analysis of transferability and imperceptibility from the perspective of surrogate model.In order to further explore and analyze the control sources of transferability and imperceptibility,a new adversarial sample generation method based on latent diffusion model is proposed within the framework of an attack method based on surrogate model.In this method,under the constraint of basic adversarial loss,transferable attention constraint loss and imperceptible consistency constraint loss are designed to achieve a balance between transferability and imperceptibility.On three publicly available datasets,ImageNet Compatible,CUB-200-2011,and Stanford Cars,compared with existing methods,the proposed method generates adversarial samples with strong cross-model transferable attack ability and the effect of imperceptible disturbance to the human eye.

作者康凯王家宝徐堃 KANG Kai;WANG Jiabao;XU Kun(College of Command and Control Engineering,Army Engineering University of PLA,Nanjing 210007,China)

机构地区陆军工程大学指挥控制工程学院

出处《计算机科学》北大核心 2025年第6期381-389,共9页 Computer Science

基金江苏省自然科学基金(BK20200581)。

关键词对抗攻击扩散模型可迁移性不可察觉性注意力机制 Adversarial attacks Diffusion model Transferability Imperceptibility Attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1武阳,刘靖.面向图像分析领域的黑盒对抗攻击技术综述[J].计算机学报,2024,47(5):1138-1178. 被引量：8

二级参考文献9

1潘文雯,王新宇,宋明黎,陈纯.对抗样本生成技术综述[J].软件学报,2020,31(1):67-81. 被引量：60
2Kui Ren,Tianhang Zheng,Zhan Qin,Xue Liu.Adversarial Attacks and Defenses in Deep Learning[J].Engineering,2020,6(3):346-360. 被引量：26
3刘西蒙,谢乐辉,王耀鹏,李旭如.深度学习中的对抗攻击与防御[J].网络与信息安全学报,2020,6(5):36-53. 被引量：24
4李欣姣,吴国伟,姚琳,张伟哲,张宾.机器学习安全攻击与防御机制研究进展和未来挑战[J].软件学报,2021,32(2):406-423. 被引量：31
5LYU Haoran,TAN Yu’an,XUE Yuan,WANG Yajie,XUE Jingfeng.A CMA-ES-Based Adversarial Attack Against Black-Box Object Detectors[J].Chinese Journal of Electronics,2021,30(3):406-412. 被引量：1
6黄立峰,庄文梓,廖泳贤,刘宁.一种基于进化策略和注意力机制的黑盒对抗攻击算法[J].软件学报,2021,32(11):3512-3529. 被引量：9
7陈梦轩,张振永,纪守领,魏贵义,邵俊.图像对抗样本研究综述[J].计算机科学,2022,49(2):92-106. 被引量：15
8张田,杨奎武,魏江宏,刘扬,宁原隆.面向图像数据的对抗样本检测与防御技术综述[J].计算机研究与发展,2022,59(6):1315-1328. 被引量：15
9刘昊,张泽辉,夏晓帆,高铁杠.一种基于几何探测的快速黑盒边界攻击算法[J].计算机研究与发展,2023,60(2):435-447. 被引量：2

共引文献7

1郑爱云,张聪,刘伟民,郑直.基于改进可学习攻击策略对抗训练轴承故障诊断研究[J].机床与液压,2025,53(14):24-32. 被引量：1
2刘乐源,陈格格,吴炜,王永,周帆.数据分类分级技术研究综述[J].计算机科学,2025,52(9):195-211. 被引量：3
3王飞,钱可涵,吕明琪,朱添田,陈鸿龙.面向主机入侵检测的多视图对抗攻击防御方法[J].通信学报,2025,46(8):53-65.
4邰旭辉,贾建军,刘建红,黄倩,王俊卿.基于改进YOLOv8算法的输电绝缘子异常状态辨识[J].仪表技术与传感器,2025(9):120-126.
5石家乐,宋亚飞,吴晓佰,李天鹏.基于改进知识蒸馏的黑盒攻击方法[J].中国科学:信息科学,2025,55(11):2780-2797.
6谢家乐,赵宇熙,曾念寅,王若.基于多尺度均衡正则的对抗补丁攻击方法[J].电子测量技术,2025,48(24):89-96.
7李宇佳,张辉,多滨,王梓斌,周让,李冬芬.无人机系统安全靶场构建与攻防验证设计[J].网络与信息安全学报,2026,12(1):54-73.

1李瞧,陈晶,张子君,何琨,杜瑞颖,汪欣欣.基于随机平滑的通用黑盒认证防御[J].计算机学报,2024,47(3):690-702.
2马珍妮,张富春,石佳佳.基于特征碰撞的干净标签攻击方法[J].延安大学学报(自然科学版),2025,44(2):43-50.
3候知健.黎明前夜旋转爆震发动机瞄准实用[J].航空知识,2025(5):62-63.
4李世宝,王杰伟,崔学荣,刘建航,黄庭培.基于图像着色的无限制攻击[J].计算机与现代化,2022(11):52-59.
5张舒君,顾萌萌,熊艳晔.无人机技术对东非地区冲突的影响及其启示[J].航天电子对抗,2025,41(2):69-72.
6刘志鹏,顾艳阳,胡宝洁,贺方君,范志鹏.一种关于新型分布式对抗的仿真框架构建方法研究[J].系统仿真学报,2025,37(5):1305-1313.
7张佳薇,姜天,杨春梅,刘强,韩哲,刘泽盛,李明宝.基于近红外光谱的林内枯叶跨林分间模型迁移的含水率检测方法[J].森林工程,2025,41(3):439-450.
8崔晨昊,樊晨.谷物品质在线检测:基于近红外光谱的建模与迁移[J].粮油食品科技,2025,33(3):74-84.
9余松林,李岩,李芳媛,吴雨,魏亚星,李炳臻.基于显示器的人眼亮度差别感知阈值试验研究[J].防护工程,2025(1):15-19.
10张兴兰,陶科锦.基于高阶特征与重要通道的通用性扰动生成方法[J].信息网络安全,2025(5):767-777.

计算机科学

2025年第6期

浏览历史

内容加载中请稍等...

平衡可迁移与不可察觉的对抗攻击

参考文献1

二级参考文献9

共引文献7

相关作者

相关机构

相关主题

浏览历史