抵御「目标检测」的对抗攻击!中山大学HCP实验室提出RobustDet,性能直升17%|ECCV2022 Oral

简介: 抵御「目标检测」的对抗攻击!中山大学HCP实验室提出RobustDet,性能直升17%|ECCV2022 Oral
【新智元导读】目标检测的对抗攻击怎么防?中山大学HCP实验室入选ECCV 2022 Oral的最新论文教你提升模型鲁棒性!


 

现有的深度学习模型容易受到恶意攻击或者噪声的影响,甚至对于人眼无法察觉的对抗噪声干扰,输出完全错误的结果,这就对基于深度学习的模型在实际中应用带来了严重的安全隐患。

 

 

因此提高神经网络的对抗鲁棒性,让模型具有更强的抵御对抗噪声的能力至关重要。

 

但现有相关对抗攻击和防御的视觉问题研究主要集中在分类任务,而对目标检测器的对抗鲁棒性相关研究工作非常少

 

最近中山大学人机物智能融合实验室科研团队在ECCV 2022上发表了一篇论文,深入地探索目标检测器的检测鲁棒性瓶颈问题,分析目标检测对抗训练中正常样本和对抗样本的冲突问题。

 

论文地址:https://arxiv.org/abs/2207.06202

项目地址:https://github.com/7eu7d7/RobustDet

 

文中并提出RobustDet(adversarially-aware robust object detector)框架,极大地提升了检测器的对抗鲁棒性。

 

 

在几乎不损失正常样本检测性能的前提下,对抗样本mAP检测性能提升了17%(针对分类损失的攻击)和12%(针对定位损失的攻击)。

 

 

目前该工作已入选ECCV Oral论文(接收比例2.7%),相关代码已开源。

 

对抗鲁棒性瓶颈

 

在基于现有目标检测器SSD的对抗鲁棒性研究中发现,检测任务中模型的对抗鲁棒性存在明显的瓶颈问题,这与分类任务有所不同。具体来讲,在分类任务中,常用的对抗训练几乎不会使模型对正常样本的识别能力下降太大,并且模型在对抗样本上的性能和正常样本的性能也只有10%左右的差距。

 

而典型的目标检测器存在对抗瓶颈问题:目标检测器在对抗训练后,不仅会较大程度损失识别正常样本的能力(接近30%),而且也只能获得有限的鲁棒性(对抗样本对比正常样本:模型检测性能相差近50%)。这意味着,在目标检测器对抗训练学习时,正常样本和对抗样本的学习可能存在冲突,模型难以同时学好两种样本。

 

为了验证这一假设,研究人员进行了相关实验和验证。

 

让一个对抗训练得到的鲁棒目标检测器继续学习m步的对抗样本或正常样本,大多数情况都会使另一种样本的loss增加;而学习m步正常样本则大多情况都会让其他的正常样本loss降低。

 

 

也就是说一个对抗训练得到的鲁棒模型,在进一步学习正常样本时,会使得检测对抗样本的性能下降,进一步学习对抗样本也会使检测正常样本的性能下降。这可以从loss变化的角度有效的证明目标检测器在学习正常和对抗样本时存在冲突。

 

从loss变化的层面可以验证冲突的存在,而从梯度层面则可以进一步解释冲突。定义样本间梯度的纠缠度为

 

实验结果可以看到对抗样本和正常样本的梯度具有较高的纠缠度,这也就说明学习一种样本便会对另一种样本产生较强的干扰,从而导致冲突。

 

 

在一个理想的鲁棒模型中,模型应当同时学会了正常样本和对抗样本相同的特征以及独有的特征。两种图像的共享特征应该得到很好的学习,只有处理特定特征的部分仍然需要强化。

 

这样的模型继续学习两种样本时梯度都不应与另一种样本有较高纠缠度,因为共同的特征已经学好,进一步学习的主要是两种样本独有的特征。有较高的梯度纠缠度则说明模型没有足够的能力解耦两种样本独有的特征及其梯度。在学习一种图像时,不可避免地会对另一种图像产生影响,从而导致检测的鲁棒性瓶颈。

 

RobustDet

 

基于上一节中对于目标检测对抗鲁棒性瓶颈问题的分析,该论文提出RobustDet框架来缓解目标检测对抗训练中正常样本和对抗样本学习的冲突。

 

RobustDet通过对抗样本判别器(AID,Adversarial Image Discriminator)引导的对抗感知卷积(AAconv,Adversarially-Aware Convolution),来自适应的用不同权重处理不同的样本,其中AID根据图像上的对抗噪声来为AAconv生成权重。

 

同时受VAE启发,文章更进一步,为模型添加重建到正常样本的约束,来进一步促进模型学习更加鲁棒的特征。

 

Adversarially-Aware Convolution (AAconv)

 

正常样本和对抗样本的冲突客观存在,我们应当承认目标检测器的这一缺陷,并在此基础上思考解决方案,而不是让模型强行对齐两种样本。

 

 

为了缓解对抗样本和正常样本的冲突,文章提出了AAConv来自适应的为正常样本和对抗样本学习不同的动态卷积核。

 

借助动态卷积的思想,AAConv构建几组不同的卷积核并根据与输入图像相关的权重对这些卷积核加权,权重则由(AID)根据输入的图像得到。

 

Adversarial Image Discriminator (AID)

 

对抗样本和正常样本的权重应具有不同的分布,并且这两个分布要有一定间距,以保证不会因为对抗攻击而给出错误的权重。

 

错误的权重会产生错误的卷积核,这对目标检测器是致命的。因此AID的鲁棒性便至关重要,还需要添加额外的监督约束,文章为AID添加Triplet Loss(   )以使其显式的学习区分对抗样本和正常样本,为两种样本生成尽可能不同的权重。

 

 

其中,两个样本的距离度量采用JS散度,表示一个minibatch中的某个triplet中与其锚点样本有相同或不同类型标签(clean或对抗样本)的样本,表示直接的间隙,表示triplets的数量,则表示ReLU操作。

 

Consistent Features with Reconstruction (CFR)


为了进一步减少对抗噪声的负面影响,文章借鉴VAE的思想为模型添加了重建约束。对模型中的某一个特定层,理想情况它在对抗样本上输出的特征图应处于以正常样本特征为中心的多元高斯分布中。假设这一高斯分布的协方差矩阵为对角阵:

 

 

则更好的做法不是直接预测这一特征图,而是预测它所处分布的均值和标准差,其中是模型中用于预测均值和标准差的两个卷积层。正常样本和对抗样本由动态的encoder编码并由一个静态的decoder进行解码,解码结果应与其对应的正常样本尽可能一致。通过重建约束促进AAConv学习更加鲁棒的特征,让模型在对抗样本和正常样本上提取的特征都能被尽可能重建为对应的正常样本,



其中,同时G表示解码器模型。参考VAE的相关理论,为了防止预测的分布坍缩,还需要添加额外的约束:

 


实验结果

 

在实验中,文章将提出的RobustDet与现有方法在PASCAL VOC和MS-COCO两个数据集上分别进行了对比,并进行了消融实验证明和CFR的必要性,以及模型对多种对抗攻击的泛化能力。

 

 

文章将所提方法与现有SOTA方法对比,在VOC和COCO上RobustDet相比于其他方法在正常上只会损失微小的性能。

 

 

在针对分类的攻击上,VOC提升了17%以上,COCO提升了6%以上。在针对定位的攻击上,VOC提升了12%以上,COCO提升了4%以上。在其他一些训练中没见过的攻击上也可以表现出较强的泛化能力。

 

 

文章也同样分析了各模块的必要性。在去掉后模型的鲁棒性出现了一定程度下降,这说明确实可以有效提升AID的鲁棒性,防止模型为对抗样本分配错误的权重,从而生成错误的卷积核。在缺少重建约束,只使用预测分布的操作时,模型无法有效学习,鲁棒性较差。在添加CFR重建约束后,模型识别正常图像的能力有轻微下降,但鲁棒性能获得一定提升。


结论

 

文章围绕目标检测器的对抗鲁棒性深入探索了目标检测鲁棒性瓶颈,即目标检测器在对抗训练后不仅无法获得足够的鲁棒性,并且会损失大量识别正常样本的性能。

 

该工作通过损失值变化和梯度相关性来实验证明,正常样本和对抗样本在目标检测对抗训练中的冲突是导致鲁棒性瓶颈的重要原因之一。

 

为了缓解该冲突,文章提出RobustDet模型,通过AID根据图像的对抗扰动来针对不同类型的样本为AAconv生成不同的权重,以自适应地处理不同类型的图像。

 

在此基础上,RobustDet还提出添加重建约束,让动态模型对两种样本提取的特征通过一个静态的解码器,都能被尽可能解码为对应的正常样本,以促进AAconv学习更加鲁棒的特征。

 

最终的实验表明RobustDet可以非常有效的缓解目标检测鲁棒性瓶颈,在几乎不损失正常样本识别性能的前提下,提升模型的对抗鲁棒性。

实验室简介


中山大学人机物智能融合实验室(Human Cyber Physical Intelligence Integration Lab,简称HCP实验室)在图像视频处理和分析、自然语言理解、机器学习和认知推理等学术领域进行长期深入的科研探索,多次获得国内外学术奖励,形成了广泛的影响力。更多介绍见HCP实验室主页:https://www.sysu-hcp.net/参考资料:https://arxiv.org/abs/2207.06202https://github.com/7eu7d7/RobustDet

相关文章
|
存储 数据采集 数据可视化
用Python分析西安景点,告诉你哪些景点性价比高
清明马上就要到了,难得的三天假期,祭祖的同时,踏青游玩也是少不了的,但是去哪里玩是一个问题。于是,志斌用Python爬取了去哪儿网上西安景点的相关数据,包括景点名称、城区、热度、价格、月销量等数据,对数据进行可视化并作简单分析,用以找到性价比较高的景点。
881 1
用Python分析西安景点,告诉你哪些景点性价比高
|
3月前
|
机器学习/深度学习 监控 算法
基于YOLOv8的电瓶车/电动车识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于 YOLOv8 和 PyQt5,成功实现了电瓶车/电动车的自动识别系统,包含从模型训练到图形界面部署的完整流程。通过YOLOv8的强大目标检测能力和PyQt5的易用图形界面
|
6月前
|
SQL 人工智能 自然语言处理
别让你的大模型被忽悠了,聊聊prompt注入攻击
本文探讨了Prompt工程中的隐私与安全问题,重点分析了“奶奶漏洞”及更广泛的Prompt攻击现象,特别是Prompt注入的原理与防御手段。Prompt注入通过构造恶意输入突破模型限制,使LLM执行非预期操作。文章介绍了直接注入和间接注入类型,并提供了多种防御方案,如输入过滤、强化系统指令、接入第三方校验库及多模型协作防御。此外,还讨论了Prompt逆向工程及其正负影响,以及恶意MCP服务投毒的实际案例,如GitHub Copilot漏洞。最后提出了动态权限控制和持续安全监测等解决策略。
|
10月前
|
机器学习/深度学习 数据可视化 算法
RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
708 5
|
10月前
|
机器学习/深度学习 缓存 人工智能
《DeepSeek在高并发下的性能秘籍:稳定性与速度保障》
DeepSeek是一款基于Transformer架构的大语言模型,专为高并发场景设计。通过自注意力机制、分布式系统和负载均衡技术,DeepSeek能高效处理多请求,确保稳定性和快速响应。其缓存机制加速数据获取,模型优化提升计算效率,动态资源调配灵活应对流量波动。这些技术共同作用,使DeepSeek在智能客服、内容推荐等场景中表现出色,成为高并发应用的理想选择。
1022 10
|
存储 NoSQL Java
【面试宝藏】Redis 常见面试题解析
Redis 是内存数据结构存储系统,用作数据库、缓存和消息中间件,支持字符串、哈希、列表等数据类型。它的优点包括高性能、原子操作、持久化和复制。相比 Memcached,Redis 提供数据持久化、丰富数据结构和发布/订阅功能。Redis 采用单线程模型,但通过 I/O 多路复用处理高并发。常见的面试问题涉及持久化机制、过期键删除、回收策略、集群和客户端等。
389 4
|
编解码 机器人 测试技术
2024年6月计算机视觉论文推荐:扩散模型、视觉语言模型、视频生成等
6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。
612 8
|
人工智能 自然语言处理 运维
前端大模型应用笔记(一):两个指令反过来说大模型就理解不了啦?或许该让第三者插足啦 -通过引入中间LLM预处理用户输入以提高多任务处理能力
本文探讨了在多任务处理场景下,自然语言指令解析的困境及解决方案。通过增加一个LLM解析层,将复杂的指令拆解为多个明确的步骤,明确操作类型与对象识别,处理任务依赖关系,并将自然语言转化为具体的工具命令,从而提高指令解析的准确性和执行效率。
495 6
|
机器学习/深度学习 人工智能 算法
构建一个基于AI的语音识别系统:技术深度解析与实战指南
【5月更文挑战第28天】本文深入探讨了构建基于AI的语音识别系统,涵盖基本原理、关键技术及实战指南。关键步骤包括语音信号预处理、特征提取、声学模型、语言模型和解码器。深度学习在声学和语言模型中发挥关键作用,如RNN、LSTM和Transformer。实战部分涉及数据收集、预处理、模型训练、解码器实现及系统评估。通过本文,读者可了解构建语音识别系统的基本流程和技巧。
1074 1
|
UED Python
【Python】已解决:FileNotFoundError: [Errno 2] No such file or directory: ‘D:\1. PDF’
【Python】已解决:FileNotFoundError: [Errno 2] No such file or directory: ‘D:\1. PDF’
820 0