【IR】什么是对抗攻击 | 视觉跟踪

2024-03-13 01:20
文章标签 攻击 视觉 对抗 跟踪 ir

本文主要是介绍【IR】什么是对抗攻击 | 视觉跟踪,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

现在有机会接触一下针对深度学习神经网络的对抗攻击,并做整理如下🤔
对于CV攻防,其实去年组会听过就浏览过相关文章👉面向目标检测的对抗样本综述+后门防御, NIPS2022

adversarial attack for tracking

  • 一些攻|防方法
  • CVPR2021 | IoU Attack
    • 导读
    • 方法
    • 结果
    • 相关工作
  • CVPR2020 | CSA
    • 摘要
    • 方法
    • 结果

一些攻|防方法

在这里插入图片描述

CVPR2021 | IoU Attack

在这里插入图片描述IoU Attack: Towards Temporally Coherent Black-Box Adversarial Attack for Visual Object Tracking
Code
上海交大,腾讯

导读

对抗性攻击的产生是由于深度神经网络在感知注入了难以察觉的扰动的输入样本方面的脆弱性。

本文提出了一种基于决策的视觉目标跟踪黑盒攻击方法。与现有的处理静态图像来进行图像分类的黑盒对抗攻击方法相比,IoU attack根据当前帧和历史帧的预测IoU分数按顺序生成扰动。通过降低IoU分数,所提出的攻击方法相应地降低了时序一致性的边界框(物体的运动)的准确性。此外,我们将学习到的扰动转移到接下来的几帧来初始化时间运动攻击。我们在最先进的深度跟踪器上验证了提出的IoU攻击方法。
在这里插入图片描述

方法

目标:通过使用最小数量的噪声在迭代期间逐渐降低IoU分数(即bbox重叠值)。
IoU攻击在帧之间逐渐降低IoU分数的直观视图👇
在这里插入图片描述
(左侧图)迭代扰动更新:噪声水平的增加与IoU分数的减少呈正相关,但它们的方向并不完全相同。IoU攻击方法迭代地找到噪声增加和IoU减少的每条轮廓线之间的交叉点(即中间图像)。这些中间图像以最低的噪声量逐渐降低IoU分数。
(右侧图)正交合成:根据当前轮廓线切向生成噪声假设(即#1),并在法线方向上增加少量噪声(即#2)。将根据在相同噪声水平下产生最低IoU的假设来识别交叉点。每次迭代中更新的扰动是#1和#2的组合。

给定的一个干净的输入帧,添加重均匀噪声来生成IoU分数较低的重噪声图像。沿着从干净图像到重噪声图像的方向,当噪声水平增加时,IoU分数逐渐降低。IoU降低的方向与噪声增加的方向正相关,但它们并不完全相同。IoU攻击旨在逐步找到降低的IoU分数,同时引入最低量的噪声。

我们将第t帧的原始图像表示为 I 0 I_0 I0,将重噪声图像表示为 H H H,将第 k k k次迭代上的中间图像表示为 I k I_k Ik。在第k+1次迭代中,我们首先随机生成几个高斯分布噪声 η \eta η~ N ( 0 , 1 ) N(0,1) N(0,1),并从n个噪声中选择切向扰动 η \eta η为: d ( I 0 , I k ) = d ( I 0 , I k + η ) d(I_0,I_k)=d(I_0,I_k+\eta) d(I0,Ik)=d(I0,Ik+η)d是两个图像之间的像素级距离测量值。

结果

在VOT2019数据集上分别与SiamRPN、DiMP和LTMU的原始序列、随机噪声和IoU攻击的跟踪结果的比较:
在这里插入图片描述VOT2019数据集中包含60个具有挑战性的序列。与其他数据集不同,VOT数据集具有重新初始化模块。VOT数据集具有重新初始化模块。当追踪器失去目标(即预测结果与标注之间的重叠为零)时,追踪器将使用真实标注重新初始化。

Failures表示重新初始化的次数,Accuracy评估成功跟踪帧的平均重叠率,Robustness衡量的是总体追踪失败次数,预期平均重叠(EAO)通过准确性和稳健性的组合进行评估。

还有在数据集VOT2018、VOT2016、OTB100、NFS30上的比较结果,详见论文。
在这里插入图片描述消融实验:
S t e m p o r a l S_{temporal} Stemporal表示时间IoU分数, P t − 1 P_{t−1} Pt1表示从历史帧中学习到的扰动。
在这里插入图片描述

相关工作

Visual Object Tracking
现有跟踪器通常可以分为离线跟踪器和在线跟踪器

  • offline trackers
    在推理过程中,不会更新模型参数,从而提高了速度。这些tracker将跟踪视为一个判别性目标检测问题。它们生成候选区域,并对要定位的目标或背景进行分类。边界框回归总是用于精确定位。其中,基于Siamese的方法是由模板分支和搜索分支组成的典型结构。
  • online update trackers
    在线更新跟踪器在推理过程中不断更新模型参数,以适应当前场景。

本文提出的黑盒攻击方法对一个离线跟踪器(SiamRPN++)和两个在线跟踪器(DiMP、LTMU)实现对抗攻击,以说明该攻击方法的通用性。

  • SiamRPN绘制了一个区域建议网络,通过比较两个分支之间的相似性来制定一次性检测。SiamRPN++应用了更深层次的网络ResNet,而不是常用的AlexNet,以提高跟踪精度并保持实时速度。
  • DiMP学习判别学习损失,以利用目标和背景外观信息进行目标模型预测。
  • LTMU是一个具有meta更新器的长期跟踪器,它学习引导跟踪器的更新,以获得有用的外观信息,从而提高准确性。

CVPR2020 | CSA

在这里插入图片描述
Cooling-shrinking attack: Blinding the tracker with imperceptible noises
Code
大连理工,鹏程实验室

摘要

CNN的对抗攻击旨在通过给图像增加难以察觉的扰动来欺骗模型,使其失灵。这一特点有助于深入理解神经网络,提高深度学习模型的鲁棒性。尽管有几项工作专注于攻击图像分类器和对象检测器,但仍然缺乏一种以model-free的方式攻击任何目标的单个对象跟踪器的有效方法。

在本文中,提出了一种冷却收缩攻击方法来欺骗最先进的基于SiameseRPN的跟踪器。使用精心设计的对抗性损失训练一个有效且高效的扰动生成器,它可以同时冷却热图上存在目标的热点区域,并迫使预测的边界框收缩,使追踪目标对跟踪器不可见。

O T B 100 OTB100 OTB100 V O T 2018 VOT2018 VOT2018 L a S O T LaSOT LaSOT数据集上的大量实验表明,本文提出的方法可以通过向模板或搜索区域添加小扰动来有效地欺骗最新的 S i a m e s e R P N + + SiameseRPN++ SiameseRPN++跟踪器的状态。此外,本方法具有良好的可转移性,能够欺骗其他顶级性能跟踪器,如 D a S i a m R P N DaSiamRPN DaSiamRPN D a S i a m R P − U p d a t e N e t DaSiamRP-UpdateNet DaSiamRPUpdateNet D i M P DiMP DiMP

方法

  • 用于搜索区域的扰动生成器的网络架构:
    在这里插入图片描述

  • 冷却收缩损失:

cooling loss用于干扰热图 M H M_H MH,用于干扰回归图 M R M_R MRshrinking loss
在这里插入图片描述

结果

仅攻击搜索区域:
在这里插入图片描述

仅攻击模板:
在这里插入图片描述消融实验:

在这里插入图片描述
也就是,shrinking loss有助于攻击搜索区域,但对攻击模板有一定的危害。

可视化效果图和讨论,详见论文


这篇关于【IR】什么是对抗攻击 | 视觉跟踪的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/803207

相关文章

速盾高防cdn是怎么解决网站攻击的?

速盾高防CDN是一种基于云计算技术的网络安全解决方案,可以有效地保护网站免受各种网络攻击的威胁。它通过在全球多个节点部署服务器,将网站内容缓存到这些服务器上,并通过智能路由技术将用户的请求引导到最近的服务器上,以提供更快的访问速度和更好的网络性能。 速盾高防CDN主要采用以下几种方式来解决网站攻击: 分布式拒绝服务攻击(DDoS)防护:DDoS攻击是一种常见的网络攻击手段,攻击者通过向目标网

计算机视觉工程师所需的基本技能

一、编程技能 熟练掌握编程语言 Python:在计算机视觉领域广泛应用,有丰富的库如 OpenCV、TensorFlow、PyTorch 等,方便进行算法实现和模型开发。 C++:运行效率高,适用于对性能要求严格的计算机视觉应用。 数据结构与算法 掌握常见的数据结构(如数组、链表、栈、队列、树、图等)和算法(如排序、搜索、动态规划等),能够优化代码性能,提高算法效率。 二、数学基础

Verybot之OpenCV应用三:色标跟踪

下面的这个应用主要完成的是Verybot跟踪色标的功能,识别部分还是居于OpenCV编写,色标跟踪一般需要将图像的颜色模式进行转换,将RGB转换为HSV,因为对HSV格式下的图像进行识别时受光线的影响比较小,但是也有采用RGB模式来进行识别的情况,这种情况一般光线条件比较固定,背景跟识别物在颜色上很容易区分出来。         下面这个程序的流程大致是这样的:

《计算机视觉工程师养成计划》 ·数字图像处理·数字图像处理特征·概述~

1 定义         从哲学角度看:特征是从事物当中抽象出来用于区别其他类别事物的属性集合,图像特征则是从图像中抽取出来用于区别其他类别图像的属性集合。         从获取方式看:图像特征是通过对图像进行测量或借助算法计算得到的一组表达特性集合的向量。 2 认识         有些特征是视觉直观感受到的自然特征,例如亮度、边缘轮廓、纹理、色彩等。         有些特征需要通

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.

参会邀请 | 第二届机器视觉、图像处理与影像技术国际会议(MVIPIT 2024)

第二届机器视觉、图像处理与影像技术国际会议(MVIPIT 2024)将于2024年9月13日-15日在中国张家口召开。 MVIPIT 2024聚焦机器视觉、图像处理与影像技术,旨在为专家、学者和研究人员提供一个国际平台,分享研究成果,讨论问题和挑战,探索前沿技术。诚邀高校、科研院所、企业等有关方面的专家学者参加会议。 9月13日(周五):签到日 9月14日(周六):会议日 9月15日(周日

LLVM入门2:如何基于自己的代码生成IR-LLVM IR code generation实例介绍

概述 本节将通过一个简单的例子来介绍如何生成llvm IR,以Kaleidoscope IR中的例子为例,我们基于LLVM接口构建一个简单的编译器,实现简单的语句解析并转化为LLVM IR,生成对应的LLVM IR部分,代码如下,文件名为toy.cpp,先给出代码,后面会详细介绍每一步分代码: #include "llvm/ADT/APFloat.h"#include "llvm/ADT/S

【python计算机视觉编程——8.图像内容分类】

python计算机视觉编程——8.图像内容分类 8.图像内容分类8.1 K邻近分类法(KNN)8.1.1 一个简单的二维示例8.1.2 用稠密SIFT作为图像特征8.1.3 图像分类:手势识别 8.2贝叶斯分类器用PCA降维 8.3 支持向量机8.3.2 再论手势识别 8.4 光学字符识别8.4.2 选取特征8.4.3 多类支持向量机8.4.4 提取单元格并识别字符8.4.5 图像校正

Linux内置的审计跟踪工具:last命令

如果你是一个服务器管理员,你或许知道你要保护你的服务器的话,不仅是从外部,还要从内部保护。Linux有一个内置工具来看到最后登陆服务器的用户,可以帮助你保护服务器。   这个命令是last。它对于追踪非常有用。让我们来看一下last可以为你做些什么。   last命令的功能是什么   last显示的是自/var/log/wtmp文件创建起所有登录(和登出)的用户。这个文件是二进制

YOLOv8/v10+DeepSORT多目标车辆跟踪(车辆检测/跟踪/车辆计数/测速/禁停区域/绘制进出线/绘制禁停区域/车道车辆统计)

01:YOLOv8 + DeepSort 车辆跟踪 该项目利用YOLOv8作为目标检测模型,DeepSort用于多目标跟踪。YOLOv8负责从视频帧中检测出车辆的位置,而DeepSort则负责关联这些检测结果,从而实现车辆的持续跟踪。这种组合使得系统能够在视频流中准确地识别并跟随特定车辆。 02:YOLOv8 + DeepSort 车辆跟踪 + 任意绘制进出线 在此基础上增加了用户