论文那些事—DECISION-BASED ADVERSARIAL ATTACKS:RELIABLE ATTACKS AGAINST BLACK-BOX MACHINE LEARNING MODELS

本文主要是介绍论文那些事—DECISION-BASED ADVERSARIAL ATTACKS:RELIABLE ATTACKS AGAINST BLACK-BOX MACHINE LEARNING MODELS,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

DECISION-BASED ADVERSARIAL ATTACKS:RELIABLE  ATTACKS AGAINST BLACK-BOX MACHINE LEARNING MODELS(ICLR2018)

1、摘要/背景

目前用于生成对抗扰动的大多数方法要么依赖于详细的模型信息(基于梯度的攻击),要么依赖于置信度分数,例如类概率(基于分数的攻击),这两种能力在大多数现实世界场景中都不可用在许多此类情况下,人们目前需要退回到基于迁移的攻击,这些攻击依赖于繁琐的替代模型,而且需要访问训练数据并且可以防御在这里,我们强调完全依赖于最终模型决策的攻击的重要性这种基于决策的攻击是 (1) 适用于现实世界的黑盒模型,例如自动驾驶汽车(2) 需要更少的知识,并且比基于移的攻击更容易应用 (3) 对于一些简单防御来说,基于梯度或基于分数的攻击更健壮此类以前的攻击仅限于简单模型或简单数据集

主要贡献:

  • 我们强调基于决策的攻击是对抗攻击的一个重要类别,与现实世界的应用程序高度相关,并且对于衡量模型的鲁棒性很重要。
  • 我们引入了第一个有效的基于决策的攻击,可扩展到复杂的机器学习模型和自然数据集。边界攻击 (1) 在概念上非常简单;(2) 非常灵活;(3) 几乎不需要超参数调整;(4) 在目标和非目标的计算机视觉场景中,可与最佳的基于梯度的攻击媲美。
  • 我们表明边界攻击能够打破先前提出的防御方法(防御蒸馏)
  • 我们在 Clarifai.com 上提供的用于品牌和名人识别的两个黑盒机器学习模型上展示了边界攻击的实际适用性。

2、boundary attack-边界攻击

2.1 原理

 

 边界攻击算法背后的基本原理如图所示:该算法从一个已经是对抗样本点初始化,然后沿着对抗和非对抗区域之间的边界执行随机游走,使得 (1) 它停留在对抗区域并且(2)减少了与目标图像的距离换句话说,我们使用合适的提议分布 P 执行拒绝采样,以根据给定的对抗标准 c(.) 找到逐渐变小的对抗扰动

输入:原始图片+对抗扰动准则,模型的决策

输出:满足条件最小的对抗样本

  • 选择一个对抗样本作为初始点(start from a point that is already adversarial);这里有个问题,初始的对抗样本如何获得?需不需要满足对抗样本的两个特征?人眼不可察觉和机器识别错误
  • 然后进行随机游走(random walk),一方面要使得图片仍然是对抗样本;另一方面和原始图片的距离不能太远

 以下是伪代码:

 o指代原始输入(即一张图片)

y=F(o)指代模型F ( ⋅ ) 的全部输出(即logits或probabilities)

ymax​指代预测的标签(即类别标签)

\bar{o}指代对抗扰动后的图片,\bar{o}^{k}指代攻击算法第k kk步处理过的扰动图片

2.2 初始化

如何选择初始点——这个问题其实论文中没有很清楚,边界攻击需要用一个已经是对抗的样本进行初始化

  • 非目标攻击中,我们只是从给定输入的有效域 (如图片,则为[0,255]) 的最大熵分布中采样
  • 在目标场景中,我们从模型分类为目标类的任何样本开始。

  • CV中,因为图片约束在[0,255],因此直接从[0,255]中均匀抽样得到初始点。(拒绝不是对抗样本的图片)

2.3 Proposal distribution

算法的效率关键取决于提议分布 P,即在算法的每个步骤中如何选择游走方向。最佳提议分布通常取决于要攻击的域模型,但对于此处测试的所有与视觉相关的问题,一个非常简单的提议分布效果出奇地好该提议分布背后的基本思想如下:在第 k 步中,我们希望从受以下约束的最大熵分布中绘制扰动 ηk

1、扰动样本在输入域内:

 2、扰动的相对大小为:

 3、扰动将扰动图像与原始输入的距离减少了一个相对量 ϵ

 边界攻击只有两个相关参数:总扰动的长度 δ 和朝原始输入的步长 ϵ 。根据边界的局部几何形状动态调整这两个参数调整的灵感来自 Trust Region 方法。

2.4 Comparison with other attacks

 后面一些实验结果不贴了...........太多了

3、总结

 我们还介绍了该类别中第一个适用于通用机器学习算法和复杂自然数据集的有效攻击:边界攻击。边界攻击的核心是使用非常简单的拒绝采样算法结合简单的提议分布和受信任区域方法启发的动态步长调整来使其遵循对抗样本和非对抗样本之间的决策边界它的基本操作原理从一个大的扰动开始,然后依次减少基本上颠倒了以前所有对抗攻击的逻辑除了令人惊讶的简单之外,边界攻击在可能的对抗标准方面也非常灵活,并且在最小扰动的大小方面与标准计算机视觉任务的基于梯度的攻击相当。

这篇关于论文那些事—DECISION-BASED ADVERSARIAL ATTACKS:RELIABLE ATTACKS AGAINST BLACK-BOX MACHINE LEARNING MODELS的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/328334

相关文章

Deep Learning复习笔记0

Key Concept: Embedding: learned dense, continuous, low-dimensional representations of object 【将难以表示的对象(如图片,文本等)用连续的低维度的方式表示】 RNN: Recurrent Neural Network -> for processing sequential data (time se

Retrieval-Augmented Generation for Large Language Models A Survey

Retrieval-Augmented Generation for Large Language Models: A Survey 文献综述 文章目录 Retrieval-Augmented Generation for Large Language Models: A Survey 文献综述 Abstract背景介绍 RAG概述原始RAG先进RAG预检索过程后检索过程 模块化RAGMo

康奈尔大学之论文审稿模型Reviewer2及我司七月对其的实现(含PeerRead)

前言 自从我司于23年7月开始涉足论文审稿领域之后「截止到24年6月份,我司的七月论文审稿GPT已经迭代到了第五版,详见此文的8.1 七月论文审稿GPT(从第1版到第5版)」,在业界的影响力越来越大,所以身边朋友如发现业界有相似的工作,一般都会第一时间发给我,比如本部分要介绍的康奈尔大学的reviewer2 当然,我自己也会各种看类似工作的论文,毕竟同行之间的工作一定会互相借鉴的,我们会学他们

让IE8支持CSS3属性(border-radius、box-shadow、linear-gradient)

下载 PIE-1.0.0.zip解压后,将文件夹重命名为PIE,放到项目目录下在CSS3文件中添加一行代码 behavior: url(PIE/PIE.htc); 例如: .form__input{border-radius: 0.3em;behavior: url(PIE/PIE.htc);} 参考: TYStudio-专注WEB前端开发 css3pie

【论文精读】分类扩散模型:重振密度比估计(Revitalizing Density Ratio Estimation)

文章目录 一、文章概览(一)问题的提出(二)文章工作 二、理论背景(一)密度比估计DRE(二)去噪扩散模型 三、方法(一)推导分类和去噪之间的关系(二)组合训练方法(三)一步精确的似然计算 四、实验(一)使用两种损失对于实现最佳分类器的重要性(二)去噪结果、图像质量和负对数似然 论文:Classification Diffusion Models: Revitalizing

【python】python葡萄酒国家分布情况数据分析pyecharts可视化(源码+数据集+论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C++/Python语言 👉公众号👈:测试开发自动化【获取源码+商业合作】 👉荣__誉👈:阿里云博客专家博主、51CTO技术博主 👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。 python葡萄酒国家分布情况数据分析pyecharts可视化(源码+数据集+论文)【独一无二】 目录 python葡

论文阅读--Efficient Hybrid Zoom using Camera Fusion on Mobile Phones

这是谷歌影像团队 2023 年发表在 Siggraph Asia 上的一篇文章,主要介绍的是利用多摄融合的思路进行变焦。 单反相机因为卓越的硬件性能,可以非常方便的实现光学变焦。不过目前的智能手机,受制于物理空间的限制,还不能做到像单反一样的光学变焦。目前主流的智能手机,都是采用多摄的设计,一般来说一个主摄搭配一个长焦,为了实现主摄与长焦之间的变焦,目前都是采用数字变焦的方式,数字变焦相比于光学

使用AGG里面的clip_box函数裁剪画布, 绘制裁剪后的图形

// 矩形裁剪图片, 透明void agg_testImageClipbox_rgba32(unsigned char* buffer, unsigned int width, unsigned int height){// ========= 创建渲染缓冲区 =========agg::rendering_buffer rbuf;// BMP是上下倒置的,为了和GDI习惯相同,最后一个参数是

【LLM之KG】CoK论文阅读笔记

研究背景 大规模语言模型(LLMs)在许多自然语言处理(NLP)任务中取得了显著进展,特别是在零样本/少样本学习(In-Context Learning, ICL)方面。ICL不需要更新模型参数,只需利用几个标注示例就可以生成预测。然而,现有的ICL和链式思维(Chain-of-Thought, CoT)方法在复杂推理任务上仍存在生成的推理链常常伴随错误的问题,导致不真实和不可靠的推理结果。

【python】python基于akshare企业财务数据对比分析可视化(源码+数据集+论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C++/Python语言 👉公众号👈:测试开发自动化【获取源码+商业合作】 👉荣__誉👈:阿里云博客专家博主、51CTO技术博主 👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。 系列文章目录 目录 系列文章目录一、设计要求二、设计思路三、可视化分析 一、设计要求 选取中铁和贵州茅