Deep Anomaly Detection Using GeometricTransformations翻译

2024-02-07 00:32

本文主要是介绍Deep Anomaly Detection Using GeometricTransformations翻译,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

利用几何变换进行深度异常检测

Abstract
  • 针对图像中的异常检测问题,提出了一种新的检测方法。给定一个样本图像,所有已知的属于一个正常的类(例如,狗),我们展示了如何训练一个深度神经模型,可以检测出分布外的图像(例如,狗)。non-dog对象)。我们的方案背后的主要思想是训练一个多类模型来区分应用于所有给定图像的几十个几何变换。该模型学习到的辅助知识生成特征检测器,在测试时根据模型的softmax激活统计信息对转换后的图像进行有效识别异常图像。我们提出了广泛的实验使用提出的检测器,这表明我们的技术不断地改进了所有已知的算法的广泛边缘。
Introduction
  • 未来的机器学习应用,如自动驾驶汽车或家用机器人,将不可避免地遇到各种风险,包括统计上的不确定性。为了便于使用,这些应用程序应该尽可能健壮地应对此类风险。其中一个风险是由于分布差异或嘈杂的观测而暴露于统计错误或不一致。众所周知的异常/新颖性检测问题突出了其中的一些风险,其解决对于任务关键型机器学习应用程序至关重要。虽然异常检测在文献中已经被考虑了很长时间,但是在深层神经模型的背景下对这个问题的结论性理解是非常缺乏的。例如,在机器视觉应用中,我们的实验表明,现有的新奇检测方法在某些问题上表现较差。

  • 在基本异常检测问题中,我们有一个来自于某个分布的正常实例类的样本,目标是构造一个能够检测出分布异常实例[5]的分类器。这个基本异常检测问题有相当多的变体。例如,在阳性和未标记的版本中,我们得到了来自正常类的样本,以及被异常实例污染的未标记的样本。事实证明,这种污染样本变体比问题的纯版本(从可以实现更好的性能的意义上说)更简单。在本文中,我们将重点放在异常检测的基本(和更复杂的)版本上,只考虑深度模型(如卷积神经网络)必不可少的机器视觉应用。

  • 有一些工作是处理图像背景下的基本的、纯粹的样本异常检测问题。其中最成功的结果是报告的方法依赖于以下两种总体方案之一。第一个方案由分析重构中的错误的方法组成,这些方法要么基于自编码器,要么基于经过正常类训练的生成对抗模型(GANs)。在前一种情况下,重建缺陷的测试点表明异常。在此基础上,利用优化算法求出发电机的近似逆,从而估计测试实例的重构误差。第二类方法利用在普通类上训练的自动编码器来生成低维嵌入。为了识别异常,可以使用这种嵌入的经典方法,如低密度拒绝[8]或单类SVM[26,27]。该方法的一个更高级的变体使用一个适当的成本函数将这两个步骤(编码和然后检测)结合起来,该函数用于训练执行这两个过程的单个神经模型。

  • 在本文中,我们考虑一种完全不同的方法,即完全绕过重构(如自动编码器或GANs)。提出的方法是基于这样的观察:学习区分应用于普通图像的许多类型的几何变换,鼓励学习对新奇性检测有用的特征。因此,我们在一个自标记数据集上训练一个多类神经分类器,该数据集是由常规实例及其转换后的版本创建的,通过应用大量几何变换获得。在测试时,将该判别模型应用于测试实例的变换实例,并利用正常序列图像的softmax响应值的分布对新奇性进行有效的检测。我们的方法背后的直觉是,通过训练分类器来区分转换后的图像,它必须学习显著的几何特征,其中一些可能是单一类独有的。

  • 我们对所提出的方法进行了大量的实验,并将其与几种最先进的纯异常检测方法进行了比较。我们在几个图像数据集(如CIFAR-100)上使用one-vs-all模式评估性能,据我们所知,这些数据集在此之前从未考虑过。我们的结果压倒性地表明,所提出的方法比现有的最佳方法取得了显著的改进。例如,在CIFAR-10数据集(10个不同的实验)上,我们将最高执行基线AUROC平均提高了32%。在CatsVsDogs数据集中,我们将最高性能基线AUROC提高了67%。

Discriminative Learning of an Anomaly Scoring Function Using Geometric Transformations
  • 如上所述,我们的目标是以一种有区别的方式来学习评分函数nS(如第3节所述)。为此,我们使用几何变换T类,从初始训练集S创建一个自标记的图像数据集。创建的数据集(记为ST)是通过将T中的每个几何变换应用于S中的所有图像而生成的,其中我们将每个变换后的图像标记上所应用的变换的索引。该过程创建一个自标记的多类数据集(使用jT j类),其基数为jT jjSj。ST创建后,我们训练了一个多类图像分类器,其目标是对每一幅图像在T中生成变换的索引进行预测。在推理时,给定一个未知的图像x,我们首先对它应用每个变换,然后对每个jT j变换后的图像应用分类器,来判断它是否属于正常类。每个这样的应用都会产生一个大小为jT j的softmax响应向量。最终的正态性评分是使用这些向量在正常softmax向量的估计分布下的组合日志-似然值来定义的(参见下面的详细信息)。
    创建和学习自标记的数据集
Conclusion
  • 提出了一种新的图像异常检测方法,该方法对学习后的训练数据进行有意义的识别。该方法计算效率高,易于实现,是一种多类分类任务。与目前最著名的方法不同,我们的方法完全减轻了对生成组件(自动编码器/GANs)的需求。最重要的是,我们的方法通过对现有的最佳异常检测方法的显著改进,显著提高了技术水平。我们的研究结果为未来的研究开辟了许多途径。首先,开发一个基于几何变换的理论是很重要的。研究选择最适合给定训练集的转换的可能性是很有趣的,这可能需要对异常样本的先验知识。另一种方法是显式地优化转换集。由于我们的方法的有效性,很容易尝试将其应用于其他应用程序,例如开放世界场景,甚至可能使用它来改进多类分类性能。最后,尝试使用我们的技术来利用深度不确定性估计[12,11]和深度主动学习[10]将是很有趣的。

这篇关于Deep Anomaly Detection Using GeometricTransformations翻译的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/686010

相关文章

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

excel翻译软件有哪些?如何高效提翻译?

你是否曾在面对满屏的英文Excel表格时感到头疼?项目报告、数据分析、财务报表... 当这些重要的信息被语言壁垒阻挡时,效率和理解度都会大打折扣。别担心,只需3分钟,我将带你轻松解锁excel翻译成中文的秘籍。 无论是职场新人还是老手,这一技巧都将是你的得力助手,让你在信息的海洋中畅游无阻。 方法一:使用同声传译王软件 同声传译王是一款专业的翻译软件,它支持多种语言翻译,可以excel

MonoHuman: Animatable Human Neural Field from Monocular Video 翻译

MonoHuman:来自单目视频的可动画人类神经场 摘要。利用自由视图控制来动画化虚拟化身对于诸如虚拟现实和数字娱乐之类的各种应用来说是至关重要的。已有的研究试图利用神经辐射场(NeRF)的表征能力从单目视频中重建人体。最近的工作提出将变形网络移植到NeRF中,以进一步模拟人类神经场的动力学,从而动画化逼真的人类运动。然而,这种流水线要么依赖于姿态相关的表示,要么由于帧无关的优化而缺乏运动一致性

linux dlopen手册翻译

名称 dlclose, dlopen, dlmopen 打开和关闭一个共享对象 简介 #include <dlfcn.h>void *dlopen(const char*filename, int flags);int dlclose(void *handle);#define _GNU_SOURCE#include <dlfcn.h>void *dlmoopen(Lmid_t lm

时间序列|change point detection

change point detection 被称为变点检测,其基本定义是在一个序列或过程中,当某个统计特性(分布类型、分布参数)在某时间点受系统性因素而非偶然因素影响发生变化,我们就称该时间点为变点。变点识别即利用统计量或统计方法或机器学习方法将该变点位置估计出来。 Change Point Detection的类型 online 指连续观察某一随机过程,监测到变点时停止检验,不运用到

从计组中从重温C中浮点数表示及C程序翻译过程

目录 移码​编辑  传统浮点表示格式 浮点数的存储(ieee 754)->修炼内功 例子:   ​编辑 浮点数取的过程   C程序翻译过程 移码  传统浮点表示格式 浮点数的存储(ieee 754)->修炼内功 根据国际标准IEEE(电⽓和电⼦⼯程协会)  32位 例子:    64位    IEEE754对有效数字M和

HumanNeRF:Free-viewpoint Rendering of Moving People from Monocular Video 翻译

HumanNeRF:单目视频中运动人物的自由视点绘制 引言。我们介绍了一种自由视点渲染方法- HumanNeRF -它适用于一个给定的单眼视频ofa人类执行复杂的身体运动,例如,从YouTube的视频。我们的方法可以在任何帧暂停视频,并从任意新的摄像机视点或甚至针对该特定帧和身体姿势的完整360度摄像机路径渲染主体。这项任务特别具有挑战性,因为它需要合成身体的照片级真实感细节,如从输入视频中可能

Deep Ocr

1.圈出内容,文本那里要有内容.然后你保存,并'导出数据集'. 2.找出deep_ocr_recognition_training_workflow.hdev 文件.修改“DatasetFilename := 'Test.hdict'” 310行 write_deep_ocr (DeepOcrHandle, BestModelDeepOCRFilename) 3.推理test.hdev

MACS bdgdiff: Differential peak detection based on paired four bedGraph files.

参考原文地址:[http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html](http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html) 文章目录 一、MACS bdgdiff 简介DESCRIPTION 二、用法