CVPR 2023 | 多样性可测量异常检测(DMAD)

2023-10-31 10:30

本文主要是介绍CVPR 2023 | 多样性可测量异常检测(DMAD),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

来源:投稿 作者:橡皮
编辑:学姐

[Paper] https://arxiv.org/pdf/2303.05047.pdf

[Code] https://github.com/FlappyPeggy/DMAD

0.背景:

视觉异常检测是计算机视觉领域的一个基础和重要问题,在视频监控和工业检测中有着广泛的应用。它的目的是从可见类中检测异常值,从看不见类中检测新模式。这项任务非常具有挑战性,因为异常数据分布多样,收集成本高昂。因此,我们必须在无监督环境下仅基于正常样本构建模型,目标是正常样本和异常样本之间的高度区分。

然而,基于重建的异常检测方法的性能长期以来一直受到一个棘手问题的限制,即重建多样的正常和检测未知异常之间的权衡。

解决上述权衡问题的关键是找到正常和异常样本所具有的多样性的适当测量值,这与异常的严重程度呈正相关。有了这样的测量,我们不需要对抗正常的不完美重建或异常的非期望重建,因为通过多样性测量和重建误差可以更准确地检测异常。

注意,逐像素重建误差不是多样性的理想测量,因为高误差区域经常将异常与不同的法线混淆,例如具有结构变形的法线和具有接近背景的颜色的异常可能产生不可靠的重建误差。

1.主要贡献:

引入了多样性可测量异常检测框架,该框架允许基于重建的模型在重建不同正常和检测未知异常之间实现更好的权衡。

提出了金字塔变形模块来实现多样性测量,其中变形信息被明确地从紧凑类原型中分离出来,并且由此产生的多样性测量与异常呈正相关。

提出的方法优于以前在视频异常检测和工业缺陷检测方面的工作,在受污染的数据和异常法线面前工作良好,证明了其广泛的适用性和稳健性。

2.网络介绍: PDM/PPDM

两个版本的多样性可测量异常检测框架。多尺度金字塔变形场估计为 O ,反向过程为O^T

a) PDM版本计算重建后的正向变形 O。

b) PPDM版本采用循环一致的前后变形,并且向前变形应用于输入。

3.1方法细节:框架

在本节中,首先分析了基于重建的异常检测的目标,并提出了一个多样性可测量的框架来解决现有工作中的权衡问题。然后,介绍了信息压缩模块和金字塔变形模块(PDM)作为该框架的实现。最后,解释了训练和推理过程,以及如何将该框架应用于PDM变体的缺陷检测。

给定输入 x,基于自动编码器的方法旨在通过最小化以下重建损失来对正态数据分布进行建模(‖·‖_2 只是重建损失的一种类型):

关于编码器f(·)、解码器g(·),潜在变量z(在这些情况下指离散存储器项)和与其约束R_1 (φ)相对应的约束特征映射函数φ(·)。引入跳过连接和级联[·, ·]来生成不同的正常模式:

然而,由于数据分布的多样性,以前的方法不得不面临表示不同正常和检测异常之间的冲突。其内在原因在于分集[·, f(x)]的编码包含无法精确测量的冗余信息。

3.1方法细节:DMAD

我们提出了一个原则性框架,即多样性可测量异常检测(DMAD),以缓解冲突。其基本思想是在测量和建模剩余部分的多样性的同时,限制传输到g(·)的异常信息。为此,我们在DMAD框架下设计了信息压缩模块φ(·)和多样性感知模块ψ(·):

其中 ◦ 指聚合运算符。通过适当设计φ(·)、ψ(·)和约束条件,优化重建损失可以提高特征嵌入的紧凑性。从而通过φ(·)将不同的表示映射到存储器中的紧凑原型。输入x相对于其重构的多样性由ψ(·)表示。

低估的重建误差可以通过以ψ(·)为单位测量的多样性来补偿,这是有助于准确异常评分的关键因素。

该框架可以在满足以下条件(下图)的前提下实现我们的目标:

  1. Ψ(·)可以学习从原型模式到任何正常输入的所有不同信息,以确保正常样本不会产生高异常分数;

  2. ψ(·)产生的形变与多样性测度呈正相关;

  3. 关于ψ(·)表示的 x 的原型信息需要最小化。在下面的小节中,我们将解释如何设计满足这些条件的模块。

3.2方法细节:Information compression module 信息压缩模块

具有低信息容量的 Skip-connection 也可以进一步提高重建质量,而不会带来过度的泛化(即,对于折减因子为16或更大的中间特征,具有停止梯度算子的Conv层)。

3.3方法细节: Pyramid deformation module 金字塔变形模块

我们将未知异常分为以下三种类型:不可见类(如新物体)、全局异常(如意外移动)和局部异常(如奇怪行为和工件损坏)。根据重建结果,不可见类很容易被检测到,但后两种类型通常与不同的正常混淆。为了将这些异常与正常异常区分开来,使用重建的参考和原始输入之间的可测量变形来表示差异,从而在正常情况下发生轻微变形,而在异常情况下发生剧烈变形。

受STN和DCN的启发,引入了金字塔变形模块(PDM),该模块以层次尺度显式学习变形场,以对不同异常类型的运动、行为和缺陷进行建模。具体而言,在特征提取后,ψ(·)使用K个head来计算偏移O={O_1,··,O_k},对应于K个粗到细变形:

其中 ◦ 是网格采样函数,在此实现中具有参考坐标。然而,最小化关于ψ(x)的无约束重建损失可能会导致编码器f(·)的退化解。为了解决这个问题,我们添加了通过梯度运算使用平滑度损失和强度损失的约束,如下所示:

3.4方法细节: Foreground-background selection 前景背景选择

将背景信息存储在内存中会打破嵌入的紧凑性,并需要大量的内存项。此外,变形估计不应应用于背景。一些方法使用外部估计器来去除背景干扰,但不能保证在不同场景下的泛化,并且不可避免地会引入额外的噪声。得益于固定视图视频的强大先验,我们使用可学习模板x_{bg}对背景进行建模,并生成二进制掩码,以指示像素是属于前景还是属于f_m (·)的背景。第k个头的最终重建为:

3.5方法细节: Training and inference 训练和推理

训练阶段。一旦我们获得了重建的\hat{x}_k,我们就可以将重建损失L_{rec}计算为:

最后,通过最大限度地减少总体损失来进行训练:

推理阶段。在推理阶段,我们使用O和重建损失来计算输入样本x的误差映射:

基于局部最大值计算图像级异常分数:

其中⊗是卷积算子,k*是异常映射的卷积内核。α是一个权衡参数。也就是说,重建损失和变形共同决定了异常分数,这比传统的基于重建的方法要有效得多。

实验结果:

关注下方《学姐带你玩AI》🚀🚀🚀

回复“CVPR”免费领取500+篇顶会论文合集

码字不易,欢迎大家点赞评论收藏!

这篇关于CVPR 2023 | 多样性可测量异常检测(DMAD)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/314720

相关文章

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

CSP 2023 提高级第一轮 CSP-S 2023初试题 完善程序第二题解析 未完

一、题目阅读 (最大值之和)给定整数序列 a0,⋯,an−1,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105 和 1≤ai≤108。 一个序列的非空连续子序列可以用两个下标 ll 和 rr(其中0≤l≤r<n0≤l≤r<n)表示,对应的序列为 al,al+1,⋯,ar​。两个非空连续子序列不同,当且仅当下标不同。 例如,当原序列为 [1,2,1,2] 时,要计算子序列 [

Thymeleaf:生成静态文件及异常处理java.lang.NoClassDefFoundError: ognl/PropertyAccessor

我们需要引入包: <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-thymeleaf</artifactId></dependency><dependency><groupId>org.springframework</groupId><artifactId>sp

深入理解数据库的 4NF:多值依赖与消除数据异常

在数据库设计中, "范式" 是一个常常被提到的重要概念。许多初学者在学习数据库设计时,经常听到第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及 BCNF(Boyce-Codd范式)。这些范式都旨在通过消除数据冗余和异常来优化数据库结构。然而,当我们谈到 4NF(第四范式)时,事情变得更加复杂。本文将带你深入了解 多值依赖 和 4NF,帮助你在数据库设计中消除更高级别的异常。 什么是

消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法

消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法   消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法 [转载]原地址:http://blog.csdn.net/x605940745/article/details/17911115 消除SDK更新时的“

JVM 常见异常及内存诊断

栈内存溢出 栈内存大小设置:-Xss size 默认除了window以外的所有操作系统默认情况大小为 1MB,window 的默认大小依赖于虚拟机内存。 栈帧过多导致栈内存溢出 下述示例代码,由于递归深度没有限制且没有设置出口,每次方法的调用都会产生一个栈帧导致了创建的栈帧过多,而导致内存溢出(StackOverflowError)。 示例代码: 运行结果: 栈帧过大导致栈内存