Visual Salience

2023-10-07 02:10
文章标签 visual salience

本文主要是介绍Visual Salience,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Introduction

比较早的时候注意到人眼在察觉某些物体时,比起单纯的CV扫描更高效,而且似乎使用的方式也有本质的却别。比如人眼工作(进行视觉感知时)的时候并不知道要关注的物体是什么。一个例子是,你在空旷的草地上散步,同时在考虑某件事情,但你会突然注意到右手方出现的背包。虽然知道这回事,但怎样做还是一个问题,当时想的主要还是依靠统计方法进行区域比较,也就大致想想。正当暴力计算大行其道的时代,在感叹带有浪漫色彩的各家经典被打入冷宫时,也不得不跟着大旗跑,以至于后面开始CNN了还想用CNN来做类似的功能。

Method And Implementation

Proposal

前段时间因为某些原因,开始了一段visual salience 的路程,了解之后才想起之前的一些想法。Visual saliency estimation by nonlinearly integrating features using region covariances 是随意找的一个例子(主要是考虑到有code可以参考)。从中可以看到该方法的一些范式。

Visual Salience Model

  1. 从原始图像计算一些指定的特征。说起来有些抽象,例子化就是,(paper中)每个pixel处得到一个向量: \([ L~a~b~x~y~\frac{\partial }{\partial x}I~\frac{\partial }{\partial y}I]^T\),这便是文中“指定的特征”。
  2. 统计特征计算。经典的统计特征一般都归于一阶、二阶矩的计算(一些ICA把三阶括进去了)。特征没什么可变的,主要是策略。文中使用的策略,是将整个图进行划分,每个block包含固定数量的pixel,然后进行统计,获得均值和协方差。
  3. 距离度量。这也是经典方法(pattern recognition而言)的核心。文中开发了两种metric。第一个是关于特征向量的方式,另一个是矩阵分解的方式。
  4. 区域比较。 距离度量的目的在于将各区域的绝对特征计算出来,然后剩下的就是得到相对区别,这是“显著性”的表现。

另外,在文中,金字塔范式也被嵌进去了,用以处理多尺度的问题,不必多言。

Programing And Discussion

code是Matlab版的,后面用julia进行了一个实现。
输入图片
fig.1 输入图片
julia
fig.2 julia实现
mat-conv+center
fig.3 源程序结果

结果跑出来和文章的程序对比看起来很大。但仔细查看原文的输出,很明显,对于只有中部区域亮色,其他区域几乎没有噪声的情况多少给人一种不相信的感官;并且还有一处特别的地方是亮色区域是连续的。这些结果从上述的原理上几乎看不出支持。主要的原因还是一些trick,分别是center biassmooth convolution。记得好像试了下,拿掉这两项,出来的结果就和fig.2接近了。

Closure

这篇文字拉了一个多星期,今天下午收个尾。
要说什么感受最深,还是那些遍布的tricks,原理上确实就是以前想象的依靠统计方法进行些比较,但即使给出了那几个步骤,自己的实现仍然不会达到文中给出的效果(比如让自己在此基础上做出那种效果然后拿去投稿)。单是计算速度上自己写的julia程序就没跑过Mathworks版(高阶统计量的重复快速计算又是一个trick),预处理的时候引入些噪声的trick也是防不胜防。
看到这些,很自然地就往现在的深度调参去想,深度黑箱听起来被调参黑了,但那个地方没有trick呢,经典的方法里面显然也有,除了machine learning以外,其他的纯programing行业我想会更多的trick,初高中(或者大学)数学里面也是诸多trick分布(哪个行业都有)。trick代表的是某种理论算不上,写书上又怕被人被奉为圭臬的东西,或许正是人还不能被取代的一个原因。
一下子又扯远了。就这篇文章来看,visual salient model 属于feature工程,处理的结果和人的先验认识直接联系。但这也是某种优势,使其可以处理更大范围的任务,比如下面对遥感图像,深度黑箱(我想的话)还是难以做到针对一类特定图像进行调参后可以轻松换到其他任务上。
remote imaginary
fig.4 输入图像
conv and mean
fig.5 输出

转载于:https://www.cnblogs.com/chenyliang/p/6859896.html

这篇关于Visual Salience的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/155389

相关文章

如何在Visual Studio中调试.NET源码

今天偶然在看别人代码时,发现在他的代码里使用了Any判断List<T>是否为空。 我一般的做法是先判断是否为null,再判断Count。 看了一下Count的源码如下: 1 [__DynamicallyInvokable]2 public int Count3 {4 [__DynamicallyInvokable]5 get

【Visual Studio 报错】未加载 wntdll.pdb(一种可行的解决办法)

调试程序时,会出现下面这个报错 分析原因: 出现未加载 wntdll.pdb 报错大概率是你的指针使用错误 ,比如使用野指针、越界访问、或者堆区空间释放方式错误等。 这里以 堆区空间释放方式错误 为例子 1、堆区开辟的数组空间使用 delete 释放 // 堆区开辟的数组空间使用 delete 释放int* p = new int[10];delete p; 正

查看Excel 中的 Visual Basic 代码,要先设置excel选项

1. excel VB的简单介绍 百度安全验证 2.excel选项设置 excel表格中在选项->自定义功能区域,选择开发工具,visual baisc/查看代码,即可看到代码。 3.excel已经设置,可以直接查看

[VC] Visual Studio中读写权限冲突

前置场景: 编译没有报错,但是运行提示 内存异常: 情景1: 如下代码运行异常,提示引发了异常:写入权限冲突。*** 是 0xFFFFF..... char* str = (char*)malloc(10);str[0] = 0x30;  解决方案:要包含头文件<stdlib.h>  情景2: 在FileA文件调用FileB文件的函数,但是在FileA中却没有声明该B函数的原型

解决Visual C++ 中相互包含头文件的问题

在编MFC应用程序时,经常会遇到头文件相互包含的问题,很是苦恼,于是便求助于强大的CSDN,得到如下答案:   方法一:利用友元类   我一共有两个类,由于要在两个类的头文件里互相应用对方,所以,在每一个类的头文件里面现包含另一个类的头文件,然后在该类的定义中声明另一个类为友元类。如下:    #include "B.h"      class CA: public CDialog

如何简单而优雅地升级Visual NMP中的PHP版本

需求:自己想测试下不同版本的PHP性能,就想升级下 Visual 这个集成环境中PHP的版本 网上: 升级PHP到5.6.11  1、下载新的nts版的PHP并解压缩到bin\PHP下,保留原文件夹的名称; 2、将旧版PHP文件夹下的PHP.ini复制到新版的PHP文件夹下;修改复制的PHP.ini,将旧版PHP文件夹信息替换成新版PHP文件夹信息; 3、下载php_xdebug-2.3

应用Visual Studio Profiler分析CPU使用情况

使用Visual Studio Profiler分析CPU使用情况‌的步骤如下: 1.‌启动CPU分析:‌ 在Visual Studio中打开你要分析的项目。 在菜单栏中选择Debug > Performance Profiler,或者使用快捷键Alt + F2。 在性能分析工具窗口中,选择CPU Usage选项,这将帮助你分析应用程序的CPU使用情况。 2.‌运行CPU

已解决:Visual studio2022突然只能打字不能使用回车键、退格键

本问题已得到解决,请看以下小结: 关于《VS2022部分按键失灵》的解决方案 记录备注报错时间2024年报错版本VS2022报错复现写代码,点击删除键失灵了报错描述点击关闭提示如下: Microsoft visual studio 已检测到某个操作正在阻止用户输入。这可能是由活动模式对话框或需要阻止用户交互的任务所致。是否仍要关闭?报错截图-报错原因不详解决步骤 1.VS2022搜索键盘,点击

Show,Attend and Tell: Neural Image Caption Generation with Visual Attention

简单的翻译阅读了一下 Abstract 受机器翻译和对象检测领域最新工作的启发,我们引入了一种基于注意力的模型,该模型可以自动学习描述图像的内容。我们描述了如何使用标准的反向传播技术,以确定性的方式训练模型,并通过最大化变分下界随机地训练模型。我们还通过可视化展示了模型如何能够自动学习将注视固定在显着对象上,同时在输出序列中生成相应的单词。我们通过三个基准数据集(Flickr9k,Flickr

Journal of Visual Communication and Image Representation (JVCI)投稿经验分享

网站:Journal of Visual Communication and Image Representation | ScienceDirect.com by Elsevier 影响因子:2.678 CiteScore:4.9 SCI:三区          今年3月份,开始向 Journal of Visual Communication and Image Representa