图像处理与视觉感知复习--图像特征描述图像生成

2024-06-17 15:36

本文主要是介绍图像处理与视觉感知复习--图像特征描述图像生成,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 角点(关键点)的特点
  • 图像分类的流程
  • 梯度方向直方图(HOG)流程
  • 平移、旋转和尺度特征(SIFT)流程
  • 常用的图像生成模型
  • GAN的原理
  • Diffusion Model的原理
  • mAP计算方法

角点(关键点)的特点

  • 紧致&高效:关键点数目比像素少很多
  • 显著性:关键点是独特的、有特色的
  • 局部特性:关键点占据图像的相对较小区域;对杂波和遮挡具有鲁棒性
  • 重复性/再现性:无论几何或光学变换,同一关键点都能被检测到

图像分类的流程

在这里插入图片描述

梯度方向直方图(HOG)流程

在这里插入图片描述

平移、旋转和尺度特征(SIFT)流程

核心步骤:将一幅图像映射(变换)为一个局部特征向量集;特征向量具有平移、缩放、旋转不变性,同时对光照变化、仿射及投影变换也有一定不变性。

在这里插入图片描述
关键点定义:在不同尺度空间的图像下,检测出的具有方向信息的局部极值点。根据归纳我们可以看出特征点具有三个特征:尺度、方向、大小

关键点检测:

  • 尺度空间极值检测
  • 关键点定位
  • 确定关键点方向

关键点描述:

  1. 确定计算描述子所需的图像区域
  2. 将坐标移至关键点主方向,进行坐标旋转,以实现旋转不变性
  3. 在图像半径区域内,对每个像素点求其梯度幅值和方向,梯度幅值乘以高斯权重参数,生成方向直方图。
  4. 在窗口宽度为 2 × 2 2 \times 2 2×2的区域内计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点
  5. 描述子向量元素门限及门限化后的描述子向量规范化。

关键点匹配:
可以采用穷举法完成。一般都采用一种kd树的数据结构来完成搜索。

常用的图像生成模型

  • 变分自编码器(VAE)
  • 扩散模型(Diffusion Model)
  • 生成对抗网络(Generative Adversarial Network, GAN)

GAN的原理

GAN的训练过程如下:

  • 训练鉴别器
    1. 从训练集中随机抽取真实样本x
    2. 获取一个新的随机噪声向量,并使用生成器生成一个伪造实例 x f x_f xf
    3. 使用鉴别器x和 x f x_f xf进行分类
    4. 计算分类误差并方向传播总误差,以更新鉴别器的可训练参数,将分类误差降至最低
  • 训练生成器
    1. 获得一个新的随机噪声向量z,并使用生成器生成一个伪造示例 x f x_f xf
    2. 使用鉴别器对 x f x_f xf进行分类
    3. 计算分类误差并反向传播该误差,以更新生成器的可训练参数,使鉴别器误差最大化
  • 结束
    平衡状态:
    1. 生成器生成的伪造示例与训练数据集中的真实示例没有区别
    2. 鉴别器只能依靠随机猜测来确定一个特定示例是真实还是伪造的(以1:1的比例猜测一个示例是真实的)

Diffusion Model的原理

扩散模型受扩散原理的启发,扩散模型的工作原理是通过添加高斯噪声(这个步骤是Forward diffusion process)来破坏训练数据,然后学习如何通过逐步反转该添加噪声的过程(这个步骤是reverse process)来恢复原始信息。经过训练,这些模型可以通过充满噪声的图片预测noise、减去 noise然后生成新图片。模型通过最大似然化估计进行训练,目标是学习如何从任意噪声水平的数据恢复到真实数据,在训练完成后,数据生成从标准高斯噪声开始,逐步应用学到的逆变换,通过去噪声步骤逐步生成最终的数据样本。

mAP计算方法

重新定义 T P , F P , T N , F N TP, FP, TN, FN TP,FP,TN,FN

  • T P TP TP: 有预测的边界框与给定类的目标边界框的 I O U > 0.5 IOU > 0.5 IOU>0.5
  • F P FP FP: 有预测的边界框与给定的目标边界框的 I O U < 0.5 IOU < 0.5 IOU<0.5
  • F N FN FN: 对于目标边界框没有预测的边界框

在这里插入图片描述

  • 准确率:衡量的是预测为正的结果中,实际正确的比例
    P r e c i s i o n = T P T P + F P Precision = \dfrac{TP}{TP + FP} Precision=TP+FPTP

  • 召回率:测量正确预测的实际正例的比例
    R e c a l l = T P T P + F N Recall = \dfrac{TP}{TP + FN} Recall=TP+FNTP

  • 平均精度(Average Precision, AP)衡量了模型对正样本的预测准确性,通过不同的召回率下计算并平均精确率来得到,(绘制PR图,下面的面积)形成一个曲线下的面积,较高AP值意味着模型具有更好的检测性能,而AP = 1表示模型的检测是完美的

这篇关于图像处理与视觉感知复习--图像特征描述图像生成的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1069836

相关文章

使用Python实现图像LBP特征提取的操作方法

《使用Python实现图像LBP特征提取的操作方法》LBP特征叫做局部二值模式,常用于纹理特征提取,并在纹理分类中具有较强的区分能力,本文给大家介绍了如何使用Python实现图像LBP特征提取的操作方... 目录一、LBP特征介绍二、LBP特征描述三、一些改进版本的LBP1.圆形LBP算子2.旋转不变的LB

IDEA自动生成注释模板的配置教程

《IDEA自动生成注释模板的配置教程》本文介绍了如何在IntelliJIDEA中配置类和方法的注释模板,包括自动生成项目名称、包名、日期和时间等内容,以及如何定制参数和返回值的注释格式,需要的朋友可以... 目录项目场景配置方法类注释模板定义类开头的注释步骤类注释效果方法注释模板定义方法开头的注释步骤方法注

Python如何自动生成环境依赖包requirements

《Python如何自动生成环境依赖包requirements》:本文主要介绍Python如何自动生成环境依赖包requirements问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录生成当前 python 环境 安装的所有依赖包1、命令2、常见问题只生成当前 项目 的所有依赖包1、

OpenCV图像形态学的实现

《OpenCV图像形态学的实现》本文主要介绍了OpenCV图像形态学的实现,包括腐蚀、膨胀、开运算、闭运算、梯度运算、顶帽运算和黑帽运算,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起... 目录一、图像形态学简介二、腐蚀(Erosion)1. 原理2. OpenCV 实现三、膨胀China编程(

MySQL中动态生成SQL语句去掉所有字段的空格的操作方法

《MySQL中动态生成SQL语句去掉所有字段的空格的操作方法》在数据库管理过程中,我们常常会遇到需要对表中字段进行清洗和整理的情况,本文将详细介绍如何在MySQL中动态生成SQL语句来去掉所有字段的空... 目录在mysql中动态生成SQL语句去掉所有字段的空格准备工作原理分析动态生成SQL语句在MySQL

Java利用docx4j+Freemarker生成word文档

《Java利用docx4j+Freemarker生成word文档》这篇文章主要为大家详细介绍了Java如何利用docx4j+Freemarker生成word文档,文中的示例代码讲解详细,感兴趣的小伙伴... 目录技术方案maven依赖创建模板文件实现代码技术方案Java 1.8 + docx4j + Fr

Java编译生成多个.class文件的原理和作用

《Java编译生成多个.class文件的原理和作用》作为一名经验丰富的开发者,在Java项目中执行编译后,可能会发现一个.java源文件有时会产生多个.class文件,从技术实现层面详细剖析这一现象... 目录一、内部类机制与.class文件生成成员内部类(常规内部类)局部内部类(方法内部类)匿名内部类二、

使用Jackson进行JSON生成与解析的新手指南

《使用Jackson进行JSON生成与解析的新手指南》这篇文章主要为大家详细介绍了如何使用Jackson进行JSON生成与解析处理,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 核心依赖2. 基础用法2.1 对象转 jsON(序列化)2.2 JSON 转对象(反序列化)3.

opencv图像处理之指纹验证的实现

《opencv图像处理之指纹验证的实现》本文主要介绍了opencv图像处理之指纹验证的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录一、简介二、具体案例实现1. 图像显示函数2. 指纹验证函数3. 主函数4、运行结果三、总结一、

java中使用POI生成Excel并导出过程

《java中使用POI生成Excel并导出过程》:本文主要介绍java中使用POI生成Excel并导出过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录需求说明及实现方式需求完成通用代码版本1版本2结果展示type参数为atype参数为b总结注:本文章中代码均为