【计算机视觉】Lecture 14:参数估计

2024-05-11 07:58

本文主要是介绍【计算机视觉】Lecture 14:参数估计,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

总结:变换

在这里插入图片描述

参数估计

我们将会讨论以下方面的参数估计:

  1. 几何模型(如直线、平面、曲面)
  2. 几何变换(我们讨论过的任何参数化变换)

最小二乘法是解决这两个问题的通用策略!

参数估计:拟合几何模型

总体思路:

  1. 希望使模型适合原始图像特征(数据):特征可以是点,边缘,甚至区域
  2. 参数化模型:模型例子是Rn的一个元素,也就是模型实例 = (a1, a2,…,an)
  3. 定义一个误差函数E(模型i,数据),该函数测量给定模型实例对数据的描述程度(好坏)
  4. 求解最小化E的模型实例

示例:直线拟合

总体思路:
1. 希望使模型适合原始图像特征(数据):特征可以是点,边缘,甚至区域
2. 参数化模型:模型例子是Rn的一个元素,也就是模型实例 = (a1, a2,…,an)
3. 定义一个误差函数E(模型i,数据),该函数测量给定模型实例对数据的描述程度(好坏)
4. 求解最小化E的模型实例

点特征数据(第一步)

点特征 = {(xi, yi) | i = 1,…,n}

在这里插入图片描述

示例:直线拟合

总体思路:

  1. 希望使模型适合原始图像特征(数据):特征可以使点,边缘,甚至区域
    2. 参数化模型:模型例子是Rn的一个元素,也就是模型实例 = (a1, a2,…,an)
  2. 定义一个误差函数E(模型i,数据),该函数测量给定模型实例对数据的描述程度(好坏)
  3. 求解最小化E的模型实例

直线参数化(第二步)

在这里插入图片描述

b横穿y轴

模型实例 = (m, b)

在这里插入图片描述

示例:直线拟合

总体思路:

  1. 希望使模型适合原始图像特征(数据):特征可以使点,边缘,甚至区域
  2. 参数化模型:模型例子是Rn的一个元素,也就是模型实例 = (a1, a2,…,an)
    2. 定义一个误差函数E(模型i,数据),该函数测量给定模型实例对数据的描述程度(好坏)
  3. 求解最小化E的模型实例

最小二乘法(第三步)

最小二乘只是众多误差函数中的一种

  1. 给定直线(m, b)
  2. 点(xi,yi)到直线的距离是垂直距离

在这里插入图片描述
在这里插入图片描述

  1. E是所有点的平方距离之和

在这里插入图片描述

示例:直线拟合

总体思路:

  1. 希望使模型适合原始图像特征(数据):特征可以使点,边缘,甚至区域
  2. 参数化模型:模型例子是Rn的一个元素,也就是模型实例 = (a1, a2,…,an)
  3. 定义一个误差函数E(模型i,数据),该函数测量给定模型实例对数据的描述程度(好坏)
    3. 求解最小化E的模型实例

求极值的微积分(第四步)

  1. 分别求 E 关于 m 和 b 的一阶导数
  2. 将方程设为零

在这里插入图片描述

  1. 求解 m 和 b (线性回归的等价性)

最小二乘解

在这里插入图片描述

参数化问题

我们的参数化有一个问题,即(m,b)对于垂直线是未定义的

更一般的直线参数化是下面这样的

在这里插入图片描述

在这里插入图片描述

代数距离的最小二乘法

代数距离 :

在这里插入图片描述

误差函数求导

在这里插入图片描述

(a,b,c)是与最小特征值相关联的特征向量
(只有在没有噪声的情况下才是0,因此所有的点都准确地在一条直线上)

在这里插入图片描述

请注意,与线性回归直线(在这种情况下)有很大不同,但我们可以放心,当我们的程序看到一条垂直线时,它不会凸起!

代数最小二乘问题

注意:我没有在图上画出误差向量

那是因为我不知道怎么画…

代数距离的主要问题:很难说清楚你在最小化什么,因为代数距离是有很少物理意义的量

正交最小二乘法

最小化正交(几何)距离。

在物理上有意义,但很难推导

表示:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

垂直于直线测量的距离

正交最小二乘法

很难推导。

关键洞察:最佳的拟合直线必须会通过点集的质心!

将质心移到原点。

这就将问题简化为寻找垂直于直线的单位向量:寻找(a,b)使得 a平方 + b平方 =1

这将是点的散射矩阵的最小特征向量。

最后,解出c

正交最小二乘解

在这里插入图片描述
这个“距离”是指我们直觉上所期望的

(即到线上最近点的距离,或到线上的最小距离)

参数估计:估计变换

假设我们找到了两幅图像之间的匹配点,我们认为它们是通过一些参数化变换(例如平移;尺度欧几里德;仿射)相关联的。我们如何估计此变换的参数?

基本策略
基于对应点的最小二乘估计

两个重要(相关)问题:
多少自由度?
需要多少个对应点?

例子:平移估计

在这里插入图片描述

多少自由度?
有多少自变量?
两个

需要多少个对应点?
每个对应关系提供两个方程 (x, y)=>(x’, y’)

在这里插入图片描述

例子:平移估计

在这里插入图片描述

最小二乘估计:

最小化

在这里插入图片描述

在这里插入图片描述

尝试另一个例子

相似变换
在这里插入图片描述

在这里插入图片描述

实际问题

一旦我们估计了一个变换,我们如何(反)映射图像像素值来产生一个新的图像

映射&双线性插值

给定两个图像(坐标系)之间的变换,我们希望将一个图像“映射(warp)”到另一个图像的坐标系中。

我们将我们要映射的坐标系称为“源source”图像

我们将要映射到的坐标系称为“目标destination”图像。

映射例子

在这个例子中的变换是射影变换(一般的 3x3 矩阵,在齐次坐标系上运算)

在这里插入图片描述

正向映射

在这里插入图片描述

在源图像上的每个像素x
以H(x)的形式确定此像素的去向
为目标像素上色

正向映射问题

在这里插入图片描述

会留下空隙,这是一个比较大的问题(因为映射有放大作用)

逆向映射(没有空隙)

在这里插入图片描述

在目标图像上的每个像素x
以H-1(x)的形式确定此像素的来源
从那个地方获得颜色

插值

我们所说的“从那个地方获得颜色”是什么意思?
考虑灰度值。在(x, y)处的灰度值是什么?

在这里插入图片描述

最近的邻域:

取离中心最近的那个像素的颜色。

在这里插入图片描述

双线性插值

我们所说的“从那个地方获得颜色”是什么意思?
考虑灰度值。在(x, y)处的灰度值是什么?

在这里插入图片描述

双线性插值:加权平均

在这里插入图片描述

双线性插值,数学描述

首先,考虑线性插值

在这里插入图片描述

初始化:给定两个像素值,它们之间的某个中间点的值应该是多少?

如果接近(i,j),则灰度值应该类似于 I(i,j)

在这里插入图片描述

如果与两者距离相等,则应该为两个灰度值的平均值

在这里插入图片描述

如果接近 (i+1, j),则灰度值应该类似于 I(i+1, j)

在这里插入图片描述

线性插值

在这里插入图片描述

在这里插入图片描述

回忆:平面上直线求解

在这里插入图片描述

实例化:

在这里插入图片描述

求解:

在这里插入图片描述

双线性插值,数学描述

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

在这里插入图片描述

Matlab中的图像映射

interp2是 Matlab 内置的图像映射函数

用法: interp2(X,Y,Z,XI,YI)

在这里插入图片描述

使用Interp2的技巧

为了达到我们的目的,我们可以假设 X 和 Y 是正交的图像像素坐标

简单用法: interp2(Z,XI,YI)

在这里插入图片描述

它是如何工作的?

考虑计算R行和C列的ZI值。

在这里插入图片描述
XI 和 YI 是和 ZI 尺寸相同的两个数列
对给定行列(R, C),数值 (XI(R, C), YI(R, C)) 表示为获取的原始图像上 (X,Y) 坐标处的值
最终结果是: Z(YI(R, C), XI(R, C))

在这里插入图片描述
在这里插入图片描述

interp2 处理了双线性插值,以防 YI(R, C) 和 XI(R, C) 不是整数坐标。

interp2有可选参数来更改计算插值的方式。我们可以使用默认值,即双线性插值。

Meshgrid

使用interp2时的一个有用函数是meshgrid

在这里插入图片描述

Interp2例子

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Interp2例子

易混淆点

在这里插入图片描述
在这里插入图片描述

将坐标值除以2是将图像放大尺度2

在这里插入图片描述

在这里插入图片描述

将坐标值乘以2是将图像缩小尺度2

Interp2希望反坐标变换为所需的几何变换(它使用逆向映射)

Interp2例子

一个更复杂的例子:缩小尺度2,但围绕图像中心(128, 128),而不是(0, 0)

回忆变换矩阵级联

在这里插入图片描述

这指定了我们希望原始图像如何映射到新图像中。

在这里插入图片描述

Interp2想知道新的图像坐标如何映射回原始图像坐标。

在这里插入图片描述

在这里插入图片描述

更一般的(比如齐次坐标系中任何 3×3 变换矩阵)

在这里插入图片描述

在这里插入图片描述

这篇关于【计算机视觉】Lecture 14:参数估计的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/978948

相关文章

如何测试计算机的内存是否存在问题? 判断电脑内存故障的多种方法

《如何测试计算机的内存是否存在问题?判断电脑内存故障的多种方法》内存是电脑中非常重要的组件之一,如果内存出现故障,可能会导致电脑出现各种问题,如蓝屏、死机、程序崩溃等,如何判断内存是否出现故障呢?下... 如果你的电脑是崩溃、冻结还是不稳定,那么它的内存可能有问题。要进行检查,你可以使用Windows 11

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

计算机毕业设计 大学志愿填报系统 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点赞 👍 收藏 ⭐评论 📝 🍅 文末获取源码联系 👇🏻 精彩专栏推荐订阅 👇🏻 不然下次找不到哟~Java毕业设计项目~热门选题推荐《1000套》 目录 1.技术选型 2.开发工具 3.功能

计算机视觉工程师所需的基本技能

一、编程技能 熟练掌握编程语言 Python:在计算机视觉领域广泛应用,有丰富的库如 OpenCV、TensorFlow、PyTorch 等,方便进行算法实现和模型开发。 C++:运行效率高,适用于对性能要求严格的计算机视觉应用。 数据结构与算法 掌握常见的数据结构(如数组、链表、栈、队列、树、图等)和算法(如排序、搜索、动态规划等),能够优化代码性能,提高算法效率。 二、数学基础

java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频)

这是什么系统? 资源获取方式在最下方 java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频) 停车管理信息系统是为了提升停车场的运营效率和管理水平而设计的综合性平台。系统涵盖用户信息管理、车位管理、收费管理、违规车辆处理等多个功能模块,旨在实现对停车场资源的高效配置和实时监控。此外,系统还提供了资讯管理和统计查询功能,帮助管理者及时发布信息并进行数据分析,为停车场的科学

PMP–一、二、三模–分类–14.敏捷–技巧–看板面板与燃尽图燃起图

文章目录 技巧一模14.敏捷--方法--看板(类似卡片)1、 [单选] 根据项目的特点,项目经理建议选择一种敏捷方法,该方法限制团队成员在任何给定时间执行的任务数。此方法还允许团队提高工作过程中问题和瓶颈的可见性。项目经理建议采用以下哪种方法? 易错14.敏捷--精益、敏捷、看板(类似卡片)--敏捷、精益和看板方法共同的重点在于交付价值、尊重人、减少浪费、透明化、适应变更以及持续改善等方面。

《计算机视觉工程师养成计划》 ·数字图像处理·数字图像处理特征·概述~

1 定义         从哲学角度看:特征是从事物当中抽象出来用于区别其他类别事物的属性集合,图像特征则是从图像中抽取出来用于区别其他类别图像的属性集合。         从获取方式看:图像特征是通过对图像进行测量或借助算法计算得到的一组表达特性集合的向量。 2 认识         有些特征是视觉直观感受到的自然特征,例如亮度、边缘轮廓、纹理、色彩等。         有些特征需要通

2021-8-14 react笔记-2 创建组件 基本用法

1、目录解析 public中的index.html为入口文件 src目录中文件很乱,先整理文件夹。 新建components 放组件 新建assets放资源   ->/images      ->/css 把乱的文件放进去  修改App.js 根组件和index.js入口文件中的引入路径 2、新建组件 在components文件夹中新建[Name].js文件 //组件名首字母大写

2021-08-14 react笔记-1 安装、环境搭建、创建项目

1、环境 1、安装nodejs 2.安装react脚手架工具 //  cnpm install -g create-react-app 全局安装 2、创建项目 create-react-app [项目名称] 3、运行项目 npm strat  //cd到项目文件夹    进入这个页面  代表运行成功  4、打包 npm run build

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.