图像算法的基础知识(双线性插值,协方差矩阵,矩阵的特征值、特征向量)

本文主要是介绍图像算法的基础知识(双线性插值,协方差矩阵,矩阵的特征值、特征向量),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

0. 前言

MATLAB或者OpenCV里有很多封装好的函数,我们可以使用一行代码直接调用并得到处理结果。然而当问到具体是怎么实现的时候,却总是一脸懵逼,答不上来。前两天参加一个算法工程师的笔试题,其中就考到了这几点,感到非常汗颜!赶紧补习!

1. 双线性插值

在图像处理中,我们有时需要改变图像的尺寸,放大或者缩小。线性插值则是这类操作的关键算法。不管是放大还是缩小操作,其实都是一个像素映射的处理。如下图从小图到大图的映射,以及从大图到小图的映射。

图像来源:https://www.cnblogs.com/sdxk/p/4056223.html

然而,这两种操作都有一定的缺点。对于把小图放大的操作,因为小图中的像素点到大图中的像素点不是满射,因此大图中的点不能完全有像素值;对于将大图缩小的操作,大图中的点逆映射为小图中的点时,得到的像素坐标值可能不是整数。一种解决办法是采用最近邻方法,即将得到的坐标值与相邻的原图像中的像素坐标值比较,取离得最近的坐标值对应的像素值作为缩放后的图像对应的坐标值的像素值,但是这种办法可能导致图像失真,因此可以采用双线性差值的办法来进行计算相应的像素值。

 

对于图中红色的四个点(Q11,Q12,Q21,Q22)为源图像中存在的点,需要求在目标图像的插值(绿色点P)的坐标对应的像素值。

首先在X轴进行插值,R1,R2是两个插值过程中过渡的点.

然后在 y 方向进行线性插值,得到:

 

这样就得到所要的结果 f \left( x, y \right),

讲一个具体的例子:

比如源图像是尺寸是(100,150),现在要缩小尺寸0.6倍,即目标图像的尺寸是(60,90),则求目标图像在坐标为P[10,4]的点的像素值怎么求呢?

假设源图像是ori_im,目标图像是tar_im,tra_im[10,4]表示在行列分别是10和4时候图像的像素值。

此时,x=10/0.6=16.67,  y=4/0.6=6.67,而x1=16,x2=17,y1=6,y2=7, (x1,y1), (x1,y2), (x2,y1), (x2,y2)是在源图像中最接近tra_im[10,4]的4个点。

tra_im[10,4]=ori_im[x1,y1]*(17-16.67)*(7-6.67)+ori_im[x2,y1]*(16.67-16)*(6.67-6)+ori_im[x2,y1]*(17-16.67)*(6.67-6)+ori_im[x2,y2]*(16.67-16)*(6.67-6)

带入4个点在源图像中对应的像素值即可得到缩小后图像的像素值。

下面我用python实现了这个双线性插值,并和python中自带的skimage函数里封装的resize进行了效果对比,感觉效果差不多。(代码可能有点冗余)

我的代码:

# -*- coding: utf-8 -*-
# Author: lmh
# Time: 2018.10.22
from skimage import transform
import matplotlib.pyplot as plt
import matplotlib.image as mping
import numpy as np
def chazhi(x,y,im):
#x,y分别是缩放或者放大后对应源图像的浮点坐标位置,im是源图像,返回目标图像根据插值计算得到的像素值x1,y1=int(x),int(y) #x1,x2,x3,x4分别是插值坐标对应在源图像上下左右最近的点的坐标x2,y2=x1+1,y1+1pixel11,pixel21,pixel12,pixel22=im[x1-1,y1-1],im[x2-1,y1-1],im[x2-1,y1-1],im[x2-1,y2-1]#以下是根据双线性插值的公式求得的目标图像的该位置的像素值new_pixel=(x2-x)*(y2-y)*pixel11+(x-x1)*(y2-y)*pixel21+(x2-x)*(y-y1)*pixel12+(x-x1)*(y-y1)*pixel22return new_pixelim=mping.imread('C:\\Users\\shou\\Desktop\\photo.png')
im11=im
scale=0.4 #缩小程度
row,col=int(im.shape[0]*scale),int(im.shape[1]*scale)
im_sml=np.zeros([row,col,3])
for k in range(3):im1 = im[:, :, k]for i in range(row):for j in range(col):value=chazhi(i/scale,j/scale,im1)#3通道图像逐像素计算缩小或者放大后的新像素值im_sml[i][j][k]=valueim_narrow=im_smlscale=1.7  #扩大程度
row, col = int(im.shape[0] * scale), int(im.shape[1] * scale)
im_sml = np.zeros([row, col, 3])
for k in range(3):im1 = im[:, :, k]for i in range(row):for j in range(col):value = chazhi(i / scale, j / scale, im1)im_sml[i][j][k] = valueim_enlarge=im_sml
python_narrow=transform.resize(im, (175, 145)) #使用skimage自带函数resize图像,也可以直接写像上面一样写比例(0.4,1.7)
python_enlarge=transform.resize(im, (746, 617))#为了对比,两种方法特意放大和缩小一样大小plt.figure()
plt.subplot(151)
plt.imshow(im11,plt.cm.gray)
plt.title('Original')
# plt.axis('off')plt.subplot(152)
plt.imshow(im_narrow,plt.cm.gray)
plt.title('my_narrow')
# plt.axis('off')plt.subplot(153)
plt.imshow(python_narrow,plt.cm.gray)
plt.title('skimage_narrow')
# plt.axis('off')plt.subplot(154)
plt.imshow(im_enlarge,plt.cm.gray)
plt.title('my_enlarge')
# plt.axis('off')plt.subplot(1,5,5)
plt.imshow(python_enlarge,plt.cm.gray)
plt.title('skimage_enlarge')
# plt.axis('off')
plt.savefig('image_comp.png')

skimage的源码:

 

 效果图对比(原图[439,363,3];缩小0.4倍后为[175,145,3];放大1.7倍后为[746,617,3])

在博客:https://www.cnblogs.com/sdxk/p/4056223.html中,博主讲根据双线性插值的定义,我们自己写的函数图像处理的结果会因为坐标系的原因,而和MATLAB,OpenCV结果的完全不同。最好的解决方法就是,两个图像的几何中心重合,并且目标图像的每个像素之间都是等间隔的,并且都和两边有一定的边距,这也是matlab和openCV的做法。并给出了以下解决方法,其中m,n 是源图像尺寸;a,b是目标函数尺寸。然而我没有这些修改,与python封装的方法也没发现太大区别。

int x=(i+0.5)*m/a-0.5

int y=(j+0.5)*n/b-0.5

代替

int x=i*m/a

int y=j*n/b

补:经过查看Skimge的resize源码,发现确实里面添加了上面所说的策略(下面的代码),那么为什么我写的双线性代码没有这样做,图像的结果确和这样做的几乎一样?更加疑惑了

# take into account that 0th pixel is at position (0.5, 0.5)
dst_corners[:, 0] = col_scale * (src_corners[:, 0] + 0.5) - 0.5
dst_corners[:, 1] = row_scale * (src_corners[:, 1] + 0.5) - 0.5

2. 协方差矩阵

 

 

 

3. 求矩阵的特征值,特征向量,以及主成分

 

 

 

这篇关于图像算法的基础知识(双线性插值,协方差矩阵,矩阵的特征值、特征向量)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/988626

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

linux-基础知识3

打包和压缩 zip 安装zip软件包 yum -y install zip unzip 压缩打包命令: zip -q -r -d -u 压缩包文件名 目录和文件名列表 -q:不显示命令执行过程-r:递归处理,打包各级子目录和文件-u:把文件增加/替换到压缩包中-d:从压缩包中删除指定的文件 解压:unzip 压缩包名 打包文件 把压缩包从服务器下载到本地 把压缩包上传到服务器(zip

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

计组基础知识

操作系统的特征 并发共享虚拟异步 操作系统的功能 1、资源分配,资源回收硬件资源 CPU、内存、硬盘、I/O设备。2、为应⽤程序提供服务操作系统将硬件资源的操作封装起来,提供相对统⼀的接⼝(系统调⽤)供开发者调⽤。3、管理应⽤程序即控制进程的⽣命周期:进程开始时的环境配置和资源分配、进程结束后的资源回收、进程调度等。4、操作系统内核的功能(1)进程调度能⼒: 管理进程、线

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费