图像的相位与振幅

2023-12-25 19:58
文章标签 图像 相位 振幅

本文主要是介绍图像的相位与振幅,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:之前的一部分研究工作是提取视频中的噪声(时域上),其特征由相位(phase)与幅度(amplitude)来刻画。

相关:深入理解FT,DTFT,DFT 之间的关系、深入浅出的讲解傅里叶变换(真正的通俗易懂)

给出一张灰度图,经过傅里叶变换,可以把图片的每一个像素的像素值变成复数。由于每一个复数,都有模长和方向两个量组成,因此可以分离出幅度图和相位图。

图像的幅度图和相位图中给出了python的做法,这里给出Matlab版:

I=imread('test.bmp');%768*1024
imshow(I)I_fft=fft(I);%对图像做傅里叶变换
I0=ifft(I_fft);%对图像做逆傅里叶变换
imshow(I0/255)m1=abs(I_fft);%Magnitude 幅度图
p1=unwrap(angle(I_fft)); %Phase 相位图
imshow(m1/255)
imshow(p1/255)I1=fft2(I);%二维快速傅里叶变换 等同于计算 fft(fft(X).').'
imshow(I1/255);
Ishift_fft=fftshift(I1);
imshow(Ishift_fft)
I1=ifft(Ishift_fft);%对图像做逆傅里叶变换
imshow(I1/255)m2=abs(Ishift_fft);%Magnitude 幅度图
p2=unwrap(angle(Ishift_fft)); %Phase 相位图
imshow(m2/255)
imshow(p2/255)

这里用到了fftshift函数和fft2函数

 

“近十几年来,稀疏(sparsity)已经成为信号处理及其应用领域中处于第一位的概念之一。近来,研究人员又致力于过完备(overcomplete)信号表示的研究。这种表示不同于许多传统的表示。因为它能提供一个广阔范围的生成元素(atoms)。而冗余(redundant)信号表示的魅力正在于其能经济地(紧致)的表示一大类信号。对稀疏性的兴趣源自于新的抽样理论-压缩传感(compressed sensing)的发展,压缩传感是香农采样理论的一种替代,其利用信号本身是稀疏的这一先验,而香农理论是设计用于频率带宽有限的信号的。通过建立采样和稀疏的直接联系,压缩传感在大量的科学领域,如编码和信息论,信号和图像采集处理,医学成像,及地理和航天数据分析等都得到应用。压缩传感的另一贡献是许多传统的逆问题,如断层图像重建,可以看作压缩传感问题。这类病态(ill-posed)问题需要正则化。压缩传感对寻求系数性解的方法给出了强大的理论支持。

字典分两种,一种是隐性字典,implicit dictionary,这种主要是由它们的算法表现出来的,而不是矩阵结构,比如wavelet,curvelet,contourlet,等等。另一种是通过机器学习来从样本中获取字典,这种字典表现为一种显性矩阵,explicit matrix,而算法是用来适应矩阵的,比如PCA,GPCA,MOD,K-SVD等等,这种字典的好处在于比前一种灵活,表现也好,坏处就是耗费时间和运算资源,另外复杂的约束限制了字典的大小以及需要处理的信号的维度(所以论文提出的这个算法最后用3D图像去噪来表现优越性)。”

从而,对相位的特征用稀疏表示来刻画,涉及到:

计算机视觉-字典学习,图像分类的字典学习方法概述,从稀疏表示到低秩表示(一)(二)(三)(四)(五)

K-SVD简述——字典学习,稀疏编码

还涉及一些超分辨率重建:

基于深度学习的图像超分辨率重建技术的研究

基于深度学习的图像超分辨率重建(我们先进院汤晓鸥组的董超)

百度AI学习项目-SRCNN网络-超分辨率重建

 

接下来就需要考虑双目视点绘制虚拟视点的一些实现细节。

在从参考视点映射到虚拟视点的过程中会涉及到仿射变换与物体形状大小的畸变。

DIBR技术与合成全景图技术的区别。

 

因为可能匹配不上,所以考虑到了一些块匹配的想法:

理想状态下,双目相机拍出的两张照片left和right种,left图像中的某一个像素应当可以在right中同一行(opencv中的row)中找到该像素对应的像素,根据这两个像素的x坐标差,便可以得到图像的深度图。但是并非每一个像素都可以找到其对应像素,原因有:

(1)由于遮挡关系,left中的像素无法在right中找到

(2)由于某些处于非朗伯面(比如水面、镜面、玻璃)的点由于光照原因无法匹配

(3)密集重复纹理(树林、草地)下或纹理特别稀疏(墙面、天空)时,很难准确匹配

(4)纹理都是水平线条时(线条与极线平行),很难准确匹配

此处,鄙人给出最简单的双目匹配的实现方式,即采用块匹配的方式计算深度图。

真实场景的虚拟视点合成(View Synthsis)详解

基于块匹配的双目视差函数的实现

图像的视差匹配

立体匹配基本理论

立体匹配与视差计算

固定窗口的视差图计算双目立体视觉匹配算法之视差图disparity计算——SAD算法、SGBM算法

半全局块匹配算法 半全局匹配算法总结

这篇关于图像的相位与振幅的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/536751

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

通信工程学习:什么是2ASK/BASK二进制振幅键控

2ASK/BASK:二进制振幅键控         2ASK/BASK二进制振幅键控是一种数字调制技术,其全称是二进制振幅键控(Binary Amplitude Shift Keying)。该技术通过改变载波的振幅来传递二进制数字信息,而载波的频率和相位则保持不变。以下是关于2ASK/BASK二进制振幅键控的详细解释: 一、2ASK/BASK二进制振幅键控的基本原理 1、振幅键控:

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.

【python计算机视觉编程——8.图像内容分类】

python计算机视觉编程——8.图像内容分类 8.图像内容分类8.1 K邻近分类法(KNN)8.1.1 一个简单的二维示例8.1.2 用稠密SIFT作为图像特征8.1.3 图像分类:手势识别 8.2贝叶斯分类器用PCA降维 8.3 支持向量机8.3.2 再论手势识别 8.4 光学字符识别8.4.2 选取特征8.4.3 多类支持向量机8.4.4 提取单元格并识别字符8.4.5 图像校正

HalconDotNet中的图像特征与提取详解

文章目录 简介一、边缘特征提取二、角点特征提取三、区域特征提取四、纹理特征提取五、形状特征提取 简介   图像特征提取是图像处理中的一个重要步骤,用于从图像中提取有意义的特征,以便进行进一步的分析和处理。HalconDotNet提供了多种图像特征提取方法,每种方法都有其特定的应用场景和优缺点。 一、边缘特征提取   边缘特征提取是图像处理中最基本的特征提取方法之一,通过检

超越IP-Adapter!阿里提出UniPortrait,可通过文本定制生成高保真的单人或多人图像。

阿里提出UniPortrait,能根据用户提供的文本描述,快速生成既忠实于原图又能灵活调整的个性化人像,用户甚至可以通过简单的句子来描述多个不同的人物,而不需要一一指定每个人的位置。这种设计大大简化了用户的操作,提升了个性化生成的效率和效果。 UniPortrait以统一的方式定制单 ID 和多 ID 图像,提供高保真身份保存、广泛的面部可编辑性、自由格式的文本描述,并且无需预先确定的布局。

Winfrom中解决图像、文字模糊的方法

1.添加清单 2.将清单中的下面内容取消注释

使用亚马逊Bedrock的Stable Diffusion XL模型实现文本到图像生成:探索AI的无限创意

引言 什么是Amazon Bedrock? Amazon Bedrock是亚马逊云服务(AWS)推出的一项旗舰服务,旨在推动生成式人工智能(AI)在各行业的广泛应用。它的核心功能是提供由顶尖AI公司(如AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI以及亚马逊自身)开发的多种基础模型(Foundation Models,简称FMs)。

Matplotlib图像读取和输出及jpg、png格式对比,及透明通道alpha设置

图像像素值 图像像素值一般size为3,也就是通道数,分别代表R,G,B,如果只有单一 一个值则表示灰度值,也就是说一张二维图片,当长和宽都为1080时,那么若是灰度图像,图像尺寸为(1080,1080,1)若是RGB图像则为(1080,1080,3), jpg、png图像格式 jpg图像的灰度值范围和RGB范围为[0,255],数值类型为uint8,也就是无符号整数 png图像的灰度值范