音频筑基:一文搞懂DFT/FFT/DCT/MDCT的区别

2024-02-23 20:36

本文主要是介绍音频筑基:一文搞懂DFT/FFT/DCT/MDCT的区别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

音频筑基:一文搞懂DFT/FFT/DCT/MDCT的区别

    • 前言
    • DFT/FFT/STFT/DCT/MDCT一句话对比
    • DFT/FFT/STFT/DCT/MDCT的因果
    • 扩展资料

傅立叶变换是连接时域与频域的上帝之桥。——《漫画傅里叶解析》

前言


音频信号处理中时常用到时频域转换,这里简单总结下常用的DFT、FFT、STFT、MDCT的区别。开始前,先感谢傅里叶大哥,是他给了我们一碗饭吃。

DFT/FFT/STFT/DCT/MDCT一句话对比


  • DFT,Discrete Fourier Transform,离散傅里叶变换,完成离散点时频域转换
    • 用途:推广时频域原理,理论上保证了计算机可用性
  • FFT,Fast Fourier Transform,快速傅里叶变换,计算长时总体信号的一种快速变换方法
    • 用途:支撑理论到实际,落地傅里叶变换在计算机中大规模使用
  • STFT,Short Time Fourier Transform,短时傅里叶变换,也称加窗傅里叶变换(Windowed Fourier Transform)
    • 用途:音频特征分析
  • DCT,Discrete Cosine Transform,离散余弦变换,跟DFT相对应
    • 用途:图像压缩
  • MDCT,Modified Discrete Cosine Transform,修改型离散余弦变换,顾名思义是DCT的改进,改进点是加窗和交叠
    • 用途:音频编解码

注:以上所有方法都可用于时频域转化。

DFT/FFT/STFT/DCT/MDCT的因果


19世纪,傅里叶老哥在用三角函数表示任意函数中获得启发,打开了时频域转换的大门。换个角度看问题后,对做信号处理的打工人来说,从此复杂变简单。

有了理论上的连续函数傅里叶变换FT,为了支持离散的计算机运算处理,于是就有了离散傅里叶变换DFT

而早年间,计算机处理器能力有限,如果光实现时频域转换算法就费老大事儿了,那后面的分析算法就没得搞了。于是,为了加速傅里叶变换速度,聪明的人类又搞出来快速傅里叶变换FFT

以上问题都是针对整体信号的变换(连续或离散),接着人们在实际分析信号时,发现代价还是太大,特别是音频信号处理场景,需要流式处理,根本等不及咱变换完就开车溜了。那些脑瓜冒烟的人又想到,根据语音短时平稳性原理对信号切帧分块处理,于是就有了短时傅里叶变换STFT

到后面又有了发展,傅里叶变换本质是正余弦cos/sin正交基组合而来,N点数据进去出来2N点的数据,有一半镜像是冗余数据。在信号压缩场景中,那些脑瓜冒烟的人又想到,能不能懒一些,就用一个基来表达,比如余弦cos。于是,就有了离散余弦变换DCT,实现N点进N点出。

最后,仍是类似的剧情,DCT用于整体信号的变换不太友好,在分帧切块后通过加窗和交叠方法,于是有了改进型离散余弦变换MDCT

注:1、STFT后面每一步演变,都包含了之前成果如DFT、FFT。2、MDCT/DCT都可以拆解转换到DFT、FFT实现。3、为增强可读性,部分描述和理论有差异。

更多原理细节分析,请看下篇详解。

扩展资料


  1. 如果看了这篇文章你还不懂傅里叶变换,那就过来掐死我吧,link
  2. 感性认识FFT傅里叶变换,link
  3. 如何给5岁孩子解释DCT,link

这篇关于音频筑基:一文搞懂DFT/FFT/DCT/MDCT的区别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/739852

相关文章

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

native和static native区别

本文基于Hello JNI  如有疑惑,请看之前几篇文章。 native 与 static native java中 public native String helloJni();public native static String helloJniStatic();1212 JNI中 JNIEXPORT jstring JNICALL Java_com_test_g

Android fill_parent、match_parent、wrap_content三者的作用及区别

这三个属性都是用来适应视图的水平或者垂直大小,以视图的内容或尺寸为基础的布局,比精确的指定视图的范围更加方便。 1、fill_parent 设置一个视图的布局为fill_parent将强制性的使视图扩展至它父元素的大小 2、match_parent 和fill_parent一样,从字面上的意思match_parent更贴切一些,于是从2.2开始,两个属性都可以使用,但2.3版本以后的建议使

Collection List Set Map的区别和联系

Collection List Set Map的区别和联系 这些都代表了Java中的集合,这里主要从其元素是否有序,是否可重复来进行区别记忆,以便恰当地使用,当然还存在同步方面的差异,见上一篇相关文章。 有序否 允许元素重复否 Collection 否 是 List 是 是 Set AbstractSet 否

javascript中break与continue的区别

在javascript中,break是结束整个循环,break下面的语句不再执行了 for(let i=1;i<=5;i++){if(i===3){break}document.write(i) } 上面的代码中,当i=1时,执行打印输出语句,当i=2时,执行打印输出语句,当i=3时,遇到break了,整个循环就结束了。 执行结果是12 continue语句是停止当前循环,返回从头开始。

maven发布项目到私服-snapshot快照库和release发布库的区别和作用及maven常用命令

maven发布项目到私服-snapshot快照库和release发布库的区别和作用及maven常用命令 在日常的工作中由于各种原因,会出现这样一种情况,某些项目并没有打包至mvnrepository。如果采用原始直接打包放到lib目录的方式进行处理,便对项目的管理带来一些不必要的麻烦。例如版本升级后需要重新打包并,替换原有jar包等等一些额外的工作量和麻烦。为了避免这些不必要的麻烦,通常我们

ActiveMQ—Queue与Topic区别

Queue与Topic区别 转自:http://blog.csdn.net/qq_21033663/article/details/52458305 队列(Queue)和主题(Topic)是JMS支持的两种消息传递模型:         1、点对点(point-to-point,简称PTP)Queue消息传递模型:         通过该消息传递模型,一个应用程序(即消息生产者)可以

深入探讨:ECMAScript与JavaScript的区别

在前端开发的世界中,JavaScript无疑是最受欢迎的编程语言之一。然而,很多开发者在使用JavaScript时,可能并不清楚ECMAScript与JavaScript之间的关系和区别。本文将深入探讨这两者的不同之处,并通过案例帮助大家更好地理解。 一、什么是ECMAScript? ECMAScript(简称ES)是一种脚本语言的标准,由ECMA国际组织制定。它定义了语言的语法、类型、语句、

Lua 脚本在 Redis 中执行时的原子性以及与redis的事务的区别

在 Redis 中,Lua 脚本具有原子性是因为 Redis 保证在执行脚本时,脚本中的所有操作都会被当作一个不可分割的整体。具体来说,Redis 使用单线程的执行模型来处理命令,因此当 Lua 脚本在 Redis 中执行时,不会有其他命令打断脚本的执行过程。脚本中的所有操作都将连续执行,直到脚本执行完成后,Redis 才会继续处理其他客户端的请求。 Lua 脚本在 Redis 中原子性的原因

CSP-J基础之数学基础 初等数论 一篇搞懂(一)

文章目录 前言声明初等数论是什么初等数论历史1. **古代时期**2. **中世纪时期**3. **文艺复兴与近代**4. **现代时期** 整数的整除性约数什么样的整数除什么样的整数才能得到整数?条件:举例说明:一般化: 判断两个数能否被整除 因数与倍数质数与复合数使用开根号法判定质数哥德巴赫猜想最大公因数与辗转相除法计算最大公因数的常用方法:举几个例子:例子 1: 计算 12 和 18