音频中采样位数,采样率,比特率的名词解释(转)

2023-11-04 10:20

本文主要是介绍音频中采样位数,采样率,比特率的名词解释(转),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

采样位数(采样大小):

采样位数可以理解为采集卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。我们首先要知道:电脑中的声音文件是用数字0和1来表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之,在播放时则是把数字信号还原成模拟声音信号输出。采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方--256,16位则代表2的16次方--64K。比较一下,一段相同的音乐信息,16位声卡能把它分为64K个精度单位进行处理,而8位声卡只能处理256个精度单位, 造成了较大的信号损失,最终的采样效果自然是无法相提并论的。

通常市面上是这样说,16bit/24bit/32bit。数值越高声音越好。

采样率:

采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。采样定理指采样频率必须大于被采样信号带宽的两倍,另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。

如果信号的带宽是100Hz,那么为了避免混叠现象采样频率必须大于200Hz。

换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。过采样指采样频率超出信号带宽的两倍这样就可以用数字滤波器替换性能不好的模拟抗混叠滤波器。

比特率:

比特率是指将数字声音由模拟格式转化成数字格式的采样率,采样率越高,还原后的音质就越好。 作为一种数字音乐压缩效率的参考性指标,比特率表示单位时间(1秒)内传送的比特数bps(bit per second,位/秒)的速度。通常使用kbps(通俗地讲就是每秒钟1000比特)作为单位。CD中的数字音乐比特率为1411.2kbps(也就是记录1秒钟的CD音乐,需要1411.2×1024比特的数据),音乐文件的BIT RATE高是意味着在单位时间(1秒)内需要处理的数据量(BIT)多,也就是音乐文件的音质好的意思。但是,BIT RATE高时文件大小变大,会占据很多的内存容量,音乐文件最常用的BIT RATE是128kbps,MP3文件可以使用的一般是8~320kbps,但不同MP3机在这方面支持的范围不一样,大部分的是32-256Kbps,这个指数当然是越广越好了,不过320Kbps是暂时最高等级了。

比特率值与现实音频对照:

  1. 16Kbps=电话音质
  2. 24Kbps=增加电话音质、短波广播、长波广播、欧洲制式中波广播
  3. 40Kbps=美国制式中波广播
  4. 56Kbps=话音
  5. 64Kbps=增加话音(手机铃声最佳比特率设定值、手机单声道MP3播放器最佳设定值)
  6. 112Kbps=FM调频立体声广播
  7. 128Kbps=磁带(手机立体声MP3播放器最佳设定值、低档MP3播放器最佳设定值)
  8. 160Kbps=HIFI高保真(中高档MP3播放器最佳设定值)
  9. 192Kbps=CD(高档MP3播放器最佳设定值)
  10. 256Kbps=Studio音乐工作室(音乐发烧友适用)
  11. 实际上随着技术的进步,比特率也越来越高,MP3的最高比特率为320Kbps,但一些格式可以达到更高的比特率和更高的音质。
  12. 比如正逐渐兴起的APE音频格式,能够提供真正发烧级的无损音质和相对于WAV格式更小的体积,其比特率通常为550kbps-----950kbps。

常见编码模式:

  1. VBR(Variable Bitrate)动态比特率,也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;
  2. ABR(Average Bitrate)平均比特率,是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。
  3. CBR(Constant Bitrate),常数比特率,指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。

通俗表示:

简单来讲,采样率和比特率就像是坐标轴上的横纵坐标。

横坐标的采样率表示了每秒钟的采样次数。

纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。

采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的,基本上高于44.1kHZ采样的声音,绝大部分人已经觉察不到其中的分别了。

而声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。

解释:

1、那为什么很多专业的标准都达到了24Bit/192KHz呢?

现在普遍在工程中都是使用48kHz或者96kHz频率录音,只有在最终母带处理时才会转成44.1kHz的CD格式,这样减少多次采样率转换造成的失真。

而在电脑领域,作为音频硬件codec标准的AC97规范只规定了48kHz。这造成几乎所有的输入、输出信号都要被重新采样(专业术语叫采样率转换,即 SRC)。SRC一般都会造成音质的损失,较简单(即较差)的SRC算法会造成音质明显劣化。但这已经是一个既成事实了。

2、既然44K够了,那为什么还要用192KHZ来录音?

首先,20kHz只是大多数人的听觉门限,也就是说,人耳对于20kHz以上的声音很不敏感。注意不敏感并不意味着完全无法感知。大多数乐器(特别是钢琴和弦乐器)的乐音含有丰富的高次谐波,用音乐术语来说即所谓的上方泛音。截止频率为22.05kHz的CD音频,的确会给听惯了真实乐器的人一种不自然的感觉,尤其在高频部分,因为奈奎斯特截止频率造成更高频率泛音的信号失真。

其次,数字录音通常都需要进行后处理。音频处理会对信号产生进一步的失真,包括信号畸变、频谱混叠,等等。如果录音时仅仅用44.1kHz对原始信号采样,那么在后处理前还得进行上采样(up-sampling),对采样频率进行扩展。由于这种扩展是“假”的,实际上并没有更多有用的原始信号,并且上采样算法的优劣也会影响原录音信号的失真,所以这个做法并不可取。因此,通常的做法是用更高的频率进行采样。

而现在的完全专业数字录音棚中,则不再按CD标准的规范录音、混音以及母带,而是优先使用HD音频规范。即:

采用24Bit 48KHz、24Bit 96KHz、24Bit 192KHz 三种规格进行录音,当然,24Bit 48KHz是一些小的录音棚使用,因为他们的处理器资源有限。而大的录音棚,都清一色的使用24Bit 96KHz和24Bit 192KHz 进行录音。

那么,这样的录音规范,有什么好处?

1.符合HD音频标准,这也是将来的主流标准,制作出的成品,可以直接应用于HDCD、DVD-Audio、蓝光唱片、数字音乐下载业务、数字对媒体播放机业务。

2.完全照顾数字影视视频业务,多声道电影视频都会采用HD音频规范。包括移动便携数字视频设备都用它。

3.完全照顾消费性音频播放业务,比如:因特尔HD-Audio音频标准,AC97音频编码解码,便携MP3/mp4/电话/游戏机最高音频质量播放。

目前,专业录音行业的最高质量标准就是:24比特定点位深、192000Hz采样频率,简称“24Bit/192KHz”。当然,将来这个标准依然会继续提高,向32Bit 384KHz进发也是可能的。

实际上,现在的CD唱片市场上卖的产品(正版),最低级别的通常都是HDCD唱片,你买唱片时都会发现基本上都是HDCD标识,也就是一张激光唱片包含两种音轨:普通CD音轨和HDCD音轨。其中CD音轨记录16比特44.1KHz信号(这是这张唱片的兼容内容,照顾早期的CD播放机),HDCD音轨则记录24Bit 96KHz信号(这才是该唱片的主要内容)。普通的CD播放机只能播放CD音轨信号,而HDCD音轨则需要HDCD播放机才能播放(实际上现在的绝大多数 DVD播放机都能播放HDCD,而现在的电脑则更没问题了。)

 

最后附上一张图以便跟好的理解:

 

 

说明:虽然文章有一定历史,但可以了解相关知识点。

 

以上转自:http://blog.sina.com.cn/s/blog_7032e6960100zzhn.html

这篇关于音频中采样位数,采样率,比特率的名词解释(转)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/345088

相关文章

计网名词解释

DNS的主要功能和特点 域名解析:DNS的核心功能是将用户输入的域名解析为IP地址。因为计算机之间只能通过IP地址进行通信,而域名更易于人类记忆和使用,所以DNS起到了桥梁的作用。 分布式数据库:DNS是一个分布式的数据库系统,全球范围内有多个DNS服务器协同工作,共同提供域名解析服务。 缓存机制:为了提高解析效率,DNS服务器和客户端都会缓存解析结果。当再次请求相同的域名时,可以直接从缓存中获

重复采样魔法:用更多样本击败单次尝试的最强模型

这篇文章探讨了通过增加生成样本的数量来扩展大型语言模型(LLMs)在推理任务中的表现。 研究发现,重复采样可以显著提高模型的覆盖率,特别是在具有自动验证工具的任务中。研究还发现,覆盖率与样本数量之间的关系可以用指数幂律建模,揭示了推理时间的扩展规律。尽管多数投票和奖励模型在样本数量增加时趋于饱和,但在没有自动验证工具的任务中,识别正确样本仍然是一个重要的研究方向。 总体而言,重复采样提供了一种

生日贺卡录放音芯片,多段音频录音ic生产厂商,NVF04M-32minute

可以录音播放的生日贺卡与传统的纸质贺卡相比,它有着创意以及个性的特点,仅需少量的电子元器件,即可实现录音功能,搭配上文字,让声音存储在生日贺卡里,让贺卡也变得有温度,祝福我想亲口对TA说。 生日贺卡录放音芯片方案——NVF04M 采用外挂SPI存储器的方式,达到录音的功能。它的主要特点是声音清晰,录音时间长。目前可以提供的录音时间为32分钟。NV04FM的一个显著特点是存储时间灵活,客

Pr:首选项 - 音频硬件

Pr菜单:编辑/首选项 Edit/Preferences Premiere Pro 首选项中的“音频硬件” Audio Hardware选项卡可以指定计算机的音频设备和设置,还可以指定 Pr 用于音频回放和录制的 ASIO 和 MME 设置(仅限 Windows)或 CoreAudio 设置(仅限 macOS)。 当连接音频硬件设备时,该类型设备的硬件设置(如默认输入、默认输出、主时钟、延迟和

Pr:首选项 - 音频

Pr菜单:编辑/首选项 Edit/Preferences Premiere Pro 首选项中的“音频” Audio选项卡主要作用是控制音频的处理设置,包括音量调整、波形生成、音频渲染等选项,这些设置有助于优化音频的处理和编辑工作,适用于不同的剪辑需求和项目要求。 自动匹配时间 Automatch Time 指定已调整的任何控件返回到其先前设置的时间(在调音台中),以秒 Seconds为单位。

【Python百日进阶-Web开发-音频】Day705 - 音频加载 librosa.load / librosa.stream

文章目录 一、音频加载1.1 librosa.load1.1.1 语法与参数1.1.2 例子1.1.2.1 下载并加载文件1.1.2.2 加载并重采样1.1.2.3 加载文件,从第15秒开始,加载5秒- 1.2 librosa.stream1.2.1 语法与参数1.2.2 例子1.2.2.1 一次对 256 帧的块应用短期傅里叶变换。1.2.2.2 使用较短的帧和不重叠的窗口计算流上的 m

Android AudioManager 音频管理

<?xml version="1.0" encoding="utf-8"?><LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"xmlns:app="http://schemas.android.com/apk/res-auto"xmlns:tools="http://schemas.android.

libmad音频解码库-Linux交叉编译移植

下载并解压libmad-0.15.1b.tar.gz 下载链接:https://downloads.sourceforge.net/mad/libmad-0.15.1b.tar.gz $tar -xvf libmad-0.15.1b.tar.gz$cd libmad-0.15.1b 1、先执行下面的命令:这条命令是为了适配高版本的gcc,因为高版本的gcc已经将-fforce-mem去除了:

Linux speex音频库-音频数据编解码

speex音频数据编解码 speex简述speex encoder(编码器)speex decoder(解码器)denoise vad (降噪,语音活性检测) speex简述 speex官网 Speex: A Free Codec For Free Speech Overview Speex is an Open Source/Free Software patent-fre

研究纹理采样器在像素级别的采样位置

问题 【纹理采样器】是一个基础的概念。假设有一个正方形面片,顶点的UV范围是0.0~1.0,那么在这个正方形面片上采样一张纹理时,会呈现出完整的纹理。 但我现在关注的问题是,在像素级别上,采样的位置是怎样的。具体来讲:对于UV值是(0.0,0.0)的点,它对应的采样位置是纹理最左上角像素的中心?还是纹理最左上角像素的左上角?即,下面左右哪个是正确的情况? 在宏观上,尤其是像素较多的时候,二者