音频中采样位数，采样率，比特率的名词解释（转）

本文主要是介绍音频中采样位数，采样率，比特率的名词解释（转），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

采样位数（采样大小）：

采样位数可以理解为采集卡处理声音的解析度。这个数值越大，解析度就越高，录制和回放的声音就越真实。我们首先要知道：电脑中的声音文件是用数字0和1来表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之，在播放时则是把数字信号还原成模拟声音信号输出。采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方--256，16位则代表2的16次方--64K。比较一下，一段相同的音乐信息，16位声卡能把它分为64K个精度单位进行处理，而8位声卡只能处理256个精度单位，造成了较大的信号损失，最终的采样效果自然是无法相提并论的。

通常市面上是这样说，16bit/24bit/32bit。数值越高声音越好。

采样率：

采样率（也称为采样速度或者采样频率）定义了每秒从连续信号中提取并组成离散信号的采样个数，它用赫兹（Hz）来表示。采样频率的倒数叫作采样周期或采样时间，它是采样之间的时间间隔。采样定理指采样频率必须大于被采样信号带宽的两倍，另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。

如果信号的带宽是100Hz，那么为了避免混叠现象采样频率必须大于200Hz。

换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍，否则就不能从信号采样中恢复原始信号。过采样指采样频率超出信号带宽的两倍这样就可以用数字滤波器替换性能不好的模拟抗混叠滤波器。

比特率：

比特率是指将数字声音由模拟格式转化成数字格式的采样率，采样率越高，还原后的音质就越好。作为一种数字音乐压缩效率的参考性指标，比特率表示单位时间（1秒）内传送的比特数bps（bit per second，位/秒）的速度。通常使用kbps（通俗地讲就是每秒钟1000比特）作为单位。CD中的数字音乐比特率为1411.2kbps（也就是记录1秒钟的CD音乐，需要1411.2×1024比特的数据），音乐文件的BIT RATE高是意味着在单位时间（1秒）内需要处理的数据量（BIT）多，也就是音乐文件的音质好的意思。但是，BIT RATE高时文件大小变大，会占据很多的内存容量，音乐文件最常用的BIT RATE是128kbps，MP3文件可以使用的一般是8～320kbps，但不同MP3机在这方面支持的范围不一样，大部分的是32-256Kbps，这个指数当然是越广越好了，不过320Kbps是暂时最高等级了。

比特率值与现实音频对照：

16Kbps=电话音质
24Kbps=增加电话音质、短波广播、长波广播、欧洲制式中波广播
40Kbps=美国制式中波广播
56Kbps=话音
64Kbps=增加话音（手机铃声最佳比特率设定值、手机单声道MP3播放器最佳设定值）
112Kbps=FM调频立体声广播
128Kbps=磁带（手机立体声MP3播放器最佳设定值、低档MP3播放器最佳设定值）
160Kbps=HIFI高保真（中高档MP3播放器最佳设定值）
192Kbps=CD（高档MP3播放器最佳设定值）
256Kbps=Studio音乐工作室（音乐发烧友适用）
实际上随着技术的进步，比特率也越来越高，MP3的最高比特率为320Kbps，但一些格式可以达到更高的比特率和更高的音质。
比如正逐渐兴起的APE音频格式，能够提供真正发烧级的无损音质和相对于WAV格式更小的体积，其比特率通常为550kbps-----950kbps。

常见编码模式：

VBR（Variable Bitrate）动态比特率，也就是没有固定的比特率，压缩软件在压缩时根据音频数据即时确定使用什么比特率，这是以质量为前提兼顾文件大小的方式，推荐编码模式；
ABR（Average Bitrate）平均比特率，是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内，以每50帧（30帧约1秒）为一段，低频和不敏感频率使用相对低的流量，高频和大动态表现时使用高流量，可以做为VBR和CBR的一种折衷选择。
CBR（Constant Bitrate），常数比特率，指文件从头到尾都是一种位速率。相对于VBR和ABR来讲，它压缩出来的文件体积很大，而且音质相对于VBR和ABR不会有明显的提高。

通俗表示：

简单来讲，采样率和比特率就像是坐标轴上的横纵坐标。

横坐标的采样率表示了每秒钟的采样次数。

纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。

采样率类似于动态影像的帧数，比如电影的采样率是24赫兹，PAL制式的采样率是25赫兹，NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时，看到的就是连续的画面。同样的道理，把以44.1kHZ采样率记录的CD以同样的速率播放时，就能听到连续的声音。显然，这个采样率越高，听到的声音和看到的图像就越连贯。当然，人的听觉和视觉器官能分辨的采样率是有限的，基本上高于44.1kHZ采样的声音，绝大部分人已经觉察不到其中的分别了。

而声音的位数就相当于画面的颜色数，表示每个取样的数据量，当然数据量越大，回放的声音越准确，不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理，对于画面来说就是更清晰和准确，不至于把血和西红柿酱混淆。不过受人的器官的机能限制，16位的声音和24位的画面基本已经是普通人类的极限了，更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音，而CD是44.1kHZ取样的16位声音，所以CD就比电话更清楚。

解释：

1、那为什么很多专业的标准都达到了24Bit/192KHz呢？

现在普遍在工程中都是使用48kHz或者96kHz频率录音，只有在最终母带处理时才会转成44.1kHz的CD格式，这样减少多次采样率转换造成的失真。

而在电脑领域，作为音频硬件codec标准的AC97规范只规定了48kHz。这造成几乎所有的输入、输出信号都要被重新采样（专业术语叫采样率转换，即 SRC）。SRC一般都会造成音质的损失，较简单（即较差）的SRC算法会造成音质明显劣化。但这已经是一个既成事实了。

2、既然44K够了,那为什么还要用192KHZ来录音?

首先，20kHz只是大多数人的听觉门限，也就是说，人耳对于20kHz以上的声音很不敏感。注意不敏感并不意味着完全无法感知。大多数乐器（特别是钢琴和弦乐器）的乐音含有丰富的高次谐波，用音乐术语来说即所谓的上方泛音。截止频率为22.05kHz的CD音频，的确会给听惯了真实乐器的人一种不自然的感觉，尤其在高频部分，因为奈奎斯特截止频率造成更高频率泛音的信号失真。

其次，数字录音通常都需要进行后处理。音频处理会对信号产生进一步的失真，包括信号畸变、频谱混叠，等等。如果录音时仅仅用44.1kHz对原始信号采样，那么在后处理前还得进行上采样（up-sampling），对采样频率进行扩展。由于这种扩展是“假”的，实际上并没有更多有用的原始信号，并且上采样算法的优劣也会影响原录音信号的失真，所以这个做法并不可取。因此，通常的做法是用更高的频率进行采样。

而现在的完全专业数字录音棚中，则不再按CD标准的规范录音、混音以及母带，而是优先使用HD音频规范。即：

采用24Bit 48KHz、24Bit 96KHz、24Bit 192KHz 三种规格进行录音，当然，24Bit 48KHz是一些小的录音棚使用，因为他们的处理器资源有限。而大的录音棚，都清一色的使用24Bit 96KHz和24Bit 192KHz 进行录音。

那么，这样的录音规范，有什么好处？

1.符合HD音频标准，这也是将来的主流标准，制作出的成品，可以直接应用于HDCD、DVD-Audio、蓝光唱片、数字音乐下载业务、数字对媒体播放机业务。

2.完全照顾数字影视视频业务，多声道电影视频都会采用HD音频规范。包括移动便携数字视频设备都用它。

3.完全照顾消费性音频播放业务，比如：因特尔HD-Audio音频标准，AC97音频编码解码，便携MP3/mp4/电话/游戏机最高音频质量播放。

目前，专业录音行业的最高质量标准就是：24比特定点位深、192000Hz采样频率，简称“24Bit/192KHz”。当然，将来这个标准依然会继续提高，向32Bit 384KHz进发也是可能的。

实际上，现在的CD唱片市场上卖的产品（正版），最低级别的通常都是HDCD唱片，你买唱片时都会发现基本上都是HDCD标识，也就是一张激光唱片包含两种音轨：普通CD音轨和HDCD音轨。其中CD音轨记录16比特44.1KHz信号（这是这张唱片的兼容内容，照顾早期的CD播放机），HDCD音轨则记录24Bit 96KHz信号（这才是该唱片的主要内容）。普通的CD播放机只能播放CD音轨信号，而HDCD音轨则需要HDCD播放机才能播放（实际上现在的绝大多数 DVD播放机都能播放HDCD，而现在的电脑则更没问题了。）

最后附上一张图以便跟好的理解：