利用ALSA库进行音频重采样

2024-02-17 07:58
文章标签 进行 音频 采样 alsa

本文主要是介绍利用ALSA库进行音频重采样,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

http://blog.csdn.net/mantis_1984/article/details/52839589


一、ALSA介绍:

1、简介:

高级Linux声音体系英语Advanced LinuxSound Architecture,缩写为ALSA)是Linux内核中,为声卡提供的驱动组件,以替代原先的OSS(开放声音系统)。 一部分的目的是支持声卡的自动配置,以及完美的处理系统中的多个声音设备,这些目的大多都已达到。另一个声音框架JACK使用ALSA提供低延迟的专业级音频编辑和混音能力。

Jaroslav Kysela过去是这个项目的领导者,这个项目开始于为1998年Gravis Ultrasound所开发的驱动,它一直作为一个单独的软件包开发,直到2002年他被引进入Linux内核的开发版本 (2.5.4-2.5.5)。从2.6版本开始ALSA成为Linux内核中默认的标准音频驱动程序集,OSS则被标记为废弃。

ALSA是一个完全开放源代码的音频驱动程序集,除了像OSS那样提供了一组内核驱动程序模块之外,ALSA还专门为简化应用程序的编写提供了相应的函数库,与OSS提供的基于ioctl的原始编程接口相比,ALSA函数库使用起来要更加方便一些。利用该函数库,开发人员可以方便快捷的开发出自己的应用程序,细节则留给函数库内部处理。当然ALSA也提供了类似于OSS的系统接口,不过ALSA的开发者建议应用程序开发者使用音频函数库而不是驱动程序的API。

2、分层

ALSA体系主要分为三层,按照调用关系依次是,app、alsa-lib、kerneldriver。


                                         ALSA 架构图

3、kernel driver层简述:

Kernel driver 层,为内核驱动代码,主要在内核源码中的sound目录下,负责对硬件进行控制与操作。驱动创建的设备文件,在文件系统中的/dev/snd/目录下。注意,应用层使用alsa-API中打开的设备文件,并不是/dev/snd/目录下的文件,而是alsa-lib对设备的再一次封装的产物,叫做plugins,如plughw:0,0 ,后面详细解释。

4、alsa-lib层简述:

Alsa-lib层,为不同的驱动提供统一的接口alsa API,简化了开发人员对于驱动层的调用开发。主要有如下接口

  • ALSA library API reference

The currently designed interfaces are listed below:

Information Interface (/proc/asound)

Control Interface (/dev/snd/controlCX)

Mixer Interface (/dev/snd/mixerCXDX)

PCM Interface (/dev/snd/pcmCXDX)

Raw MIDI Interface (/dev/snd/midiCXDX)

Sequencer Interface (/dev/snd/seq)

Timer Interface (/dev/snd/timer)

我们在应用中,主要使用的是 PCM 接口。如Snd_pcm_open()函数。

除了Alsa-API接口以外,alsa-lib还可以通过配置文件,开放其附加功能,如采样率转换、软件混音等。

我们就是利用alsa-lib的附加功能实现我们的重采样功能,修改的地方主要包括alsa-lib的配置和APP调用两方面。下一章对如何利用alsa-lib的配置文件开放其采样率转换功能进行描述。

二、配置文件asound.conf:

asound.conf配置文件,是alsa-lib的默认配置文件,路径在 /etc/,可以用来配置alsa库的一些附加功能。这个文件不是alsa库运行时所必须的,没有它alsa库也可以正常运行。

关于asound.conf的配置,可以参考以下文档:

http://www.alsa-project.org/main/index.php/Asoundrc

 

先阐述一些重要的名词:

Card:声卡,直接对应硬件,ID从0开始计数。

Device:设备,在一个card上,可以有多个device,每个device可以独立被打开和使用,ID从0开始计数。

Plugin:插件,前文说过,应用层调用alsa库时,操作的并不是驱动层创建的设备文件,而是这个plugins,plugin是alsa库对音频处理设备的抽象,hw plugin为硬件设备抽象出的plugin,是最基础的模块,不需要对alsa-lib进行配置即可使用,我们常见的plughw:0,0含义就是类型为hw的plugin,编号声卡0上面的设备0。除了hw类型的plugin外,还有一些纯软件实现的模块,可以用来进行音频处理,例如,可以实现音频采样率转换的rate plugin,可以用来混音的dmix plugin等等。

Slave:从属设备,可以把几个plugin连接起来,sink端的设备就是source端设备的slave。

需要使用这些附加的plugin,就要对配置文件(asound.conf)进行配置,这个配置是实时生效的,所以我们不必修改文件系统中的文件,而是在运行我们的应用程序之前,将自己的配置文件拷贝到/etc/下,对默认的配置文件进行覆盖就行了。

具体如何配置,书写格式,请参看Asoundrc文档。

以下就是我的配置,

pcm_slave.sl2 {

         pcm"plughw:0,1"

         rate48000

}

 

pcm.rate_convert {

         typerate

         slavesl2

}

 

这个配置的含义是,

下面一段:创建一个使用pcm API接口的设备,叫做rate_convert,它的类型是rate(可以实现采样率转换的plugin),它有一个slave叫做sl2

上面一段:定义一个使用pcm接口的slave,叫做sl2,他实际上是plughw:0,1这个设备的别名,即等同于plughw:0,1(对应我用于播放的AIC3104芯片),这个设备需要的采样率是48KHz

通过这个配置,就可以在app中,使用pcm API打开rate_convert这个设备,并把解码后的8K采样率的PCM数据,直接使用snd_pcm_writei写入设备,rate_convert这个设备就可以自动将PCM数据重采样至48KHz,然后自动传递给plughw:0,1进行播放。

在看Asoundrc的文档中,一直不明白,为什么在配置文件中,只有输出的采样率配置,而没有输入的采样率配置,要重采样,alsa-lib总得知道把啥转换成48K吧,

在实践中发现,可以通过APP调用alsa-API中的snd_pcm_hw_params_set_rate_near()函数将数据源的采样率为8K传递给alsa-lib。下面一章对app调用alsa-API进行说明。

三、App调用方法:

在app调用这块儿,其他的通用调用流程在这里就不累述了,使用个项目原来的那套代码就行,只有三块儿需要修改和注意:

1、使用snd_pcm_open()打开的设备文件rate_convert(不需再打开plughw:0,1了),PCM数据的原始采样率,用snd_pcm_hw_params_set_rate_near()对rate_convert进行配置。

2、重要的参数Period_size,即播放周期大小,单位为Byte,需使用snd_pcm_hw_params_set_period_size_near()进行配置,如果period_size配的不对,或者不配置,会发生underRun,播放声音断断续续。

8K pcm, 配置sample_rate为8000,配置period_size为256

48K pcm, 配置sample_rate为48000,配置period_size为1024

3、配置负责playback的AIC3104的采样率为48K


四、未尽之处:

在研究alsa-lib的调用时,还有一些没有搞明白的地方,这里记录下来,将来大家有时间可以研究研究。

1、我的设备上音频输入输出分开使用了两块AIC3104,这样重采样后G711的自编自解就不成问题,因为输入的AIC3104设为8K,输出的AIC3104设为48K播放重采样后的数据,如果系统中只使用一块AIC3104,就必须对输入的PCM数据也进行一次重采样,这里没有进行研究。

2、多设备绑定,假如我们系统中有多个playback设备,现在的做法是启两个线程,分别写入数据,如果可以使用alsa-lib的slave配置将多个设备进行绑定,例如一个rate plugin绑定两个 hw plugin,然后只需向这一个rate plugin写入数据即可,不会遇到两个播放线程同步的问题,我试了一下,只能绑定一个slave,再多绑一个,第一个slave就会没有播放声音。

3、混音功能,这个混音功能看似是非常强大的,它可以把多个不同采样率的通道,混合成一路统一采样率的数据进行播放,如果我们以后可以进行多路解码,或者要实现视频会议中MCU的功能,那势必要用到这个功能,在这里还没有进行深究。




这篇关于利用ALSA库进行音频重采样的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/717155

相关文章

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

Linux使用fdisk进行磁盘的相关操作

《Linux使用fdisk进行磁盘的相关操作》fdisk命令是Linux中用于管理磁盘分区的强大文本实用程序,这篇文章主要为大家详细介绍了如何使用fdisk进行磁盘的相关操作,需要的可以了解下... 目录简介基本语法示例用法列出所有分区查看指定磁盘的区分管理指定的磁盘进入交互式模式创建一个新的分区删除一个存

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

2.1/5.1和7.1声道系统有什么区别? 音频声道的专业知识科普

《2.1/5.1和7.1声道系统有什么区别?音频声道的专业知识科普》当设置环绕声系统时,会遇到2.1、5.1、7.1、7.1.2、9.1等数字,当一遍又一遍地看到它们时,可能想知道它们是什... 想要把智能电视自带的音响升级成专业级的家庭影院系统吗?那么你将面临一个重要的选择——使用 2.1、5.1 还是

使用Python进行文件读写操作的基本方法

《使用Python进行文件读写操作的基本方法》今天的内容来介绍Python中进行文件读写操作的方法,这在学习Python时是必不可少的技术点,希望可以帮助到正在学习python的小伙伴,以下是Pyth... 目录一、文件读取:二、文件写入:三、文件追加:四、文件读写的二进制模式:五、使用 json 模块读写

使用zabbix进行监控网络设备流量

《使用zabbix进行监控网络设备流量》这篇文章主要为大家详细介绍了如何使用zabbix进行监控网络设备流量,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录安装zabbix配置ENSP环境配置zabbix实行监控交换机测试一台liunx服务器,这里使用的为Ubuntu22.04(

在Pandas中进行数据重命名的方法示例

《在Pandas中进行数据重命名的方法示例》Pandas作为Python中最流行的数据处理库,提供了强大的数据操作功能,其中数据重命名是常见且基础的操作之一,本文将通过简洁明了的讲解和丰富的代码示例,... 目录一、引言二、Pandas rename方法简介三、列名重命名3.1 使用字典进行列名重命名3.编

python安装完成后可以进行的后续步骤和注意事项小结

《python安装完成后可以进行的后续步骤和注意事项小结》本文详细介绍了安装Python3后的后续步骤,包括验证安装、配置环境、安装包、创建和运行脚本,以及使用虚拟环境,还强调了注意事项,如系统更新、... 目录验证安装配置环境(可选)安装python包创建和运行Python脚本虚拟环境(可选)注意事项安装

如何使用celery进行异步处理和定时任务(django)

《如何使用celery进行异步处理和定时任务(django)》文章介绍了Celery的基本概念、安装方法、如何使用Celery进行异步任务处理以及如何设置定时任务,通过Celery,可以在Web应用中... 目录一、celery的作用二、安装celery三、使用celery 异步执行任务四、使用celery

SpringBoot使用minio进行文件管理的流程步骤

《SpringBoot使用minio进行文件管理的流程步骤》MinIO是一个高性能的对象存储系统,兼容AmazonS3API,该软件设计用于处理非结构化数据,如图片、视频、日志文件以及备份数据等,本文... 目录一、拉取minio镜像二、创建配置文件和上传文件的目录三、启动容器四、浏览器登录 minio五、