python使用ffmpeg来制作音频格式转换工具(优化版)

2023-11-02 01:45

本文主要是介绍python使用ffmpeg来制作音频格式转换工具(优化版),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

简介:一个使用python加上ffmpeg模块来进行音频格式转换的工具。
日志:

20231030:第一版,设置了简单的UI布局和配色,实现音频转为Mp3、AAC、wav、flac四种格式。可解析音频并显示信息,可设置转换后的保存路径

UI界面:
在这里插入图片描述
编程平台:visual studio code
在这里插入图片描述
编程语言:python 3.12.0
模块:ffmpeg、PyQt5
其中ffmpeg是用来处理音频文件的主要模块,PyQt5是用来制作UI界面使用。

ffmpeg安装:
注意这里不要直接pip install ffmpeg

pip install ffmpeg-python

PyQt5安装:

pip install PyQt5

关于PyQt5的使用,本文中不做多介绍,因为pyqt5的使用相对来说是比较简单的。网上非常多的示例可以参考。

下面说一下代码:

音频导入

导入音频文件,使用pyqt5的qfiledialog类getopenfilename方法,如下

 def music_load(self):"""文件载入"""self.filepth,_=QFileDialog.getOpenFileName(self,"选择音频","C:/","Allfile(*);;txt(*.txt)")if self.filepth:self.lbl2.setText(self.filepth)self.music_info_get(self.filepth)else:self.lbl2.setText("路径为空")
获取音频信息

获取音频信息,要用到ffmpeg中的probe功能,probe的参数就是音频文件的文件路径。如果音频文件是正确且存在的,ffmpeg会自动对音频进行分析,返回一个JSON格式的数据集。

   probe=ffmpeg.probe(file)

返回数据示例:

{‘streams’: [{‘index’: 0, ‘codec_name’: ‘wmav2’, ‘codec_long_name’: ‘Windows Media Audio 2’, ‘codec_type’: ‘audio’, ‘codec_tag_string’: ‘a[1][0][0]’, ‘codec_tag’: ‘0x0161’, ‘sample_fmt’: ‘fltp’, ‘sample_rate’: ‘44100’, ‘channels’: 2, ‘bits_per_sample’: 0, ‘initial_padding’: 0, ‘r_frame_rate’: ‘0/0’, ‘avg_frame_rate’: ‘0/0’, ‘time_base’: ‘1/1000’, ‘start_pts’: 0, ‘start_time’: ‘0.000000’, ‘duration_ts’: 280333, ‘duration’: ‘280.333000’, ‘bit_rate’: ‘96024’, ‘extradata_size’: 10, ‘disposition’: {‘default’: 0, ‘dub’: 0, ‘original’: 0, ‘comment’: 0, ‘lyrics’: 0, ‘karaoke’: 0, ‘forced’: 0, ‘hearing_impaired’: 0, ‘visual_impaired’: 0, ‘clean_effects’: 0, ‘attached_pic’: 0, ‘timed_thumbnails’: 0, ‘captions’: 0, ‘descriptions’: 0, ‘metadata’: 0, ‘dependent’: 0, ‘still_image’: 0}, ‘tags’: {‘language’: ‘chi’}}], ‘format’: {‘filename’: ‘F:/音乐/Celine Dion(席琳 迪翁)-My Heart Will Go On.wma’, ‘nb_streams’: 1, ‘nb_programs’: 0, ‘format_name’: ‘asf’, ‘format_long_name’: ‘ASF (Advanced / Active Streaming Format)’, ‘start_time’: ‘0.000000’, ‘duration’: ‘280.333000’, ‘size’: ‘3395127’, ‘bit_rate’: ‘96888’, ‘probe_score’: 100, ‘tags’: {‘DeviceConformanceTemplate’: ‘L1’, ‘artist’: ‘Celine Dion(席琳 迪翁)’, ‘WM/WMADRCAverageReference’: ‘7322’, ‘WM/WMADRCPeakReference’: ‘32767’, ‘title’: ‘My Heart Will Go On’, ‘IsVBR’: ‘0’, ‘album’: ‘泰坦尼克号电影音乐精选’, ‘WMFSDKNeeded’: ‘0.0.0.0000’, ‘WMFSDKVersion’: ‘10.00.00.3708’}}}

以上是probe返回的内容格式,可以看到包含了很多音频文件的信息,如音频名、音频格式、时间、比特率等等,probe实际上是一个字典数据。
所以,如果要想取其中的对应数据来用,只需要对照字典中的键来取值即可。

format=probe['format']
stream=probe['streams'][0]

format和stream又分别是字典类型,再次按照字典来取值:

 		video_time=format['duration']video_byte=str(int(format['size'])/1024/1024)video_rate=stream['bit_rate']video_rate2=float(video_rate)/1000music_name=format['filename']music_geshi=format['format_name']
音频格式转换

格式转换功能主要是ffmpeg来完成的,python只需要调用ffmpeg程序即可,因此使用了subprocess模块。

pp=subprocess.Popen(cmdtxt,shell=True,stdout=subprocess.PIPE,stderr=subprocess.STDOUT,encoding='utf-8',text=True)

关于subprocess的详细使用,大家可以自行搜索,此处不多介绍。
subprocess调用ffmpeg,而ffmpeg的指令格式如下:

ffmpeg指令示例:

ffmpeg -i input.mp3 -acodec pcm_s16le -ac 2 -ar 44100 output.wav

也可以很简单:

ffmpeg -i input.mp3 output.wav

本文中主要使用第二种指令,即简单化。subprocess模块调用ffmpeg程序,而ffmpeg根据传入的指令来对目标进行转换。

以上就是这个音频转换程序的基本逻辑,从使用来说,先载入音频,然后选择要转换的格式,以及转换后保存的路径,最后点击“格式转换”按钮,等待程序自动转换即可,转换完成后会有提示。
在这里插入图片描述
整个操作是很简单的,下面会给出完整代码。

其中,UI界面的配色,是有qss来渲染的。

qss文件的读取,是一个单独的模块:
qss_read.py

class QssRead:@staticmethoddef readQSS(style):with open(style, "r",encoding="utf-8") as f:return f.read()
 self.qssfile1="M03_musicconvert_pro2023\\qss_main_style.qss"
self.qss1=QssRead.readQSS(self.qssfile1)
self.setStyleSheet(self.qss1)

qss文件:
可以看到,qss文件主要是统一设置UI界面的样式,如颜色、形状、粗细等。

/*
*
窗体背景色为渐变色
*/
QWidget
{background-color:qlineargradient(x1:0, y1:0, x2:1, y2:1, stop:0 #d0f0e8,stop:0.2 #a5f8cc,stop:0.5 #99f56b stop:1 #8EF068);/*background-color:qradialgradient(cx:0.5, cy:0.5, radius:0.5, fx:0.5, fy:0.5, stop:0 red, stop:1 blue)*//*background-color:qconicalgradient(cx:0.5, cy:0.5, angle:0, stop:0 blue, stop:0.2 yellow,stop:1 #4CF562)*/
}
QMenuBar
{background-color:qlineargradient(x1:0, y1:0, 

这篇关于python使用ffmpeg来制作音频格式转换工具(优化版)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/327253

相关文章

Python调用Orator ORM进行数据库操作

《Python调用OratorORM进行数据库操作》OratorORM是一个功能丰富且灵活的PythonORM库,旨在简化数据库操作,它支持多种数据库并提供了简洁且直观的API,下面我们就... 目录Orator ORM 主要特点安装使用示例总结Orator ORM 是一个功能丰富且灵活的 python O

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

C++ Primer 多维数组的使用

《C++Primer多维数组的使用》本文主要介绍了多维数组在C++语言中的定义、初始化、下标引用以及使用范围for语句处理多维数组的方法,具有一定的参考价值,感兴趣的可以了解一下... 目录多维数组多维数组的初始化多维数组的下标引用使用范围for语句处理多维数组指针和多维数组多维数组严格来说,C++语言没

在 Spring Boot 中使用 @Autowired和 @Bean注解的示例详解

《在SpringBoot中使用@Autowired和@Bean注解的示例详解》本文通过一个示例演示了如何在SpringBoot中使用@Autowired和@Bean注解进行依赖注入和Bean... 目录在 Spring Boot 中使用 @Autowired 和 @Bean 注解示例背景1. 定义 Stud