ffmpeg 切割音频文件,各种格式(wav, flac, mp3, m4a等)

2024-03-18 05:20

本文主要是介绍ffmpeg 切割音频文件,各种格式(wav, flac, mp3, m4a等),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

动机

想要用pydub切割音频来制作数据集,结果发现ffmpeg不支持m4a格式的数据输出。

from pydub import AudioSegment
path = r"D:\data\upload"
save_path = r"D:\data\train\upload"files = os.listdir(path)for file in files:audio = AudioSegment.from_file(path+'\\'+file, "flac")size = 2000  # 切割的毫秒数 60s=60000chunks = make_chunks(audio, size)for i, chunk in enumerate(chunks):chunk_name = file.split('.')[0] + f"_{i}.flac"print(chunk_name)chunk.export(save_path+'\\'+chunk_name, format="flac")

报错信息:
Input #0, wav, from 'C:\Users\AAA\AppData\Local\Temp\tmp_g6wtefp':

Duration: 00:00:02.00, bitrate: 512 kb/s

Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 32000 Hz, 1 channels, s16, 512 kb/s [AVFormatContext @ 0000027c7f0bb680] Requested output format 'm4a' is not known.

解决办法

参考了大佬的使用 ffmpeg 来对音频文件(mp3、m4a 等)进行分割 方法,但是一条一条输命令太麻烦了,所以用python的os.system来试着自动化。这里记录一下方便以后使用。

files = os.listdir(path)for file in files:# audio = AudioSegment.from_file(path+'\\'+file, "m4a")cmd = f"ffmpeg -i {path}\{file} -f segment -segment_time 2 -write_xing 0 -c copy {save_path}\{file.split('.')[0]}_%d.m4a"os.system(cmd)

ffmpeg -i file.m4a -f segment -segment_time 900 -write_xing 0 -c copy out%03d.m4a

  • -i:输入文件;
  • -f:强制格式,即目标格式,这里指定为 segment,即分割;
  • -segment_time:每段的时长,单位为秒,示例是按每 5 分钟来切割;
  • -c:指定编码名称(codec),这里我们不打算重新编码,于是用 copy,非常快;
  • write_xing 0:参数指示禁用Xing头部信息的写入

这篇关于ffmpeg 切割音频文件,各种格式(wav, flac, mp3, m4a等)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/821291

相关文章

usaco 1.3 Calf Flac(暴搜)

思路是暴搜。 需要注意的地方是输入的方法,以及输出时的换行。 代码: /*ID: who jayLANG: C++TASK: calfflac*/#include<stdio.h>#include<string.h>#include<math.h>int main(){freopen("calfflac.in","r",stdin);freopen("calfflac.ou

easyui同时验证账户格式和ajax是否存在

accountName: {validator: function (value, param) {if (!/^[a-zA-Z][a-zA-Z0-9_]{3,15}$/i.test(value)) {$.fn.validatebox.defaults.rules.accountName.message = '账户名称不合法(字母开头,允许4-16字节,允许字母数字下划线)';return fal

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以打印WAV音频文件每个packet(也称为数据包或多媒体包)的信息,这些信息包含该packet的pts、dts: 打印出来的“pts”实际是AVPacket结构体中的成员变量pts,是以AVStream->time_base为单位的显

[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2757 标注数量(xml文件个数):2757 标注数量(txt文件个数):2757 标注类别数:4 标注类别名称:["Platelets","RBC","WBC","sickle cell"] 每个类别标注的框数:

一步一步将PlantUML类图导出为自定义格式的XMI文件

一步一步将PlantUML类图导出为自定义格式的XMI文件 说明: 首次发表日期:2024-09-08PlantUML官网: https://plantuml.com/zh/PlantUML命令行文档: https://plantuml.com/zh/command-line#6a26f548831e6a8cPlantUML XMI文档: https://plantuml.com/zh/xmi

ffmpeg面向对象-待定

1.常用对象 rtsp拉流第一步都是avformat_open_input,其入参可以看下怎么用: AVFormatContext *fmt_ctx = NULL;result = avformat_open_input(&fmt_ctx, input_filename, NULL, NULL); 其中fmt_ctx 如何分配内存的?如下 int avformat_open_input(

FFmpeg系列-视频解码后保存帧图片为ppm

在正常开发中遇到花屏时怎么处理呢?可以把解码后的数据直接保存成帧图片保存起来,然后直接看图片有没有花屏来排除是否是显示的问题,如果花屏,则代表显示无问题,如果图片中没有花屏,则可以往显示的方向去排查了。 void saveFrame(AVFrame* pFrame, int width, int height, int iFrame){FILE *pFile;char szFilename[

单精度浮点数按存储格式转为整数的程序

///#include<cstdio>//-----------------union int_char{unsigned char ch[4];float i;};void out_put(union int_char x)//x86是小端对其模式,即最数据的最低位存储在地址的最低位上。{printf("单精度浮点数值为:%f\n",x.i,x.i);printf("存储位置从左到右

[数据集][目标检测]智慧农业草莓叶子病虫害检测数据集VOC+YOLO格式4040张9类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):4040 标注数量(xml文件个数):4040 标注数量(txt文件个数):4040 标注类别数:9 标注类别名称:["acalcerosis","fertilizer","flower","fruit","grey

spring事务属性的xml格式配置

实际是使用代理做的事务优化 <!--配置事务的属性--><tx:advice id="txAdvice" transaction-manager="transactionManager"> <tx:attributes> <!--匹配所有以add开头的方法--><tx:method name="add*" propagation="REQUIRED" /> <tx:metho