MediaMuxer和MediaExtractor类(音频和视频数据的混合和分离)

2024-04-12 20:58

本文主要是介绍MediaMuxer和MediaExtractor类(音频和视频数据的混合和分离),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

MediaMuxer类主要用于将音频和视频数据进行混合生成多媒体文件(如:mp4文件),而MediaExtractor则刚好相反,主要用于多媒体文件的音视频数据的分离。


本文将介绍如何利用Android SDK提供的MediaExtractor和MediaMuxer类来完成mp4文件的提取和生成,指出开发过程中会遇到的坑,并给出简单的Demo示例代码。


Demo的目标:提取input.mp4文件中的视频数据,生成除去音频数据之后的纯视频output.mp4文件。代码可以在本博文最后的附件中下载,也可以到我的Github中下载:


https://github.com/Jhuster/Android/tree/master/MediaDemo


由于Android SDK关于这两个类的介绍真是少之又少,因此,在给出demo之前,我们先简单地了解一下这两个类吧。


1. MediaExtractor


该类主要用于音视频混合数据的分离,接口比较简单,首先要通过setDataSource(String path)函数设置数据源,数据源可以是本地文件地址,也可以使用HTTP协议的网络码流地址。


然后,可以通过下面的代码块,来获取码流的详细信息,如:MimeType,分辨率、编码格式、码率、帧率等等。


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
int  videoTrackIndex = - 1 ;
int  audioTrackIndex = - 1 ;
for ( int  i =  0 ; i < mMediaExtractor.getTrackCount(); i++) {
     //获取码流的详细格式/配置信息
     MediaFormat format = mMediaExtractor.getTrackFormat(i);
     String mime = format.getString(MediaFormat.KEY_MIME);
     if (mime.startsWith( "video/" )) {
         videoTrackIndex = i;
     }
     else  if (mime.startsWith( "audio/" )) {
         audioTrackIndex = i;
     }
     ....
}


获取到媒体文件的详细信息之后,就可以选择指定的通道,并分离和读取数据了:


1
2
3
4
5
6
7
8
9
10
mMediaExtractor.selectTrack(videoTrackIndex);  //选择读取视频数据
while ( true ) {
     int  sampleSize = mMediaExtractor.readSampleData(buffer,  0 );   //读取一帧数据
     if (sampleSize <  0 ) {
         break ;
     }
     mMediaExtractor.advance();  //移动到下一帧
}
mMediaExtractor.release();  //读取结束后,要记得释放资源


2. MediaMuxer


该类主要用于将音频和视频进行混合生成多媒体文件,创建该类对象,需要传入输出的文件位置以及格式,构造函数如下:


1
public  MediaMuxer(String path,  int  format);

创建对象之后,一个比较重要的操作就是addTrack(),添加数据通道,该函数需要传入MediaFormat对象,MediaFormat即媒体格式类,用于描述媒体的格式参数,如视频帧率、音频采样率等。


在本示例中,可以直接使用MediaExtractor.getTrackFormat()解析得到的MediaFormat对象,如果你希望自己来创建这个MediaFormat对象的话,可以使用该类的如下静态方法创建:


1
MediaFormat format = MediaFormat.createVideoFormat( "video/avc" , 320 , 240 );


注意,这里有一个比较大的坑,就是,如果手动创建MediaFormat对象的话,一定要记得设置"csd-0"和"csd-1"这两个参数:


1
2
3
4
5
byte [] csd0 = {x,x,x,x,x,x,x...}
byte [] csd1 = {x,x,x,x,x,x,x...}
format.setByteBuffer( "csd-0" ,ByteBuffer.wrap(csd0));
format.setByteBuffer( "csd-1" ,ByteBuffer.wrap(csd1));


至于"csd-0"和"csd-1"是什么,对于H264视频的话,它对应的是sps和pps,对于AAC音频的话,对应的是ADTS,做音视频开发的人应该都知道,它一般存在于编码器生成的IDR帧之中。


通过 addTrack() 添加了数据通道之后,记录下函数返回的 trackIndex,然后就可以调用 MediaMuxer.writeSampleData() 愉快地向mp4文件中写入数据了。


这里会产生第二个坑,就是writeSampleData函数的最后一个参数是一个BufferInfo对象,你必须认真地填入“正确”的值


1
2
3
4
5
BufferInfo info =  new  BufferInfo();
info.offset =  0 ;
info.size = sampleSize;
info.flags = MediaCodec.BUFFER_FLAG_SYNC_FRAME;
info.presentationTimeUs = timestamp;


其中,


info.size 必须填入数据的大小

info.flags 需要给出是否为同步帧/关键帧

info.presentationTimeUs 必须给出正确的时间戳,注意单位是 us,例如,对于帧率为 x f/s 的视频而言,时间戳的间隔就是 1000/x ms


跳过了这些坑,你就可以顺利地完成mp4文件的写入了,同样,完成后记得关闭以及释放资源:


1
2
mMediaMuxer.stop();
mMediaMuxer.release();


3. 小结


有了上面的简单介绍和铺垫,demo代码就不难看懂了。运行demo代码的注意事项:


(1)Android 4.3以及以上系统的手机

(2)把 input.mp4文件拷贝到sdcard


代码最核心的部分如下所示:


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
   protected  boolean  process()  throws  IOException {
       mMediaExtractor =  new  MediaExtractor();          
       mMediaExtractor.setDataSource(SDCARD_PATH+ "/input.mp4" );                
               
       int  mVideoTrackIndex = - 1 ;
       int  framerate =  0 ;
       for ( int  i =  0 ; i < mMediaExtractor.getTrackCount(); i++) {
           MediaFormat format = mMediaExtractor.getTrackFormat(i);
           String mime = format.getString(MediaFormat.KEY_MIME);
           if (!mime.startsWith( "video/" )) {                
               continue ;
           }
           framerate = format.getInteger(MediaFormat.KEY_FRAME_RATE);            
           mMediaExtractor.selectTrack(i);
           mMediaMuxer =  new  MediaMuxer(SDCARD_PATH+ "/ouput.mp4" , OutputFormat.MUXER_OUTPUT_MPEG_4);
           mVideoTrackIndex = mMediaMuxer.addTrack(format);  
           mMediaMuxer.start();
       }
       
       if (mMediaMuxer ==  null ) {
           return  false ;
       }
       
       BufferInfo info =  new  BufferInfo();
       info.presentationTimeUs =  0 ;
       ByteBuffer buffer = ByteBuffer.allocate( 500 * 1024 );        
       while ( true ) {
           int  sampleSize = mMediaExtractor.readSampleData(buffer,  0 );
           if (sampleSize <  0 ) {
               break ;
           }
           mMediaExtractor.advance();
           info.offset =  0 ;
           info.size = sampleSize;
           info.flags = MediaCodec.BUFFER_FLAG_SYNC_FRAME;        
           info.presentationTimeUs +=  1000 * 1000 /framerate;
           mMediaMuxer.writeSampleData(mVideoTrackIndex,buffer,info);
       }
       mMediaExtractor.release();
       
       mMediaMuxer.stop();
       mMediaMuxer.release();
       
       return  true ;
   }

这篇关于MediaMuxer和MediaExtractor类(音频和视频数据的混合和分离)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/898221

相关文章

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

2.1/5.1和7.1声道系统有什么区别? 音频声道的专业知识科普

《2.1/5.1和7.1声道系统有什么区别?音频声道的专业知识科普》当设置环绕声系统时,会遇到2.1、5.1、7.1、7.1.2、9.1等数字,当一遍又一遍地看到它们时,可能想知道它们是什... 想要把智能电视自带的音响升级成专业级的家庭影院系统吗?那么你将面临一个重要的选择——使用 2.1、5.1 还是

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Python实现将实体类列表数据导出到Excel文件

《Python实现将实体类列表数据导出到Excel文件》在数据处理和报告生成中,将实体类的列表数据导出到Excel文件是一项常见任务,Python提供了多种库来实现这一目标,下面就来跟随小编一起学习一... 目录一、环境准备二、定义实体类三、创建实体类列表四、将实体类列表转换为DataFrame五、导出Da

Python视频处理库VidGear使用小结

《Python视频处理库VidGear使用小结》VidGear是一个高性能的Python视频处理库,本文主要介绍了Python视频处理库VidGear使用小结,文中通过示例代码介绍的非常详细,对大家的... 目录一、VidGear的安装二、VidGear的主要功能三、VidGear的使用示例四、VidGea

Python实现数据清洗的18种方法

《Python实现数据清洗的18种方法》本文主要介绍了Python实现数据清洗的18种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录1. 去除字符串两边空格2. 转换数据类型3. 大小写转换4. 移除列表中的重复元素5. 快速统

Python数据处理之导入导出Excel数据方式

《Python数据处理之导入导出Excel数据方式》Python是Excel数据处理的绝佳工具,通过Pandas和Openpyxl等库可以实现数据的导入、导出和自动化处理,从基础的数据读取和清洗到复杂... 目录python导入导出Excel数据开启数据之旅:为什么Python是Excel数据处理的最佳拍档