FFplay源码分析-streams_open

2024-06-24 01:58

本文主要是介绍FFplay源码分析-streams_open,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《FFmpeg原理》的社群来了,想加入社群的朋友请购买 VIP 版,VIP 版有更高级的内容与答疑服务。


本系列 以 ffmpeg4.2 源码为准,下载地址:链接:百度网盘 提取码:g3k8

FFplay 源码分析系列以一条简单的命令开始,ffplay -i a.mp4。a.mp4下载链接:百度网盘,提取码:nl0s 。


如下图所示,本文主要讲解 streams_open() 函数的内部逻辑。

在这里插入图片描述
在这里插入图片描述

如上图所示,streams_open() 里面比较重要的函数就是 初始化 frame_queue 跟 packet_queue,我画一个数据结构图会更容易理解。

数据结构图,我画着画着,不小心画出了整体的数据关系图,不过大家暂时只需要关注 Frame 那块就行。

在这里插入图片描述

如上图所示,我先简单讲解一下上面全局的数据关系图。

可以看到 struct VideoState 统领了全局。每一个数据流,音频流,视频流,数据流,都有各自的 struct FrameQueuestruct PacketQueuestruct Decoder

  • struct FrameQueue : frame 缓存队列,用于给SDL播放。
  • struct PacketQueue: packet 缓存队列,用来解码后 插入 frame 缓存队列。
  • struct Decoder :解码器封装。

有一点需要注意的是 FrameQueue 是一个静态数组,PacketQueue 是一个动态链表。 FrameQueue 相对复杂一点,后面会详细讲解。


先介绍一下 struct Frame 结构体里面各个成员的作用。

  • *AVFrame frame; 存储视频或音频的 frame。
  • AVSubtitle sub; 存储字幕数据,不用关注。
  • int serial; Frame 的 serial 号,作用是 拖进度条,改变播放位置后,丢弃之前缓存的旧Frame。第三篇文章说过,改变播放位置,就会插入一个 flush_pktPacketQueue 队列,导致 PacketQueue::serial + 1 ,但之前 FrameQueue 里里面缓存的 Frame的serial 并没有+1,所以 旧的 Frame::serial 不等于新的 PacketQueue::serial ,所以播放位置改变之后,缓存里面旧的Frame就会丢弃不进行播放。
  • double pts; 由AVFrame的pts转换得来,播放时间,单位是 秒。
  • double duration; 持续时间,由 frame_rate 帧率计算得到,单位是 秒。
  • int64_t pos; 等于 AVFrame::pkt_pos。
  • int width; 等于 AVFrame::width
  • int height; 等于 AVFrame::height
  • int format; 等于 AVFrame::format
  • AVRational sar; 等于 AVFrame::sample_aspect_ratio。 sar 这个变量需要仔细讲解一下,我刚开始也被这个sar搞懵。我之前以为 sar 等于 width/height 。后来发现不是。其实sar 是以前的显示设备设计的历史遗留问题,不用过多关注,只需要知道,显示的时候用 sar 这个比例拉伸width 跟height 作为显示窗口,图像播放就不会扭曲了。推荐阅读,ffmpeg解析出的视频参数PAR,DAR,SAR的意义 跟 theory-videoaspectratios
  • int uploaded; uploaded只对视频帧有效,音频帧没用。当前AVFrame的数据是否已经渲染到 VideoState::vid_texture ,vid_texture 是一个 SDL_Texture 结构。视频帧为什么要定义这么一个变量uploaded呢?是因为音视频同步有时候需要重复播放上一帧视频,上一帧如果已经拷贝过给 SDL_Texture 了,uploaded 就会置为 1,就可以直接把 VideoState::vid_texture 丢给 SDL 的render渲染就行,节省开销。
  • int flip_v; 貌似是控制播放翻转的,AVFrame::linesize 如果是负数,flip_v 就是 1。不用特别关注。

接着介绍一下 struct FrameQueue 结构体里面各个成员的作用。

  • Frame queue[FRAME_QUEUE_SIZE] ; Frame 静态数组,用来存储多个Frame,形成队列,FRAME_QUEUE_SIZE等于16。
  • int rindex; 读索引,当前读取到那个Frame,通过 queue[rindex] 可以取出 Frame。(实际上还有一个 rindex_shown,这个变量后续讲解)
  • int windex; 写索引,通过 queue[windex] 判断解码出来的AVFrame 应该写到哪里。
  • int size; 当前队列已经缓存了多少个 Frame。
  • int max_size; 队列最多可缓存多少 Frame,max_size 可以 小于 FRAME_QUEUE_SIZE。
  • int keep_last; 播放之后是否保存上一帧在队列里面不销毁
  • int rindex_shown; 需要重点讲解
  • *SDL_mutex mutex; 锁,队列修改的时候需要加锁。
  • *SDL_cond cond; 条件变量,用于解码线程跟播放线程通信。例如如果 FrameQueue 数据满了,没法再写就会加锁,然后wait cond等待这个条件变量被唤醒。那这个条件变量什么时候会被唤醒呢?播放的时候需要取 FrameQueue 的数据出来播放,播放完后销毁一帧数据,这时候 FrameQueue 数据就不满了,就会 signal cond,通知解码线程继续解码,继续写 FrameQueue 。相反,如果 FrameQueue 数据空了,播放线程也会加锁,然后wait cond等待这个条件变量被唤,解码线程有数据写入 FrameQueue 了,就会通过 cond 唤醒播放线程继续播放。
  • *PacketQueue pktq; 对应的 Packet 队列,frame 都是从 packet 解码出来的。

FrameQueue 里面的 keep_lastrindex_shown 这两个变量比较难懂,我仔细讲解一下。keep_last 其实是一个临时变量,他的作用是控制 rindex_shown 变成 1。rindex_shown 这个变量名我个人认为起的不太好,我一眼看这个变量没法看出他是做什么的。或者说这个逻辑本身就复杂,跟变量命名无关。

keep_last 是如何控制 rindex_shown 变成 1 的呢,请看下面代码。

static void frame_queue_next(FrameQueue *f)
{if (f->keep_last && !f->rindex_shown) {f->rindex_shown = 1; //注意这行代码。return;}frame_queue_unref_item(&f->queue[f->rindex]);if (++f->rindex == f->max_size)  //注意这行代码。f->rindex = 0;SDL_LockMutex(f->mutex);f->size--;SDL_CondSignal(f->cond);SDL_UnlockMutex(f->mutex);
}

可以看到 f->keep_last && !f->rindex_shown 会导致 rindex_show 置为 1,然后就return 了,没有执行后面的 frame_queue_unref_item()++f->rindex 也没有执行,也就是说 rindex 读索引没有偏移。

到这里,读者可能会有疑惑,如果 rindex 读索引没有偏移,下次用 queue[rindex] 的方式读下一帧不就读不到了吗?

对,queue[rindex] 确实读不到下一帧,所以ffplay 读取队列帧用的是 queue[ rindex + rindex_shown ]

分析到这里,可能读者到这里还是不太理解,我举个例子。

假如现在播放线程从 FrameQueue 里面取第一帧出来播放,因为是第一帧,所以 rindex_shown 此时是 0,rindex 也是 0。queue[ rindex + rindex_shown ]

这样确实取出来的是 0 索引的Frame。播放完之后,就会调 frame_queue_next() 函数,因为是第一次调 frame_queue_next(),所以就跑进去 if (f->keep_last && !f->rindex_shown) 这个条件,然后return,第一帧的frame数据没有销毁, rindex 读索引也没有偏移,但是,但是 rindex_shown 变成 1了,queue[ rindex + rindex_shown ] 就能正确读到 第二帧了。

其实源代码读取播放帧 真正的用法 是 queue[ (rindex + rindex_shown) % f->max_size] ,里面还有 % f->max_size 操作,这是个回环处理。例如如果 rindex 已经递增成 16 ,max_size 是16,那 16%16 ,取余数。就是0,rindex再+1,17%16,余数就是1。

这个就是 keep_lastrindex_shown 的作用,保存播放的上一帧在队列里面。那保存在队列里面有什么用呢?用视频流举例,当SDL窗口变小的时候,ffplay 可以取上一帧frame,重新渲染 texture 来适应缩小后的窗口大小。

还有一个注意的地方是,字幕流没有用到 keep_last 跟 rindex_shown,音频流好像也是没用到 keep_last 跟 rindex_shown,虽然音频流初始化队列的时候把 keep_last 设置为1,我个人感觉好像只有视频流用到 keep_last 跟 rindex_shown。

下面是初始化 Frame 队列代码,注意看最后一个参数 keep_last 是1 还是 0。

if (frame_queue_init(&is->pictq, &is->videoq, VIDEO_PICTURE_QUEUE_SIZE, 1) < 0)goto fail;
if (frame_queue_init(&is->subpq, &is->subtitleq, SUBPICTURE_QUEUE_SIZE, 0) < 0)goto fail;
if (frame_queue_init(&is->sampq, &is->audioq, SAMPLE_QUEUE_SIZE, 1) < 0)goto fail;

好了,分析到这里,一部分的数据结构已经分析完毕,文章开头的 frame_queue_init() 自行看代码即可理解,就是一些变量赋值。

然后 **stream_open() **后面的 init_clock() 初始化时钟,本文暂时不详细分析时钟,先简单介绍时钟的作用,clock 是用来控制音视频同步的,如果只播放视频,实际上clock这个结构体是没用的,只播放音频也是。视频就按照帧率播放,音频就按照采样率播放就行。但如果音视频同时播放,时间长了会产生不同步,至于为什么会不同步,自行百度,答案太多了,我不粘贴了。

stream_open() 函数的最后 调用了SDL_CreateThread 创建一个新的线程,read_thread,这是第二个线程。

is->read_tid     = SDL_CreateThread(read_thread, "read_thread", is);

read_thread() 函数下篇文章再继续分析。


ffplay 源码分析,stream_open() 分析完毕。

©版权所属:弦外之音。

由于笔者的水平有限, 加之编写的同时还要参与开发工作,文中难免会出现一些错误或者不准确的地方,恳请读者批评指正。

这篇关于FFplay源码分析-streams_open的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1088869

相关文章

Android 缓存日志Logcat导出与分析最佳实践

《Android缓存日志Logcat导出与分析最佳实践》本文全面介绍AndroidLogcat缓存日志的导出与分析方法,涵盖按进程、缓冲区类型及日志级别过滤,自动化工具使用,常见问题解决方案和最佳实... 目录android 缓存日志(Logcat)导出与分析全攻略为什么要导出缓存日志?按需过滤导出1. 按

Linux中的HTTPS协议原理分析

《Linux中的HTTPS协议原理分析》文章解释了HTTPS的必要性:HTTP明文传输易被篡改和劫持,HTTPS通过非对称加密协商对称密钥、CA证书认证和混合加密机制,有效防范中间人攻击,保障通信安全... 目录一、什么是加密和解密?二、为什么需要加密?三、常见的加密方式3.1 对称加密3.2非对称加密四、

MySQL中读写分离方案对比分析与选型建议

《MySQL中读写分离方案对比分析与选型建议》MySQL读写分离是提升数据库可用性和性能的常见手段,本文将围绕现实生产环境中常见的几种读写分离模式进行系统对比,希望对大家有所帮助... 目录一、问题背景介绍二、多种解决方案对比2.1 原生mysql主从复制2.2 Proxy层中间件:ProxySQL2.3

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

Olingo分析和实践之EDM 辅助序列化器详解(最佳实践)

《Olingo分析和实践之EDM辅助序列化器详解(最佳实践)》EDM辅助序列化器是ApacheOlingoOData框架中无需完整EDM模型的智能序列化工具,通过运行时类型推断实现灵活数据转换,适用... 目录概念与定义什么是 EDM 辅助序列化器?核心概念设计目标核心特点1. EDM 信息可选2. 智能类

Olingo分析和实践之OData框架核心组件初始化(关键步骤)

《Olingo分析和实践之OData框架核心组件初始化(关键步骤)》ODataSpringBootService通过初始化OData实例和服务元数据,构建框架核心能力与数据模型结构,实现序列化、URI... 目录概述第一步:OData实例创建1.1 OData.newInstance() 详细分析1.1.1