记一次因为丢帧导致视频播放花屏问题的排查

2024-02-20 14:38

本文主要是介绍记一次因为丢帧导致视频播放花屏问题的排查,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

记一次因为丢帧导致视频播放花屏问题的排查
问题背景:
最近开发了一个HLS服务,主要是满足用户在浏览器上播放直播和点播视频的需求,特别像小程序或者微信这种,只有有链接就能查看视频,也不用装APP,还是方便不少。在开发过程中排查了一次花屏问题,感觉比较典型,分享下排查思路,其实这种问题排查思路在前文讲过,这篇就是对这篇文章中提出思路的实践。
问题现象:
HLS服务上线后,用VLC或者浏览器播放视频时,总是在首屏出现局部花屏或者马赛克现象,虽然后面偶尔也会出现一下,但是概率远远没有首屏这么高。首屏出现不仅仅影响了首屏速度,影响体验也不好,用户刚打开链接就看到花屏,也有点说不过去。
当时时间比较紧张,就是将一个切片丢掉,然后从第二个开始播放。虽然花屏绿屏问题消失了,但是首屏速度影响非常大,所以还是要彻底解决,不能使用这个临时规避方案。
分析思路:
为了让大家看清排查过程,画个简单示意图,说明下码流的传输过程:
注:
=1. 设备侧主要是就是推流端,各种摄像头IPC、国标平台、NVR等能产生码流的软硬件设备和服务器,码流格式的RTP+PS+H.264俗称国标流;
2. 公有云就是开发平台上的各种流媒体服务器,其中GB接入服务器通过标准协议对接软硬件设备,将国标流转成我们公司私有流,流媒体服务器做私有流分发,HLS服务支持客户端浏览器HLS协议拉流,同时将私有Raw流转成TS流;
3. 用户侧凡是支持HLS协议的浏览器或者小程序都可以使用正确的URL来进行拉流观看视频。
既然码流在用户侧的浏览器播放存在花屏问题,那么通过上面示意图我们将设备上来的码流各个传输阶段写成码流文件进行分析,如果在哪一步出现问题,则将问题定位在具体的码流处理模块中,再结合代码分析出码流到底在哪一步出现了问题。
排查步骤:
下面我在各个模块增加了写文件调试功能,将码流每个过程中生成的文件写下来,用分析工具进行播放和分析。我们摄像机设备端配置的帧率是25,I帧间隔是50,那就意味着2s一个GOP。实际TS切片时,也是以GOP为单元进行切片,一个TS文件大小在两个GOP左右,既然首屏的第一个TS文件出现大概率花屏问题,那就先分析前两个GOP的帧情况:
步骤1:
既然HLS服务返回给客户端播放的视频出现了花屏和绿屏,那先分析生成的第一个TS文件码流是否正常:
发现逐帧播放时,从第5帧开始出现花屏,同时发现TS里面的PTS时间从13500增加到36000,实际每个增加正常情况是3600左右,基本初步判断有视频帧丢掉导致,因为P帧的播放可能要参考前面的I帧和P帧,假设参考帧丢掉,后面P帧播放就会出现花屏,同时再用StreamEye工具分析这个TS的确如此:
工具分析发现每个GOP里面只有43帧,和设备端配置的50帧一个GOP缺少7帧,下面就继续在分析GOP里面为50时出现在那个模块,这样将问题缩小化;
步骤2:
PS流是国标接入服务器收到码流后,除去RTP头后些下来的文件,用专业软件逐帧播放和Elecard StreamEye分析:
通过分析发现前两个GOP文件播放都是正常的,那说明设备送上来的国标流是没有啥大问题的
步骤3:
PS流后面就是国标接入服务器转化成我们内部的私有流,分析同样也是正常的,因为这块已经把H264文件提取出来了,分析后发现都是可以正常播放的。
步骤4:
既然国标接入服务器收流和转封装私有流都正常,但是HLS拉流切片出来的第一个TS切片缺少了几帧,那么问题肯定出现在国标接入服务器以上到HLSTS拉流服务器之间。
步骤5:
通过流媒体分发服务器同学定位,说自己收到国标接入服务器的第一个GOP就是43帧,而且几乎必现,后面通过回溯国标接入网关向流媒体分发服务器推流这块的代码发现内部在推流过程中做了是否有音频的判断,其中这块判断逻辑影响了前几帧视频的发送,最终调整这块处理逻辑问题得到解决。
结论:
这种因为网络或者音视频数据本身导致的花屏、绿屏问题,排查起来基本思路就是分阶段排查,摸清码流的传输路径,在关键地方写文件或者打日志,通过专业音视频分析工具,把问题定位到模块内部或者模块之间的边界上。模块内部一般分析代码对码流的具体处理,模块之间通过抓包把问题因为传输导致的原因排除掉,通过以上定位问题思路就能分析出视频播放的各种疑难杂症。

这篇关于记一次因为丢帧导致视频播放花屏问题的排查的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/728547

相关文章

mybatis和mybatis-plus设置值为null不起作用问题及解决

《mybatis和mybatis-plus设置值为null不起作用问题及解决》Mybatis-Plus的FieldStrategy主要用于控制新增、更新和查询时对空值的处理策略,通过配置不同的策略类型... 目录MyBATis-plusFieldStrategy作用FieldStrategy类型每种策略的作

linux下多个硬盘划分到同一挂载点问题

《linux下多个硬盘划分到同一挂载点问题》在Linux系统中,将多个硬盘划分到同一挂载点需要通过逻辑卷管理(LVM)来实现,首先,需要将物理存储设备(如硬盘分区)创建为物理卷,然后,将这些物理卷组成... 目录linux下多个硬盘划分到同一挂载点需要明确的几个概念硬盘插上默认的是非lvm总结Linux下多

Python Jupyter Notebook导包报错问题及解决

《PythonJupyterNotebook导包报错问题及解决》在conda环境中安装包后,JupyterNotebook导入时出现ImportError,可能是由于包版本不对应或版本太高,解决方... 目录问题解决方法重新安装Jupyter NoteBook 更改Kernel总结问题在conda上安装了

pip install jupyterlab失败的原因问题及探索

《pipinstalljupyterlab失败的原因问题及探索》在学习Yolo模型时,尝试安装JupyterLab但遇到错误,错误提示缺少Rust和Cargo编译环境,因为pywinpty包需要它... 目录背景问题解决方案总结背景最近在学习Yolo模型,然后其中要下载jupyter(有点LSVmu像一个

解决jupyterLab打开后出现Config option `template_path`not recognized by `ExporterCollapsibleHeadings`问题

《解决jupyterLab打开后出现Configoption`template_path`notrecognizedby`ExporterCollapsibleHeadings`问题》在Ju... 目录jupyterLab打开后出现“templandroidate_path”相关问题这是 tensorflo

如何解决Pycharm编辑内容时有光标的问题

《如何解决Pycharm编辑内容时有光标的问题》文章介绍了如何在PyCharm中配置VimEmulator插件,包括检查插件是否已安装、下载插件以及安装IdeaVim插件的步骤... 目录Pycharm编辑内容时有光标1.如果Vim Emulator前面有对勾2.www.chinasem.cn如果tools工

最长公共子序列问题的深度分析与Java实现方式

《最长公共子序列问题的深度分析与Java实现方式》本文详细介绍了最长公共子序列(LCS)问题,包括其概念、暴力解法、动态规划解法,并提供了Java代码实现,暴力解法虽然简单,但在大数据处理中效率较低,... 目录最长公共子序列问题概述问题理解与示例分析暴力解法思路与示例代码动态规划解法DP 表的构建与意义动

Java多线程父线程向子线程传值问题及解决

《Java多线程父线程向子线程传值问题及解决》文章总结了5种解决父子之间数据传递困扰的解决方案,包括ThreadLocal+TaskDecorator、UserUtils、CustomTaskDeco... 目录1 背景2 ThreadLocal+TaskDecorator3 RequestContextH

关于Spring @Bean 相同加载顺序不同结果不同的问题记录

《关于Spring@Bean相同加载顺序不同结果不同的问题记录》本文主要探讨了在Spring5.1.3.RELEASE版本下,当有两个全注解类定义相同类型的Bean时,由于加载顺序不同,最终生成的... 目录问题说明测试输出1测试输出2@Bean注解的BeanDefiChina编程nition加入时机总结问题说明

关于最长递增子序列问题概述

《关于最长递增子序列问题概述》本文详细介绍了最长递增子序列问题的定义及两种优化解法:贪心+二分查找和动态规划+状态压缩,贪心+二分查找时间复杂度为O(nlogn),通过维护一个有序的“尾巴”数组来高效... 一、最长递增子序列问题概述1. 问题定义给定一个整数序列,例如 nums = [10, 9, 2