FFmpeg中overlay滤镜用法-水印及画中画

2024-05-04 03:32

本文主要是介绍FFmpeg中overlay滤镜用法-水印及画中画,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

本文为作者原创,转载请注明出处:https://www.cnblogs.com/leisure_chn/p/10434209.html

1. overlay技术简介

overlay技术又称视频叠加技术。overlay视频技术使用非常广泛,常见的例子有,电视屏幕右上角显示的电视台台标,以及画中画功能,画中画是指在一个大的视频播放窗口中还存在一个小播放窗口,两个窗口不同的视频内容同时播放。

overlay技术中涉及两个窗口,通常把较大的窗口称作背景窗口,较小的窗口称作前景窗口,背景窗口或前景窗口里都可以播放视频或显示图片。FFmpeg中使用overlay滤镜可实现视频叠加技术。

overlay滤镜说明如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
描述:前景窗口(第二输入)覆盖在背景窗口(第一输入)的指定位置。语法:overlay[=x:y[[:rgb={0, 1}]] 参数x和y是可选的,默认为0。rgb参数是可选的,其值为0或1,默认为0。参数说明:x               从左上角的水平坐标,默认值为0y               从左上角的垂直坐标,默认值为0rgb             值为0表示输入颜色空间不改变,默认为0;值为1表示将输入的颜色空间设置为RGB变量说明:如下变量可用在x和y的表达式中main_w或W       主输入(背景窗口)宽度main_h或H       主输入(背景窗口)高度overlay_w或w    overlay输入(前景窗口)宽度overlay_h或h    overlay输入(前景窗口)高度

overlay滤镜相关参数示意图如下:

2. 命令行用法

可先参考“FFmpeg使用基础”了解命令行用法基础

overlay命令行基本格式如下:

ffmpeg -i input1 -i input2 -filter_complex overlay=x:y output

input1是背景窗口输入源,input2是前景窗口输入源。

2.1 视频中叠加图标

背景窗口视频素材下载:ring.mp4

视频分辨率是768x432(此分辨率适用于平板电脑,宽高比为16:9),上下黑边的像素高度是56,播放时长为37.97秒。关于分辨率与黑边的相关内容可参考如下:
为什么很多人把视频上下加黑条当做“电影感”?
用于编码视频文件的视频预设

前景窗口图标素材下载:ring_100x87.png
ring.png
图标分辨率是100x87。图标格式为PNG格式,当然选用其他格式的图片作图标也是可以的,但PNG图标具有透明背景,更适合用作图标。

2.1.1 直接叠加图标

将图标叠加于视频右上角

ffmpeg -i ring.mp4 -i ring_100x87.png -filter_complex overlay=W-w:56 -max_muxing_queue_size 1024 ring_logo_t.mp4

效果如下:

将图标叠加于视频右下角

ffmpeg -i ring.mp4 -i ring_100x87.png -filter_complex overlay=W-w:H-h-56 -max_muxing_queue_size 1024 ring_logo_b.mp4

效果如下:

2.1.2 延时叠加图标

如下,背景窗口播放8.6秒后,图标开始显示。注意“-itsoffset 8.6”作为第二个输入文件的输入选项,参数位置不能放错。

ffmpeg -i ring.mp4 -itsoffset 8.6 -i ring_100x87.png -filter_complex overlay=W-w:56 -max_muxing_queue_size 1024 ring_logo_delay.mp4

2.2 视频中叠加视频——画中画

视频中叠加视频即为画中画功能。注意两个视频仅图像部分会叠加在一起,声音是不会叠加的,有一个视频的声音会消失。

2.2.1 叠加计时器

找一个计时器小视频,将之叠加到背景视频上。我们可以从测试源中获取这个计时器视频。先运行如下命令:

ffplay -f lavfi -i testsrc

视频无法贴在本文里,那运行截图命令,从视频中截取一张图:

ffmpeg -ss 00:00:12 -f lavfi -i testsrc -frames:v 1 -f image2 testsrc.jpg

效果如下:
testsrc.jpg

我们把计时器那一小块视频裁剪下来,运行如下命令:

ffmpeg -ss 00:00:10 -t 20 -f lavfi -i testsrc -vf crop=61:52:224:94 timer.h264

此命令主要用到了crop视频滤镜,说明一下:
“-vf crop=61:52:224:94”表示裁剪一块位于(224,94)坐标处宽为61像素高为52像素的视频块
“-ss 00:00:10 -t 20”表示从10秒处开始裁剪,裁剪时长为20秒

将计时器视频timer.h264叠加到背景视频ring.mp4里:

ffmpeg -i ring.mp4 -i timer.h264 -filter_complex overlay=W-w:0 -max_muxing_queue_size 1024 ring_timer.mp4

效果如下:

看一下视频叠加过程中FFmpeg在控制台中的打印信息,关注流的处理:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
$ ffmpeg -i ring.mp4 -i timer.h264 -filter_complex overlay=W-w:0 -max_muxing_queue_size 1024 ring_timer.mp4
......
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'ring.mp4':Metadata:......Duration: 00:00:37.97, start: 0.032000, bitrate: 515 kb/sStream #0:0(chi): Video: h264 (avc1 / 0x31637661), none, 768x432, 488 kb/s, 23 fps, 23 tbr, 23k tbn, 46k tbc (default)Metadata:handler_name    : 1348358526.h264#video:fps=23 - Imported with GPAC 0.5.1-DEV-rev4127Stream #0:1(chi): Audio: aac (HE-AAC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 95 kb/s (default)Metadata:handler_name    : GPAC ISO Audio Handler
Input #1, h264, from 'timer.h264':Duration: N/A, bitrate: N/AStream #1:0: Video: h264 (High 4:4:4 Predictive), yuv444p(progressive), 61x52 [SAR 1:1 DAR 61:52], 25 fps, 25 tbr, 1200k tbn, 50 tbc
Stream mapping:Stream #0:0 (h264) -> overlay:main (graph 0)Stream #1:0 (h264) -> overlay:overlay (graph 0)overlay (graph 0) -> Stream #0:0 (libx264)Stream #0:1 -> #0:1 (aac (native) -> aac (native))
......

看“Stream mapping”部分可以看出:
输入源1视频流(Stream #0:0)和输入源2视频流(Stream #1:0)叠加到输出视频流(Stream #0:0)
输入源1音频流(Stream #0:1)拷贝到输出音频流(Stream #0:1)

视频开始几秒处播放有些异常,声音播放几秒后图像才开始播放,原因不太清楚。

3. API用法

使用滤镜API编程,解析不同的滤镜选项,以达到和命令行中输入命令同样的效果。

例程使用“FFmpeg滤镜API用法与实例解析”中第4.2节的示例程序
代码目录https://github.com/leichn/exercises/blob/master/source/ffmpeg/ffmpeg_vfilter/
下载代码,进入代码目录,在命令行运行make vf_file命令,将生成vf_file可执行文件
在命令行运行./vf_file ring.flv -vf "movie=ring_100x87.png[logo];[in][logo]overlay=W-w:56"
测试效果为:

因为例程尚不支持多输入的方式,所以上述测试命令中借助了movie滤镜来加载第二个输入,这条命令和下面这条命令效果是一样的
ffplay ring.mp4 -i ring_100x87.png -filter_complex overlay=W-w:56

4. 遗留问题

第3节例程不支持多输入方式,借助了movie滤镜变通实现,多输入情况下API如何编程?待分析如下命令中多输入选项的解析处理方式:
ffplay ring.mp4 -i ring_100x87.png -filter_complex overlay=W-w:56

5. 参考资料

[1] 为什么很多人把视频上下加黑条当做“电影感”?
[2] 用于编码视频文件的视频预设

6. 修改记录

2019-02-16 V1.0 首次整理

分类: ffmpeg, 音视频开发

https://www.cnblogs.com/leisure_chn/p/10434209.html

 

这篇关于FFmpeg中overlay滤镜用法-水印及画中画的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/958252

相关文章

bytes.split的用法和注意事项

当然,我很乐意详细介绍 bytes.Split 的用法和注意事项。这个函数是 Go 标准库中 bytes 包的一个重要组成部分,用于分割字节切片。 基本用法 bytes.Split 的函数签名如下: func Split(s, sep []byte) [][]byte s 是要分割的字节切片sep 是用作分隔符的字节切片返回值是一个二维字节切片,包含分割后的结果 基本使用示例: pa

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以打印WAV音频文件每个packet(也称为数据包或多媒体包)的信息,这些信息包含该packet的pts、dts: 打印出来的“pts”实际是AVPacket结构体中的成员变量pts,是以AVStream->time_base为单位的显

UVM:callback机制的意义和用法

1. 作用         Callback机制在UVM验证平台,最大用处就是为了提高验证平台的可重用性。在不创建复杂的OOP层次结构前提下,针对组件中的某些行为,在其之前后之后,内置一些函数,增加或者修改UVM组件的操作,增加新的功能,从而实现一个环境多个用例。此外还可以通过Callback机制构建异常的测试用例。 2. 使用步骤         (1)在UVM组件中内嵌callback函

这些ES6用法你都会吗?

一 关于取值 取值在程序中非常常见,比如从对象obj中取值 const obj = {a:1b:2c:3d:4} 吐槽: const a = obj.a;const b = obj.b;const c = obj.c;//或者const f = obj.a + obj.b;const g = obj.c + obj.d; 改进:用ES6解构赋值

ffmpeg面向对象-待定

1.常用对象 rtsp拉流第一步都是avformat_open_input,其入参可以看下怎么用: AVFormatContext *fmt_ctx = NULL;result = avformat_open_input(&fmt_ctx, input_filename, NULL, NULL); 其中fmt_ctx 如何分配内存的?如下 int avformat_open_input(

2021-8-14 react笔记-2 创建组件 基本用法

1、目录解析 public中的index.html为入口文件 src目录中文件很乱,先整理文件夹。 新建components 放组件 新建assets放资源   ->/images      ->/css 把乱的文件放进去  修改App.js 根组件和index.js入口文件中的引入路径 2、新建组件 在components文件夹中新建[Name].js文件 //组件名首字母大写

FFmpeg系列-视频解码后保存帧图片为ppm

在正常开发中遇到花屏时怎么处理呢?可以把解码后的数据直接保存成帧图片保存起来,然后直接看图片有没有花屏来排除是否是显示的问题,如果花屏,则代表显示无问题,如果图片中没有花屏,则可以往显示的方向去排查了。 void saveFrame(AVFrame* pFrame, int width, int height, int iFrame){FILE *pFile;char szFilename[

Cmake之3.0版本重要特性及用法实例(十三)

简介: CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布:《Android系统多媒体进阶实战》🚀 优质专栏: Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏: 多媒体系统工程师系列【原创干货持续更新中……】🚀 优质视频课程:AAOS车载系统+AOSP14系统攻城狮入门视频实战课 🚀 人生格言: 人生从来没有捷径,只有行动才是治疗恐惧

关于断言的部分用法

1、带变量的断言  systemVerilog assertion 中variable delay的使用,##[variable],带变量的延时(可变延时)_assertion中的延时-CSDN博客 2、until 的使用 systemVerilog assertion 中until的使用_verilog until-CSDN博客 3、throughout的使用   常用于断言和假设中的

ExpandableListView的基本用法

QQ上的好友列表在Android怎么实现,有一个最简单的方法,那就是ExpandableListView,下面简单介绍一下ExpandableListview的用法。 先看看效果图,没有找到大小合适的图片,所以凑合着看吧。     一、准备工作(界面,和需要的数据)             <? xml   version = "1.0"   encoding =