FFmpeg中overlay滤镜用法-水印及画中画

2024-05-04 03:32

本文主要是介绍FFmpeg中overlay滤镜用法-水印及画中画,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

本文为作者原创,转载请注明出处:https://www.cnblogs.com/leisure_chn/p/10434209.html

1. overlay技术简介

overlay技术又称视频叠加技术。overlay视频技术使用非常广泛,常见的例子有,电视屏幕右上角显示的电视台台标,以及画中画功能,画中画是指在一个大的视频播放窗口中还存在一个小播放窗口,两个窗口不同的视频内容同时播放。

overlay技术中涉及两个窗口,通常把较大的窗口称作背景窗口,较小的窗口称作前景窗口,背景窗口或前景窗口里都可以播放视频或显示图片。FFmpeg中使用overlay滤镜可实现视频叠加技术。

overlay滤镜说明如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
描述:前景窗口(第二输入)覆盖在背景窗口(第一输入)的指定位置。语法:overlay[=x:y[[:rgb={0, 1}]] 参数x和y是可选的,默认为0。rgb参数是可选的,其值为0或1,默认为0。参数说明:x               从左上角的水平坐标,默认值为0y               从左上角的垂直坐标,默认值为0rgb             值为0表示输入颜色空间不改变,默认为0;值为1表示将输入的颜色空间设置为RGB变量说明:如下变量可用在x和y的表达式中main_w或W       主输入(背景窗口)宽度main_h或H       主输入(背景窗口)高度overlay_w或w    overlay输入(前景窗口)宽度overlay_h或h    overlay输入(前景窗口)高度

overlay滤镜相关参数示意图如下:

2. 命令行用法

可先参考“FFmpeg使用基础”了解命令行用法基础

overlay命令行基本格式如下:

ffmpeg -i input1 -i input2 -filter_complex overlay=x:y output

input1是背景窗口输入源,input2是前景窗口输入源。

2.1 视频中叠加图标

背景窗口视频素材下载:ring.mp4

视频分辨率是768x432(此分辨率适用于平板电脑,宽高比为16:9),上下黑边的像素高度是56,播放时长为37.97秒。关于分辨率与黑边的相关内容可参考如下:
为什么很多人把视频上下加黑条当做“电影感”?
用于编码视频文件的视频预设

前景窗口图标素材下载:ring_100x87.png
ring.png
图标分辨率是100x87。图标格式为PNG格式,当然选用其他格式的图片作图标也是可以的,但PNG图标具有透明背景,更适合用作图标。

2.1.1 直接叠加图标

将图标叠加于视频右上角

ffmpeg -i ring.mp4 -i ring_100x87.png -filter_complex overlay=W-w:56 -max_muxing_queue_size 1024 ring_logo_t.mp4

效果如下:

将图标叠加于视频右下角

ffmpeg -i ring.mp4 -i ring_100x87.png -filter_complex overlay=W-w:H-h-56 -max_muxing_queue_size 1024 ring_logo_b.mp4

效果如下:

2.1.2 延时叠加图标

如下,背景窗口播放8.6秒后,图标开始显示。注意“-itsoffset 8.6”作为第二个输入文件的输入选项,参数位置不能放错。

ffmpeg -i ring.mp4 -itsoffset 8.6 -i ring_100x87.png -filter_complex overlay=W-w:56 -max_muxing_queue_size 1024 ring_logo_delay.mp4

2.2 视频中叠加视频——画中画

视频中叠加视频即为画中画功能。注意两个视频仅图像部分会叠加在一起,声音是不会叠加的,有一个视频的声音会消失。

2.2.1 叠加计时器

找一个计时器小视频,将之叠加到背景视频上。我们可以从测试源中获取这个计时器视频。先运行如下命令:

ffplay -f lavfi -i testsrc

视频无法贴在本文里,那运行截图命令,从视频中截取一张图:

ffmpeg -ss 00:00:12 -f lavfi -i testsrc -frames:v 1 -f image2 testsrc.jpg

效果如下:
testsrc.jpg

我们把计时器那一小块视频裁剪下来,运行如下命令:

ffmpeg -ss 00:00:10 -t 20 -f lavfi -i testsrc -vf crop=61:52:224:94 timer.h264

此命令主要用到了crop视频滤镜,说明一下:
“-vf crop=61:52:224:94”表示裁剪一块位于(224,94)坐标处宽为61像素高为52像素的视频块
“-ss 00:00:10 -t 20”表示从10秒处开始裁剪,裁剪时长为20秒

将计时器视频timer.h264叠加到背景视频ring.mp4里:

ffmpeg -i ring.mp4 -i timer.h264 -filter_complex overlay=W-w:0 -max_muxing_queue_size 1024 ring_timer.mp4

效果如下:

看一下视频叠加过程中FFmpeg在控制台中的打印信息,关注流的处理:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
$ ffmpeg -i ring.mp4 -i timer.h264 -filter_complex overlay=W-w:0 -max_muxing_queue_size 1024 ring_timer.mp4
......
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'ring.mp4':Metadata:......Duration: 00:00:37.97, start: 0.032000, bitrate: 515 kb/sStream #0:0(chi): Video: h264 (avc1 / 0x31637661), none, 768x432, 488 kb/s, 23 fps, 23 tbr, 23k tbn, 46k tbc (default)Metadata:handler_name    : 1348358526.h264#video:fps=23 - Imported with GPAC 0.5.1-DEV-rev4127Stream #0:1(chi): Audio: aac (HE-AAC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 95 kb/s (default)Metadata:handler_name    : GPAC ISO Audio Handler
Input #1, h264, from 'timer.h264':Duration: N/A, bitrate: N/AStream #1:0: Video: h264 (High 4:4:4 Predictive), yuv444p(progressive), 61x52 [SAR 1:1 DAR 61:52], 25 fps, 25 tbr, 1200k tbn, 50 tbc
Stream mapping:Stream #0:0 (h264) -> overlay:main (graph 0)Stream #1:0 (h264) -> overlay:overlay (graph 0)overlay (graph 0) -> Stream #0:0 (libx264)Stream #0:1 -> #0:1 (aac (native) -> aac (native))
......

看“Stream mapping”部分可以看出:
输入源1视频流(Stream #0:0)和输入源2视频流(Stream #1:0)叠加到输出视频流(Stream #0:0)
输入源1音频流(Stream #0:1)拷贝到输出音频流(Stream #0:1)

视频开始几秒处播放有些异常,声音播放几秒后图像才开始播放,原因不太清楚。

3. API用法

使用滤镜API编程,解析不同的滤镜选项,以达到和命令行中输入命令同样的效果。

例程使用“FFmpeg滤镜API用法与实例解析”中第4.2节的示例程序
代码目录https://github.com/leichn/exercises/blob/master/source/ffmpeg/ffmpeg_vfilter/
下载代码,进入代码目录,在命令行运行make vf_file命令,将生成vf_file可执行文件
在命令行运行./vf_file ring.flv -vf "movie=ring_100x87.png[logo];[in][logo]overlay=W-w:56"
测试效果为:

因为例程尚不支持多输入的方式,所以上述测试命令中借助了movie滤镜来加载第二个输入,这条命令和下面这条命令效果是一样的
ffplay ring.mp4 -i ring_100x87.png -filter_complex overlay=W-w:56

4. 遗留问题

第3节例程不支持多输入方式,借助了movie滤镜变通实现,多输入情况下API如何编程?待分析如下命令中多输入选项的解析处理方式:
ffplay ring.mp4 -i ring_100x87.png -filter_complex overlay=W-w:56

5. 参考资料

[1] 为什么很多人把视频上下加黑条当做“电影感”?
[2] 用于编码视频文件的视频预设

6. 修改记录

2019-02-16 V1.0 首次整理

分类: ffmpeg, 音视频开发

https://www.cnblogs.com/leisure_chn/p/10434209.html

 

这篇关于FFmpeg中overlay滤镜用法-水印及画中画的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/958252

相关文章

#error用法

/* *检查编译此源文件的编译器是不是C++编译器 *如果使用的是C语言编译器则执行#error命令 *如果使用的是 C++ 编译器则跳过#error命令 */ #ifndef __cplusplus #error 亲,您当前使用的不是C++编译器噢! #endif #include <stdio.h> int main() {

SQL Server中,isnull()函数以及null的用法

SQL Serve中的isnull()函数:          isnull(value1,value2)         1、value1与value2的数据类型必须一致。         2、如果value1的值不为null,结果返回value1。         3、如果value1为null,结果返回vaule2的值。vaule2是你设定的值。        如

tensorboard-----summary用法总结

Tensorflow学习笔记——Summary用法         最近在研究tensorflow自带的例程speech_command,顺便学习tensorflow的一些基本用法。 其中tensorboard 作为一款可视化神器,可以说是学习tensorflow时模型训练以及参数可视化的法宝。 而在训练过程中,主要用到了tf.summary()的各类方法,能够保存训练过程以及参数分布图并在

vscode-创建vue3项目-修改暗黑主题-常见错误-element插件标签-用法涉及问题

文章目录 1.vscode创建运行编译vue3项目2.添加项目资源3.添加element-plus元素4.修改为暗黑主题4.1.在main.js主文件中引入暗黑样式4.2.添加自定义样式文件4.3.html页面html标签添加样式 5.常见错误5.1.未使用变量5.2.关闭typescript检查5.3.调试器支持5.4.允许未到达代码和未定义代码 6.element常用标签6.1.下拉列表

YTKKeyValueStore用法

iOS端的尝试 后来我从后台转做iOS端的开发,我就尝试了在iOS端直接使用Key-Value式的存储。经过在粉笔网、猿题库、小猿搜题三个客户端中的尝试后,我发现Key-Value式的存储不但完全能够满足大多数移动端开发的需求,而且非常适合移动端采用。主要原因是:移动端存储的数据量不会很大: 如果是单机的应用(例如效率工具Clear),用户自己一个人创建的数据最多也就上万条。 如果

redis高级用法

redis 慢日志查询 配置参数 slowlog-log-slower-than 10000 #单位微秒 slowlog-max-len 选项指定服务器最多保存多少条慢查询日志 redis-cli slowlog get #获取慢日志1) 1) (integer) 4 # 日志的唯一标识符(uid)2) (integer) 1378781447 # 命令执

Log4j用法

日志是应用软件中不可缺少的部分,Apache的开源项目Log4j是一个功能强大的日志组件,提供方便的日志记录,具体请参考Log4j文档指南。 Log4j下载 在apache网站,可以免费下载到Log4j最新版本的软件包 Apache log4j  (推荐) Apache log4j 2 Log4j的包下载完成后,解压,将其中打包好的的log4j-1.x.x.jar导入你的工程

sql之top用法

TOP 子句 TOP 子句用于规定要返回的记录的数目。 对于拥有数千条记录的大型表来说,TOP 子句是非常有用的。 注释: 并非所有的数据库系统都支持 TOP 子句。 SQL Server 的语法: SELECT TOP number|percent column_name(s)FROM table_name MySQL 和 Oracle 中的 SQL SELECT TOP 是等价的 M

基于ZYNQ7000的交叉编译工具链Qt+OpenCV+ffmpeg等库支持总结

最近刚刚接触XILINX的ZYNQ板,刚接触没有十天。XILINX定位它为SOC,我也很认同,起码比TI定位MPU为SOC强很多。据说今年TI的最新产品也加入了ZYNQ板。 之前的MIPS处理器设计与实现的项目就算做告一段落,搞了将近7个月,成果显著,收获颇多,最近打算搞搞ZYNQ。 之前MIPS也有一套交叉编译工具,不过是老师提供的,自己也尝试搞了搞,太辛苦了,而且也没什么成果,因为我

FFmpeg源码:ff_ctz / ff_ctz_c函数分析

一、ff_ctz函数的作用 ff_ctz定义在FFmpeg源码目录的libavutil/intmath.h 下: #ifndef ff_ctz#define ff_ctz ff_ctz_c/*** Trailing zero bit count.** @param v input value. If v is 0, the result is undefined.* @return