OpenCV版泊松融合seamlessClone融合结果1像素偏差问题记录与分析

本文主要是介绍OpenCV版泊松融合seamlessClone融合结果1像素偏差问题记录与分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

泊松融合(Poisson Blending)是图像处理领域著名的图像融合算法,自从2003年发表以来,有很多基于此算法的应用和改进研究出现。泊松融合无需像Alpha blending一样的精确抠图就可以得到很自然的结果。

关于泊松融合原理部分的解析见之前的博客《泊松融合原理浅析》。

关于针对OpenCV中泊松融合的实现代码(以normalClone为例)进行解读见之前的博客《OpenCV源码解读:泊松融合seamlessClone(normalClone)》。
在这里插入图片描述
在使用泊松融合OpenCV实现的方法时,需要注意一些细节,否则在某些特定场景下可能出现融合结果有细微差异的问题。

问题

在泊松融合过程中,有一个比较重要的步骤就是计算源图像(记为src)融合到目标图像(记为dst)上的具体位置和大小。

反映到具体实现部分,就是根据传参传入的mask和p计算取的src以及dst的融合部分。OpenCV实现代码如下:
在这里插入图片描述
特别注意这三行代码:

Mat mask_inner = mask(Rect(1, 1, mask.cols - 2, mask.rows - 2));copyMakeBorder(mask_inner, mask, 1, 1, 1, 1, BORDER_ISOLATED | BORDER_CONSTANT, Scalar(0));Rect roi_s = boundingRect(mask);

这三行代码将传入的mask进行了边界处理,将mask的边界用0做了填充,然后调用boundingRect求外接矩形。确保了边界能够正常参与到泊松方程构建。

用于截取src的融合区域的roi_s确定了,随后根据roi_s和传入的点p,计算用于截取dst融合区域的roi_d。

Rect roi_d(p.x - roi_s.width / 2, p.y - roi_s.height / 2, roi_s.width, roi_s.height);

最后根据计算得到的roi_s和roi_d分别从src和dst中截取用于融合的图像区域,以及用于指导融合的mask区域。

Mat destinationROI = dest(roi_d).clone();Mat sourceROI = Mat::zeros(roi_s.height, roi_s.width, src.type());
src(roi_s).copyTo(sourceROI,mask(roi_s));Mat maskROI = mask(roi_s);
Mat recoveredROI = blend(roi_d);

由于这一部分计算在函数cv::seamlessClone中内置,所以需要注意点p的计算。特别是当在用于融合的原始dst和原始src有着一样的size时,点p的计算则需要根据这一内置计算过程和使用的mask特殊处理。

假设这样一种场景,源图像大小为(128, 128, 3),目标图像大小也为(128, 128, 3),mask大小是(128,128)。我们希望将源图像按照给定的mask融合到目标图像上。请注意mask在保证是闭区间的条件下,其边界形状可以是任意的。也就是说其边界像素点可以是矩形(128, 128)内的任意点。这时点p则一般根据mask的外接矩形计算得到,取值通常是矩形长宽的中点。

Rect roi = cv::boundingRect(mask)
Point p = Point(int(roi.x + roi.width / 2), int(roi.y + roi.height / 2))

在绝大多数情况下,特别是只融合单张图片时,融合不会有明显的问题。但是当对视频中某些场景的连续帧都做相同的融合操作时,根据mask计算的点p则可能导致融合结果不自然的问题,在视频中能明显的观察到融合结果抖动的现象。

分析

深入分析,发现在产生抖动的情况下,mask在边界上的表现不一致,部分帧的mask边界在非图像边界上,而部分帧的边界直接到了图像的边界。推测这是导致视频连续帧融合结果抖动的原因。

根据mask计算点p的操作:

Rect roi = cv::boundingRect(mask)
Point p = Point(int(roi.x + roi.width / 2), int(roi.y + roi.height / 2))

以及在函数cv::seamlessClone中内置的mask处理:

Mat mask_inner = mask(Rect(1, 1, mask.cols - 2, mask.rows - 2));copyMakeBorder(mask_inner, mask, 1, 1, 1, 1, BORDER_ISOLATED | BORDER_CONSTANT, Scalar(0));Rect roi_s = boundingRect(mask);Rect roi_d(p.x - roi_s.width / 2, p.y - roi_s.height / 2, roi_s.width, roi_s.height);

试想有下列三种情况(图像Size均为(128,128)):

(1)mask的点在图像的上下左右边界上出现

也就是通过Rect roi = cv::boundingRect(mask)得到的roi为(0,0,128,128),此时点p经过Point p = Point(int(roi.x + roi.width / 2), int(roi.y + roi.height / 2))为(64,64)。

将该mask和点p传入cv::seamlessClone中,mask经过copyMakeBorder处理后图像边界后的点都被清除,计算得到的roi_s为(1,1,126,126)。

根据roi_s和点p计算得到的roi_d为(64-126/2,64-126/2,126,126),即(1,1,126,126)。此时roi_s和roi_d一致,截取的部分一致。

(2)mask的点在图像的上左右三个边界上出现,mask下边界点在图像下边界内1个像素

在这里插入图片描述

此时通过Rect roi = cv::boundingRect(mask)得到的roi为(0,0,127,127),此时点p经过Point p = Point(int(roi.x + roi.width / 2), int(roi.y + roi.height / 2)),由于向下取整值为(63,63)。

将该mask和点p传入cv::seamlessClone中,mask经过copyMakeBorder处理后图像边界后的点都被清除,计算得到的roi_s为(1,1,126,126)。

根据roi_s和点p计算得到的roi_d为(63-126/2,63-126/2,126,126),即(0,0,126,126)。此时roi_s和roi_d不一致,截取的部分不一致。dst上从坐标(0, 0)开始截取,而src上从坐标(1, 1)开始截取。

当视频的前后帧融合mask在(1)和(2)类型间交替时,则融合的结果会出现抖动现象。人眼对这种微小的抖动特别敏感。

(3)mask的边界点均在图像的上下左右边界内1个像素

在这里插入图片描述

此时通过Rect roi = cv::boundingRect(mask)得到的roi为(1,1,126,126),此时点p经过Point p = Point(int(roi.x + roi.width / 2), int(roi.y + roi.height / 2))值为(64,64)。

将该mask和点p传入cv::seamlessClone中,mask经过copyMakeBorder处理后计算得到的roi_s为(1,1,126,126)。

根据roi_s和点p计算得到的roi_d为(64-126/2,64-126/2,126,126),即(1,1,126,126)。此时roi_s和roi_d一致,截取的部分一致。

总结:也就是说如果在src和dst拥有相同Size时,如果直接根据mask的外接矩形计算点p,那么可能因为(1)和(2)情形的间隔出现,导致视频连续帧融合结果抖动。

解决

在分析清楚了问题所在,需要想办法解决这一问题。

不过有一个比较疑惑的问题,就是对于这种1个像素的差异,人眼真的能如此敏感吗?

写个测试脚本来模拟一下这种抖动情况:

# coding: utf-8__author__ = 'TracelessLe'import os
import cv2def cv2_load_material(file_path):"""Load a full list of frames in memory."""cap = cv2.VideoCapture(file_path)frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))fps = cap.get(cv2.CAP_PROP_FPS)res = []while True:ret, frame = cap.read()if ret is False:breakres.append(frame)material = restotal_frames = len(res)cap.release()return material, frame_width, frame_height, fpsdef cv2_output_video(output_imgs, output_file_path, fps, frame_size):size = frame_sizefourcc = cv2.VideoWriter_fourcc('m', 'p', '4', 'v')vout = cv2.VideoWriter()vout.open(output_file_path, fourcc, fps, size, True)for img in output_imgs:vout.write(img)vout.release()# 模拟一个像素的抖动
def monidoudong_1pixel(img_bgr_list):for i, img_bgr in enumerate(img_bgr_list):bbox = img_bgr[250:660,200:460,::]if i%2 == 0:text = f'frame: {i}'cv2.putText(img_bgr, text, (int(100), int(100)),cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 1, cv2.LINE_AA)img_bgr[249:659,200:460,::] = bboxif __name__ == "__main__":####测试单个视频用#####file_path = 'test.mp4' #原视频大小720*1280img_bgr_list, frame_width, frame_height, fps = cv2_load_material(file_path)out_file_path = './out-1pixel.mp4'monidoudong_1pixel(img_bgr_list)cv2_output_video(img_bgr_list, out_file_path, fps, (frame_width, frame_height))

截取抖动区域如下,可以看到脸部存在上下抖动现象:
在这里插入图片描述
在弄清楚原因后,就能知道从什么角度入手解决这种抖动问题。通过保持与cv::seamlessClone函数内部一致的mask处理,避免roi_d和roi_s对应图像区域不一致的问题。
将求点p的代码

Rect roi = cv::boundingRect(mask)
Point p = Point(int(roi.x + roi.width / 2), int(roi.y + roi.height / 2))

改为:

Mat mask_inner = mask(Rect(1, 1, mask.cols - 2, mask.rows - 2));
copyMakeBorder(mask_inner, mask, 1, 1, 1, 1, BORDER_ISOLATED | BORDER_CONSTANT, Scalar(0));
Rect roi = cv::boundingRect(mask)
Point p = Point(int(roi.x + roi.width / 2), int(roi.y + roi.height / 2))
cv::seamlessClone(src_bgr, dst_bgr, mask, p, out_img, cv::NORMAL_CLONE)

其他

在OpenCV的泊松融合使用时,当目标图像特别大的情况下,如果mask不经过和cv::seamlessClone函数内部一致的边界处理,在某些情况下则可能会报如下错误:

terminate called after throwing an instance of 'std::length_error'what():  vector::_M_default_append
Aborted (core dumped)

在这里插入图片描述
在这里插入图片描述
对mask边界进行白边处理能够解决这一问题。

在这里插入图片描述

参考资料

[1] 泊松融合原理浅析
[2] OpenCV源码解读:泊松融合seamlessClone(normalClone)
[3] opencv/modules/photo/src/seamless_cloning.cpp
[4] 图像融合之泊松融合(Possion Matting)
[5] terminate called after throwing an instance of ‘std::length_error’
[6] seamlessClone bug #15294
[7] bug on bounds in OpenCV cv2.seamlessClone
[8] OpenCV cv2.seamlessClone中的错误
[9] 使用FFmpeg生成高清gif图

这篇关于OpenCV版泊松融合seamlessClone融合结果1像素偏差问题记录与分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/922139

相关文章

好题——hdu2522(小数问题:求1/n的第一个循环节)

好喜欢这题,第一次做小数问题,一开始真心没思路,然后参考了网上的一些资料。 知识点***********************************无限不循环小数即无理数,不能写作两整数之比*****************************(一开始没想到,小学没学好) 此题1/n肯定是一个有限循环小数,了解这些后就能做此题了。 按照除法的机制,用一个函数表示出来就可以了,代码如下

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

购买磨轮平衡机时应该注意什么问题和技巧

在购买磨轮平衡机时,您应该注意以下几个关键点: 平衡精度 平衡精度是衡量平衡机性能的核心指标,直接影响到不平衡量的检测与校准的准确性,从而决定磨轮的振动和噪声水平。高精度的平衡机能显著减少振动和噪声,提高磨削加工的精度。 转速范围 宽广的转速范围意味着平衡机能够处理更多种类的磨轮,适应不同的工作条件和规格要求。 振动监测能力 振动监测能力是评估平衡机性能的重要因素。通过传感器实时监

缓存雪崩问题

缓存雪崩是缓存中大量key失效后当高并发到来时导致大量请求到数据库,瞬间耗尽数据库资源,导致数据库无法使用。 解决方案: 1、使用锁进行控制 2、对同一类型信息的key设置不同的过期时间 3、缓存预热 1. 什么是缓存雪崩 缓存雪崩是指在短时间内,大量缓存数据同时失效,导致所有请求直接涌向数据库,瞬间增加数据库的负载压力,可能导致数据库性能下降甚至崩溃。这种情况往往发生在缓存中大量 k

6.1.数据结构-c/c++堆详解下篇(堆排序,TopK问题)

上篇:6.1.数据结构-c/c++模拟实现堆上篇(向下,上调整算法,建堆,增删数据)-CSDN博客 本章重点 1.使用堆来完成堆排序 2.使用堆解决TopK问题 目录 一.堆排序 1.1 思路 1.2 代码 1.3 简单测试 二.TopK问题 2.1 思路(求最小): 2.2 C语言代码(手写堆) 2.3 C++代码(使用优先级队列 priority_queue)

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

Node.js学习记录(二)

目录 一、express 1、初识express 2、安装express 3、创建并启动web服务器 4、监听 GET&POST 请求、响应内容给客户端 5、获取URL中携带的查询参数 6、获取URL中动态参数 7、静态资源托管 二、工具nodemon 三、express路由 1、express中路由 2、路由的匹配 3、路由模块化 4、路由模块添加前缀 四、中间件