泊松图像编辑/融合（Possion image editing）的原理与数值解算法

本文主要是介绍泊松图像编辑/融合（Possion image editing）的原理与数值解算法，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

泊松图像融合是目前融合算法的标杆，泊松图像编辑不仅可以用于图像融合，还可以用于风格迁移、插入透明物体、局部亮度/颜色调制等。网上有不少介绍泊松图像融合算法的文章，但基本表都刻意淡化了其理论推导，着重去讲其实现，让人读完还是只知其然而不知其所以然，甚至连知其然都做不到。这里我将尝试从原理到实现系统地讲一讲泊松图像编辑/融合技术。（注：本文源于对http://www.ipol.im/pub/art/2016/163/上“Possion image editing”论文与源码的解读，读者可以自行从上面下载论文和代码）

泊松图像编辑的原理说来也不复杂，其实就是在满足一定边界的条件下让待求解二维函数 $f$ 在区域 $\Omega$ 中的梯度场与参考梯度场 $\boldsymbol{\mathbf{v}}$ 尽可能相似，这种相似度最大化用差值的二阶范数最小化来表征，而这个边界条件就是函数值在边界上与目标图像 $f^{*}$ 的的取值相等，这就是所谓的狄利克雷边界条件。用数学方式表示就是：

其解满足欧拉——拉格朗日方程：

该方程就是所谓的泊松方程。关于散度的理解可以参考https://blog.csdn.net/weixin_41923961/article/details/85225757。对于 $\Omega$ 与图像外边缘 $\partial R$ 相交的特殊情况<注：对此特殊况不感兴趣的可以直接跳过>，狄利克雷边界条件被 $\Omega \cup \partial R$ 上的纽曼边界条件（即边界处导数为0）替代，也就是相当于对图像进行了边缘复制性外扩。

前述泊松方程的矩阵表示为：

其中， $D_x$ 、 $D_y$ 的形式与我先前的博客https://blog.csdn.net/u014230360/article/details/107639764里的相似，但 $\Omega$ 以外区域的对应行都是零值行！ $f$ 、 $v_x$ 、 $v_y$ 分别是待求解图像、参考梯度场x分量、参考梯度场y分量的向量化表示。以一个4*4的图像示意，拉普拉斯矩阵 $L$ 的形式如下图所示（第一行两个1的外框颜色反了，图是从论文中截取的）。

也就是说，L在 $\Omega$ 与图像外边缘 $\partial R$ 不相交的时候， $L$ 中对应于 $\Omega$ 的每一行的非零元素都是1、1、-4、1、1（注意，是对应于 $\Omega$ 的行才是非零行！）。当出现 $\Omega$ 与图像外边缘 $\partial R$ 相交的特殊情况时，由于交集上的点的像素值由 $\Omega$ 上的点的像素值复制而来，此时中对应坐标的 $Z$ 值被 $Z_{x,y}$ 替代，也就出现了上图中的情况。