Photometric Stereo光度立体三维重建(五)——基于深度学习的PS方法

本文主要是介绍Photometric Stereo光度立体三维重建(五)——基于深度学习的PS方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文将会介绍几种具有代表性的将深度学习与Photometric Stereo进行结合来进行三维重建的方法

一、开山之作 DPSN

论文:Deep Photometric Stereo Network
github:https://github.com/hiroaki-santo/deep-photometric-stereo-network

参数化的郎伯反射模型建立在理想的漫反射假设下,而且只适用于有限种类的材料,这种理想化的假设在实际环境中会受到全局照明以及光线遮挡的影响

论文提出直接用深度神经网络(DNN)来将观察值(像素强度)对表面法向量的映射进行直接建模
在这里插入图片描述
论文中还使用了Dropout来模拟光照被遮挡的影响

在这里插入图片描述
在这里插入图片描述

二、使用无监督学习 IRPS

论文:Neural Inverse Rendering for General Reflectance Photometric Stereo
github:https://github.com/t-taniai/neuralps

在learn-based PS中,会遇到的挑战有:
1、真实物体具有许多复杂以及未知的反射特性
2、训练数据的缺少,很难获取物体表面精确的法向量和BRDFs(也就是GT数据)
3、对输入数据进行任意排列不会改变输出的物体表面法向量

因此作者提出了一种以重构损失为指导的无监督学习方法
在这里插入图片描述
网络分为两个子网络,PSNet用于预测表面的法向量,IRNet使用渲染方程进行观察图像的逆渲染,然后将观测图像和逆渲染图像进行对比获得重构损失,同时网络的损失函数还增加了用最小二乘法算出的法向量以及PSNet预测出的反向量的误差损失,总的损失函数可以表达成:
在这里插入图片描述

三、使用全卷积网络 PS-FCN

论文:PS-FCN: A Flexible Learning Framework for Photometric Stereo
github:https://github.com/guanyingc/PS-FCN

在论文提出的网络中,给定任意数量的图像以及对应的光源方向作为输入,网络可以估计出物体表面的法向量

PS-FCN的结构为:
在这里插入图片描述
它主要包含三个部分:
1、共享权重的特征提取层
2、特征融合层,在特征融合层中,使用了Max-pooling,其优势在于可以面对输入数据顺序未知的情况,将任意特征图融合进同一特征图中,并且可以提取各个子特征图中最突出的信息
作者还对融合后的特征进行了可视化
在这里插入图片描述
a-h是128通道的特征图中的某8个通道,可以注意到具有相同法线方向的不同区域在不同通道中被激活,因此,每个通道都可以被解释为属于某一特定方向的法线的概率
3、法向量回归网络

网络采用的损失函数为:
在这里插入图片描述

四、建立逐个像素的观测映射 CNN-PS

论文:CNN-PS: CNN-based Photometric Stereo for General Non-Convex Surfaces
github:https://github.com/satoshi-ikehata/CNN-PS

作者提出了一种易于学习的表达,定义了一个观测映射,用映射后的表达来进行学习,作者定义这个映射为(α是正则化因子,L是光源方向):
在这里插入图片描述
在这里插入图片描述
然后作者通过将观测映射进行不同角度的旋转后,对每个像素进行法向量的预测,然后将不同角度下的预测取平均获得最终结果:
在这里插入图片描述

五、无需进行光源标定 SDPSNet

论文:Self-calibrating Deep Photometric Stereo Networks
github:https://github.com/guanyingc/SDPS-Net

本文的作者也是第三个网络的作者,基于PS-FCN,作者增加了光源自标定网络来进行未标定的PS重建

作者提出了一个两阶段的网络:
在这里插入图片描述
在第一阶段的光源标定网络中,作者没有将光源的标定视为回归任务,而是将其看作一个分类任务,因此作者将光源方向所在的空间进行离散化:
在这里插入图片描述
比如在水平的180度范围中划分为36份,在垂直的90度范围内也划分为36份,这样就有了1296份离散空间,但这么大类别的分类会显得困难,因此作者将水平和垂直两部分进行分别预测分类,因此光源标定网络的损失函数为:
在这里插入图片描述
第二部分的法向量回归网络的结构与损失函数与上面介绍的第三个网络是一样的

另外,还有如Learning to Minify Photometric Stereo(LMPS)和SPLINE-Net: Sparse Photometric Stereo through Lighting
Interpolation and Normal Estimation Networks等等的方法,有空会继续更新

我组建了一个光度立体技术的交流群,有兴趣的朋友可以一起来讨论一下!
在这里插入图片描述

这篇关于Photometric Stereo光度立体三维重建(五)——基于深度学习的PS方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/787238

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

浅谈主机加固,六种有效的主机加固方法

在数字化时代,数据的价值不言而喻,但随之而来的安全威胁也日益严峻。从勒索病毒到内部泄露,企业的数据安全面临着前所未有的挑战。为了应对这些挑战,一种全新的主机加固解决方案应运而生。 MCK主机加固解决方案,采用先进的安全容器中间件技术,构建起一套内核级的纵深立体防护体系。这一体系突破了传统安全防护的局限,即使在管理员权限被恶意利用的情况下,也能确保服务器的安全稳定运行。 普适主机加固措施:

webm怎么转换成mp4?这几种方法超多人在用!

webm怎么转换成mp4?WebM作为一种新兴的视频编码格式,近年来逐渐进入大众视野,其背后承载着诸多优势,但同时也伴随着不容忽视的局限性,首要挑战在于其兼容性边界,尽管WebM已广泛适应于众多网站与软件平台,但在特定应用环境或老旧设备上,其兼容难题依旧凸显,为用户体验带来不便,再者,WebM格式的非普适性也体现在编辑流程上,由于它并非行业内的通用标准,编辑过程中可能会遭遇格式不兼容的障碍,导致操

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验