论文阅读:“Appearance Capture and Modeling of Human Teeth”

2023-11-27 16:44

本文主要是介绍论文阅读:“Appearance Capture and Modeling of Human Teeth”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • Abstract
  • Introduction
  • Method Overview
  • Teeth Appearance Model
    • Enamel
    • Dentin
    • Gingiva and oral cavity
  • Data Acquisition
    • Image capture
    • Geometry capture
  • Results
  • References

Abstract

如果要为电影,游戏或其他类型的项目创建在虚拟环境中显示的人类角色,我们通常需要获取人体的几何表示及其散射参数(用于表达人体几何表示与场景光线之间的交互)。牙齿不仅需要通过光与表面的交互来定义,同时需要通过其内部几何形状和口内环境来定义,所以这提出了一个独特的挑战。

因此,迪士尼提出了一种专门用于捕捉真人牙齿光学特性的系统,用以支持在计算机图形中重新渲染它们。研究人员在传统的多相机与光源设置中获取的口腔内环境数据,并且利用了口腔扫描的精确几何形状。为了模拟反向渲染期间口腔中光线的复杂相互作用,他们采用了基于衍生路径追踪的新型管道来参照牙齿表面的光学性质和几何形状。

迪士尼指出,最终的外观能够忠实地还原真人牙齿,并且可直接用于传统的路径追踪框架以渲染虚拟人类

Introduction

尽管相关领域已存在大量的研究,特别是在医疗牙科领域,但捕捉牙齿形状及其在口腔内的位置,并且获取它们的光学性质一直是个挑战。

每个人的牙齿都会因为个人习惯、年龄、社会经济背景等呈现出独特的特征。尽管现在绝大多数的口扫设备可以捕捉颜色信息,但它们不能表达出牙齿的一些复杂光学特性,因此展现的结果很不自然,如下图所示。

在这里插入图片描述

牙齿的散射特性由其最外层的两种光学特性迥异的材料决定,如下图所示:

在这里插入图片描述
内核由牙本质(dentin)构成,牙本质对色度的影响最大,也是牙齿发亮的原因。牙本质上覆盖着一层厚度不等的牙釉质(enamel)。牙龈处的牙釉质通常较薄,而牙尖处的牙釉质较厚,这就造成了色度的渐变。牙釉质是一种结构致密的材料,但比牙本质薄。它具有高度的半透明性。

在微观层面上,牙釉质是由从牙本质向表面延伸的棒状物(enamel rods)形成的,会造成强烈的各向异性光传播。半透明的牙釉质显示出乳白色的特征,使牙齿在蓝色光谱中产生反向散射,因此从另一面看会呈现红黄色。牙齿表面的变化、裂纹、污渍和其他瑕疵也为牙齿外观增添了一层丰富的视觉效果。

迪士尼团队补充了现有的形状重建方法,如口腔内扫描或口腔外适配。他们利用了通过口腔内扫描和片段获取的几何参数,并根据 Wu 等人的说法(Model-Based Teeth Reconstruction,牙齿重建方面开创性的一篇文章,值得阅读)等方法从多个视角和多种照明条件对嘴部区域进行成像,通过这种方法获取了外观数据。

为了模拟口腔内光线的复杂交互和牙齿体积,迪士尼团队利用了一个修改过的路径追踪框架来估算导数与优化参数的关系,并同时执行常规渲染。基本上,他们的方法迭代解决了整个可见场景下的辐射传递整数。此外,文章不仅只是优化了散射参数(反照率,密度,表面纹理),同时还优化了几何参数(牙本质表面形状)。研究人员根据基本的牙釉质形状建模了牙本质形状,并将其作为一组变形,从而能够在优化循环中以参数进行控制。

迪士尼利用了从口腔科获取的一颗坏死牙齿来验证他们的解决方案,并进一步应用于实际的被试身上(如下图)。他们指出:“在这两种情况下,我们的方法都能够逼真地创建了牙齿的整体外观。由于应用于优化循环的主要框架是基于路径追踪,由此得到的参数只需小幅度的修改即可用于重新渲染牙齿。”

在这里插入图片描述
[Various comparisons of our recovered teeth appearance parameters rendered next to corresponding reference images, from different viewpoints and lighting conditions. Reference images are on the left for individual teeth comparisons, and above for full teeth rows.]

Method Overview

光线在与牙齿相互作用时会经过许多路径。首先,光线与表面相互作用,表面的特点是有一个粗糙的电介质层(dielectric layer),然后被反射或折射到内部。内部的相互作用主要由牙齿的两层决定:牙釉质和牙本质。因此,研究人员确定了定义牙齿外观的三组参数:表面反射率和透射率次表面散射参数内部牙本质形状。该方法旨在得出一组合理的模型参数,以便在牙齿相对于口腔被外部照射的情况下进行高质量的渲染。

Teeth Appearance Model

Enamel

牙釉质边界是牙齿的外部边界,以三角形网格建模。为了模拟光与空气-牙釉质边界的相互作用,文章中使用了改进版的光滑介质 BSDF,它采用了用 "薄 "电介质层分隔空气和牙釉质的概念。

BSDF(双向散射分布函数)是一个在计算机图形学和物理光学中使用的术语,用于描述一个表面如何散射和吸收光线。BSDF可以看作是一个函数,它接受入射光的方向和表面材料的特性,然后返回一个值,这个值表示了从该方向入射的光线在被表面散射后,在特定方向上离开表面的强度。

更具体地说,BSDF 定义了从入射方向( ω i \omega_i ωi)到出射方向( ω o \omega_o ωo)的光线散射概率密度。

Dentin

牙釉质层的厚度在很大程度上影响着到达牙齿牙本质的光量,因此对整体外观有重大影响。文章使用一组变形定义的混合形状模型来模拟牙釉质-牙本质界面,从而改变厚度:
V = B 0 + c ⋅ ( B − B 0 ) T V=B_0+c\cdot (B-B_0)^T V=B0+c(BB0)T其中, B B B 代表混合形状模型, B 0 B_0 B0 为初始模型, c c c 则为向量权重。通过实验,研究人员得出结论:三种模式就足以捕捉到牙釉质厚度差异引起的散射的大部分可见变化。这些模式代表了典型牙齿空间中沿三个主要轴线的变形;如下图所示。

在这里插入图片描述

Gingiva and oral cavity

牙龈以及整个口腔确实对牙齿的外观有间接影响,因为它们会将皮肤色光散射到牙齿上。为了解释这种散射光,防止优化预测出有色牙齿,必须对其进行建模。

牙龈的模型是一个三角形网格,包裹着牙根的外部边界。由于可以直接观察牙龈,因此这里使用与牙釉质相同的参数集,通过数值优化提取牙龈的外观,折射率固定不变( η = 1.33 \eta=1.33 η=1.33)。

口腔高度闭塞,难以捕捉,但由于光线从口腔壁反弹并照亮阴影区域,因此对外观影响很大。文章使用了一个替代网格(substitute mesh),将漫反射设置为自由参数。其起点是通过相似性理论和之前优化牙龈散射参数得出的平均值。

Data Acquisition

Image capture

在这里插入图片描述

为了获得准确的外观参数,研究人员需要对入射光和出射光的方向进行密集采样。为此,在一个由 155 盏灯(每盏灯都是 RGB LED 三连灯)组成的光罩中拍摄每名志愿者,每盏灯距离牙齿约一米。由于头部的 occlusions,研究人员记录了 54 盏灯的图像,涵盖了所有可见的入射方向。

研究人员用三台彩色摄像机(Ximea CB200CG)捕捉多视角图像,摄像机安装在灯罩边缘,配有长镜头,以最大限度地提高牙齿的分辨率,记录 2000 万像素的图像,并与各个灯的激活同步。

Geometry capture

仅凭捕捉到的图像不足以进行外观优化,因为还需要了解牙齿的几何形状。虽然存在轻量级的牙齿重建方法,但它们无法恢复牙齿背面的准确形状,只能在图像覆盖率较低的地方假设牙齿的形状。由于需要评估 volumetric light paths,因此研究人员需要精确的牙齿四面边界。

在这里插入图片描述

研究人员使用口内扫描仪对志愿者的牙齿进行专业扫描。为了分割扫描中的牙齿并将它们从牙龈中分离出来,文章使用了 Wu 等人 [3] 描述的半自动模板拟合方法将模板牙齿网格与扫描几何图形对齐。由于牙齿的外观与牙龈紧密相连,研究人员还根据扫描结果对牙龈的几何形状进行了艺术建模。最后,通过手动选择一组稀疏的 corresponding landmarks 并求解刚性变换,将得到的牙齿几何形状和牙龈模型与相机坐标框架对齐。

Results

在这里插入图片描述


在这里插入图片描述

References

[1] Velinov, Z., Papas, M., Bradley, D., Gotardo, P., Mirdehghan, P., Marschner, S., … & Beeler, T. (2018). Appearance capture and modeling of human teeth. ACM Transactions on Graphics (ToG), 37(6), 1-13.
[2] “迪士尼提出了一种专门用于逼真捕捉真人牙齿光学特性的系统”,映维网,https://www.sohu.com/a/285369063_213766
[3] Wu, C. , Bradley, D. , Garrido, P. , Zollhfer, M. , Theobalt, C. , & Gross, M. , et al. (2016). Model-based teeth reconstruction. International Conference on Computer Graphics and Interactive Techniques. ACM.

这篇关于论文阅读:“Appearance Capture and Modeling of Human Teeth”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/428091

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

软件架构模式:5 分钟阅读

原文: https://orkhanscience.medium.com/software-architecture-patterns-5-mins-read-e9e3c8eb47d2 软件架构模式:5 分钟阅读 当有人潜入软件工程世界时,有一天他需要学习软件架构模式的基础知识。当我刚接触编码时,我不知道从哪里获得简要介绍现有架构模式的资源,这样它就不会太详细和混乱,而是非常抽象和易

BERT 论文逐段精读【论文精读】

BERT: 近 3 年 NLP 最火 CV: 大数据集上的训练好的 NN 模型,提升 CV 任务的性能 —— ImageNet 的 CNN 模型 NLP: BERT 简化了 NLP 任务的训练,提升了 NLP 任务的性能 BERT 如何站在巨人的肩膀上的?使用了哪些 NLP 已有的技术和思想?哪些是 BERT 的创新? 1标题 + 作者 BERT: Pre-trainin

[论文笔记]LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

引言 今天带来第一篇量化论文LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale笔记。 为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。 大语言模型已被广泛采用,但推理时需要大量的GPU内存。我们开发了一种Int8矩阵乘法的过程,用于Transformer中的前馈和注意力投影层,这可以将推理所需

UML- 统一建模语言(Unified Modeling Language)创建项目的序列图及类图

陈科肇 ============= 1.主要模型 在UML系统开发中有三个主要的模型: 功能模型:从用户的角度展示系统的功能,包括用例图。 对象模型:采用对象、属性、操作、关联等概念展示系统的结构和基础,包括类图、对象图、包图。 动态模型:展现系统的内部行为。 包括序列图、活动图、状态图。 因为要创建个人空间项目并不是一个很大的项目,我这里只须关注两种图的创建就可以了,而在开始创建UML图