论文阅读:“Model-based teeth reconstruction”

2023-11-27 13:44

本文主要是介绍论文阅读:“Model-based teeth reconstruction”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • Abstract
  • Introduction
  • Teeth Prior Model
    • Data Preparation
    • Parametric Teeth Model
  • Teeth Fitting
    • Teeth Boundary Extraction
  • Reference

在这里插入图片描述

Abstract

近年来,基于图像的人脸重建方法日趋成熟。这些方法可以捕捉整个面部或面部特定区域(如头发、眼睛或眼睑)的高精细静态和动态几何模型。遗憾的是,基于图像的口腔捕捉方法,尤其是牙齿捕捉方法,却很少受到关注。然而,牙齿的精确渲染对于面部表情的逼真展示至关重要,目前高质量的面部动画都是通过繁琐的手工工作制作牙列模型。在牙科领域,开发了专门的口腔内牙齿扫描仪,但这种扫描仪还难以广泛使用。

在文章中,研究人员提出了第一种仅凭口腔区域的稀疏照片集就能无创重建整个人特定牙列的方法。该方法的基础是从高质量口扫模型中学习到的新参数牙列先验(parametric tooth row prior)。新的基于模型的重建方法将牙齿与照片相匹配,从而准确匹配可见牙齿,并合理生成遮挡牙齿(occluded teeth)。该方法不仅能无缝集成到整个面部的摄影测量多相机重建设置中,还能从普通的未校准照片甚至手机拍摄的短视频中获得高质量的牙齿建模。

Introduction

由于牙齿表面有半透明的牙釉质涂层,牙齿具有极强的镜面反射性,而由于牙齿下面的牙本质,牙齿又具有高度漫反射性,两者都表现出很强的表面下散射。因此,牙齿只有很少的可见特征,最明显的特征是单个牙齿之间的边界,这甚至不是牙齿表面的特征,因此使用摄影测量(photogrammetric)方法重建牙齿非常具有挑战性。

从另一方面看,牙齿是刚性的,不同对象的牙齿形状变化是可控的,因此牙齿可以很好地进行统计建模(statistical modeling)。基于相机的口腔内部重建由于 non-trivial occlusions 而变得更加复杂。如果不使用专用的嘴唇扩张装置,人们通常很难将嘴张得足够大,即使这样,通常也无法通过单一位姿看到整个口腔。

因此,这篇文章首次提出了一种方法,可从口腔区域的稀疏正常照片集重建牙齿。在这些图像中,人可以做出自然的嘴部表情,而无需在机械支撑下不舒服地张开嘴巴。

Contributions:

  • 提供了一个新的整排牙齿参数先验模型,该模型是从高质量石膏模型的数字化数据库中学习的。该牙齿模型对每颗牙齿的局部形状变化、整排牙齿中每颗牙齿的姿态变化以及整排牙齿的位置和比例进行了编码。它还对模型参数的先验分布进行了编码。
  • 提出了一种基于图像的新方法,该方法可重建特定个人的牙列,与输入图像中的可见牙齿相匹配,并在先验模型的基础上为部分遮挡和完全隐藏的牙齿生成合理的几何形状。

Teeth Prior Model

人类通常有 32 颗牙齿(去掉智齿后为 28 颗),分为上下两排,基本对称。牙齿分为四类:门牙(incisors)、犬牙(canines)、前臼齿(premolars)和臼齿(molars),如下图所示。

在这里插入图片描述

Data Preparation

为了建立牙齿数据库,我们从医学牙科领域获得了 86 排不同牙齿的高分辨率石膏三维扫描图像,其中包括上排牙齿和下排牙齿。其中一部分扫描结果如下图所示。

在这里插入图片描述
Teeth Templates. 为了建立和训练模型,需要一个牙齿数据库,每个牙齿都有独立的几何图形,并在不同的研究对象之间保持一致。研究人员首先手动(artistically create)创建了一个牙齿模板网格。由于四类牙齿的形状迥异,因而创建了四个独立的模板网格。为了完整起见,研究人员将牙齿一直建模到牙根。

Template Fitting. 现在,我们希望将牙齿模板网格实例与石膏扫描模型中的单个牙齿相匹配。研究人员设计了一种半自动模板拟合方法。首先,用户通过点击牙齿间边界以及牙齿和牙龈边界的几个点,为每颗牙齿定义一个分割轮廓。如下图(a),左门牙的轮廓用紫色标出,其他轮廓用绿色标出。根据所选点之间的高曲率路径自动计算分割轮廓。此外,用户还可以为每颗牙齿选择几个预定义的 landmarks(门牙和犬齿为三个,前臼齿和臼齿为五个),这些 landmarks 将指导配准及分割。下图(a) 用红色显示了其中一颗门牙的 landmarks。

在这里插入图片描述
对于每颗牙齿,首先根据选定的 landmarks 将适当的模板网格与牙齿进行刚性对齐,然后使用迭代拉普拉斯形变进行非刚性变形,以紧密贴合分割后的牙齿区域(上图(c,d))。

所有扫描模型拟合后的结果是一个包含 per-tooth 网格对应关系的齿列数据库。虽然上述方法中有几步需要人为操作,但建立数据库是一次性的(one-time investment)。

Parametric Teeth Model

从数学上讲,参数化牙齿模型是对典型牙列的形状和姿态偏差进行编码,计算结果为数据库的平均值(如下图所示)。

在这里插入图片描述

在这里插入图片描述

Teeth Fitting

Teeth Boundary Extraction

可以通过手动标注输入图像来获得牙齿轮廓。虽然这种方法是可行的,而且算法也可以在这种数据上运行,但随着图像数量的增加,这种方法很快就会变得极为繁琐。特别是对于基于视频的牙齿重建使用案例,手动标注是不切实际的。因此研究人员希望自动检测输入图像中的牙齿轮廓。

在这里插入图片描述
如上图所示,研究人员定义了三种类型的牙齿边界:牙齿、牙龈及嘴唇。明确区分牙龈和嘴唇对于防止牙齿模型牙龈线与嘴唇边界错误对齐至关重要。为了识别边界,文章采用了增强边缘学习(BEL) 算法。BEL 是一种用于边缘和物体边界检测的通用监督学习算法,它根据小块图像上的大量通用快速特征(包括梯度、滤波器响应直方图和不同尺度的哈尔小波)将图像像素分类为边界。研究人员在一组手工标注的输入图像上分别训练三个检测器,每个检测器对应上述特定的牙齿边界。下图显示了训练数据的几个示例。

在这里插入图片描述

Reference

[1] Wu, C. , Bradley, D. , Garrido, P. , Zollhfer, M. , Theobalt, C. , & Gross, M. , et al. (2016). Model-based teeth reconstruction. International Conference on Computer Graphics and Interactive Techniques. ACM.

这篇关于论文阅读:“Model-based teeth reconstruction”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/427773

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

软件架构模式:5 分钟阅读

原文: https://orkhanscience.medium.com/software-architecture-patterns-5-mins-read-e9e3c8eb47d2 软件架构模式:5 分钟阅读 当有人潜入软件工程世界时,有一天他需要学习软件架构模式的基础知识。当我刚接触编码时,我不知道从哪里获得简要介绍现有架构模式的资源,这样它就不会太详细和混乱,而是非常抽象和易

BERT 论文逐段精读【论文精读】

BERT: 近 3 年 NLP 最火 CV: 大数据集上的训练好的 NN 模型,提升 CV 任务的性能 —— ImageNet 的 CNN 模型 NLP: BERT 简化了 NLP 任务的训练,提升了 NLP 任务的性能 BERT 如何站在巨人的肩膀上的?使用了哪些 NLP 已有的技术和思想?哪些是 BERT 的创新? 1标题 + 作者 BERT: Pre-trainin

MVC(Model-View-Controller)和MVVM(Model-View-ViewModel)

1、MVC MVC(Model-View-Controller) 是一种常用的架构模式,用于分离应用程序的逻辑、数据和展示。它通过三个核心组件(模型、视图和控制器)将应用程序的业务逻辑与用户界面隔离,促进代码的可维护性、可扩展性和模块化。在 MVC 模式中,各组件可以与多种设计模式结合使用,以增强灵活性和可维护性。以下是 MVC 各组件与常见设计模式的关系和作用: 1. Model(模型)