[CVPR-24] Text-to-3D using Gaussian Splatting

2024-03-19 04:12

本文主要是介绍[CVPR-24] Text-to-3D using Gaussian Splatting,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 3DGS对初始化敏感;
  • 引入基于Point-E的3D SDS可以缓解多脸问题;
  • 外观细化阶段可以有效抑制异常点,并提高可视化效果;
  • 不需要对SDS的改进,用gudiance scale=100可以取得很不错的结果。

[pdf | proj | code]

方法

Geometry Optimization

  • text-to-3D任务通畅存在严重的双脸问题。不同于NeRF和DMTE等3D表征,3DGS可以显示控制每个点的位置。因此,本文提出通过Point-E + SDS loss优化3DGS的位置变量。
  • 其中,p_tx_t分别表示加噪的高斯位置和渲染图像。

Appearance Refinement

  • 本文引入了额外的外观细化阶段(appearance refinement stage),该阶段间歇执行,仅使用2D图片先验细化和稠密化3DGS。
  • 3DGS中使用的稠密化方法需要设置梯度阈值。然而,这个阈值在使用SDS损失时不好确认。由于SDS具有较强的随机性,使用较小阈值会导致产生大量的随机点,较大阈值则会导致点较少进而影响表达能力。
  • 为解决该问题,本文提出基于紧凑的稠密化方法(compactness-based densification),可以和较大的位置梯度阈值搭配使用。
  • 具体来说,对每个高斯点,首先通过KD树获取K个最近邻点;对每个近邻,如果他们之间的距离小于他们半径之和,则在他们中间新增一个高斯点,新增点的半径为距离残差。
  • 如下图所示,本文所提出的稠密化方法可以填补空洞,得到更好的几何结构。

  • 为了剪除不需要的高斯点,本文引入了一个透明度正则项,其权重正比于它到中心点的距离(extra loss to regularize opacity with a weight proportional to its distance to the center)。
  • 为了确保在外观细化阶段中,高斯点不发生较大位移,本文引入了针对位置的正则项。
  • 外观细化阶段损失如下:
  • 其中,sg()是梯度截停操作,p_io_i是第i个高斯点的位置和透明度。

Initialization with Geometry Prior

  • 前人工作发现3DGS初始化对结果影响较大。因此,本文使用Point-E来初始化3DGS位置,颜色则随机初始化。
  • 缩放、可见度初始化为一个常数,旋转矩阵初始化为单位矩阵。

实验

Implementation Details

  • SD 1.5,gudiance scale设置为100,使用了view-dependent prompt
  • 500 iter进行一次稠密化,T_{pos} = 0.02。本文提出的compactness-based densification 1000-iter执行一次。每200-iter移除掉可见度小于\alpha_{min}=0.05的点。
  • 在几何优化阶段:\lambda_{SDS}=0.1, \lambda_{3D}=0.01;在外观细化阶段\lambda_{SDS}=0.1, \lambda_{mean}=1.0, \lambda_{opacity}=100.0

消融实验

这篇关于[CVPR-24] Text-to-3D using Gaussian Splatting的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/824751

相关文章

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

SAM2POINT:以zero-shot且快速的方式将任何 3D 视频分割为视频

摘要 我们介绍 SAM2POINT,这是一种采用 Segment Anything Model 2 (SAM 2) 进行零样本和快速 3D 分割的初步探索。 SAM2POINT 将任何 3D 数据解释为一系列多向视频,并利用 SAM 2 进行 3D 空间分割,无需进一步训练或 2D-3D 投影。 我们的框架支持各种提示类型,包括 3D 点、框和掩模,并且可以泛化到不同的场景,例如 3D 对象、室

【Python报错已解决】AttributeError: ‘list‘ object has no attribute ‘text‘

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 前言一、问题描述1.1 报错示例1.2 报错分析1.3 解决思路 二、解决方法2.1 方法一:检查属性名2.2 步骤二:访问列表元素的属性 三、其他解决方法四、总结 前言 在Python编程中,属性错误(At

Science|癌症中三级淋巴结构的免疫调节作用与治疗潜力|顶刊精析·24-09-08

小罗碎碎念 Science文献精析 今天精析的这一篇综述,于2022-01-07发表于Science,主要讨论了癌症中的三级淋巴结构(Tertiary Lymphoid Structures, TLS)及其在肿瘤免疫反应中的作用。 作者类型作者姓名单位名称(中文)通讯作者介绍第一作者Ton N. Schumacher荷兰癌症研究所通讯作者之一通讯作者Daniela S. Thomm

模具要不要建设3D打印中心

随着3D打印技术的日益成熟与广泛应用,模具企业迎来了自建3D打印中心的热潮。这一举措不仅为企业带来了前所未有的发展机遇,同时也伴随着一系列需要克服的挑战,如何看待企业引进增材制造,小编为您全面分析。 机遇篇: 加速产品创新:3D打印技术如同一把钥匙,为模具企业解锁了快速迭代产品设计的可能。企业能够迅速将创意转化为实体模型,缩短产品从设计到市场的周期,抢占市场先机。 强化定制化服务:面

SIGMOD-24概览Part7: Industry Session (Graph Data Management)

👇BG3: A Cost Effective and I/O Efficient Graph Database in ByteDance 🏛机构:字节 ➡️领域: Information systems → Data management systemsStorage management 📚摘要:介绍了字节新提出的ByteGraph 3.0(BG3)模型,用来处理大规模图结构数据 背景

WPF入门到跪下 第十三章 3D绘图 - 3D绘图基础

3D绘图基础 四大要点 WPF中的3D绘图涉及4个要点: 视口,用来驻留3D内容3D对象照亮部分或整个3D场景的光源摄像机,提供在3D场景中进行观察的视点 一、视口 要展示3D内容,首先需要一个容器来装载3D内容。在WPF中,这个容器就是Viewport3D(3D视口),它继承自FrameworkElement,因此可以像其他元素那样在XAML中使用。 Viewport3D与其他元素相

【ReactJS】困惑于text/babel与browser.js还是babel.js?

使用JSX   使用JSX,可以极大的简化React元素的创建,JSX抽象化了React.createElement()函数的使用,其语法风格类似于HTML语法风格。对比如下代码可以让你更好的理解这一点。 // 使用React.createElement()return React.createElement('div',null,'Hello',this.props.name);//使用J

【A题成品论文已出】24数学建模国赛A题成品论文(附参考代码)免费分享

A 题  “板凳龙”  闹元宵 摘要 “板凳龙”是一种传统的民俗文化活动,通常由许多板凳连接成龙的形状进行表演。本文基于螺旋线和板凳龙的运动特性,建立数学模型来分析舞龙队在不同情况下的运动轨迹、调头路径和速度优化等问题。问题主要涉及板凳龙的行进路径、碰撞避免、调头空间的设计,以及如何优化龙头的速度,以确保龙身与龙尾的行进安全。 针对问题一,舞龙队由223节板凳组成,龙头前把手的速度为1