CV每日论文--2024.6.11

2024-06-13 16:52
文章标签 cv 2024.6 论文 每日

本文主要是介绍CV每日论文--2024.6.11,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、GaussianCity: Generative Gaussian Splatting for Unbounded 3D City Generation

中文标题:GaussianCity:生成无界 3D 城市的生成高斯泼溅

简介:这篇论文提出了一种名为"GaussianCity"的高效3D城市生成框架,解决了基于NeRF的方法和3D高斯喷洒(3D-GS)在无限尺度3D城市生成方面的局限性。

主要创新点如下:

紧凑的3D场景表示:引入BEV-Point作为高度压缩的中间表示,确保无限场景的VRAM使用量保持恒定,从而实现无限城市生成。

空间感知的高斯属性解码器:提出了空间感知的BEV-Point解码器,利用点序列化器集成BEV点的结构和上下文特征,产生高质量的3D高斯属性。

与基于NeRF的方法相比,GaussianCity大幅提高了计算效率。同时,与直接应用3D-GS于大规模城市场景相比,GaussianCity通过紧凑的场景表示和空间感知解码器,克服了内存不足的问题,可以高效合成无限的3D城市。

广泛的实验表明,GaussianCity在无人机视角和街景视角下的3D城市生成都取得了最先进的结果。与最近提出的CityDreamer方法相比,GaussianCity的生成速度提高了60倍,达到了10.72 FPS的实时性能。

总之,GaussianCity通过创新的3D场景表示和解码策略,有效解决了大规模3D城市生成的计算效率和内存限制问题,为城市可视化、游戏、仿真等应用提供了重要的技术支撑

2、IllumiNeRF: 3D Relighting without Inverse Rendering

中文标题:IlumiNeRF:无需逆向渲染的 3D 重新照明

简介:这篇论文提出了一种新的可重光视图合成方法,摆脱了传统基于反向渲染的方法,而是采用更简单高效的策略。

当前的可重光视图合成方法通常基于反向渲染,试图从输入图像中解开物体几何、材质和光照因素,并通过可微分蒙特卡罗渲染进行优化。这种方法计算成本高昂,容易出错。

为了解决这一问题,本文提出了一种新方法:

1. 首先使用一个以光照为条件的图像扩散模型,对每个输入图像进行重新照明。

2. 然后利用这些重新照明的图像,重建一个神经辐射场(NeRF)。

3. 最后从重建的NeRF中渲染出目标照明下的新视角图像。

作者证明了这种基于扩散模型的策略出奇地有竞争力,在多个重照基准测试中实现了最先进的性能。与传统的基于反向渲染的方法相比,该方法计算简单高效,避免了可微分渲染优化过程中的错误。

总的来说,这项工作提出了一种全新的可重光视图合成方法,通过利用图像扩散模型实现了更加优雅和高效的解决方案,为相关领域带来了重要进展。感兴趣的读者可以访问项目页面https://illuminerf.github.io/了解更多详情。

3、NaRCan: Natural Refined Canonical Image with Integration of Diffusion Prior for Video Editing

中文标题:NaRCan:自然精致的规范图像与扩散先验的集成用于视频编辑

简介:通过整合混合变形场和扩散先验,生成高质量的自然规范图像来代表输入视频。

主要创新点如下:

1. 利用单应性建模全局运动,并采用多层感知器(MLPs)捕捉局部残差变形,增强模型处理复杂视频动态的能力。

2. 在训练的早期引入扩散先验,确保生成的规范图像保持高质量的自然外观,适用于视频编辑中的各种下游任务,这是当前基于规范的方法所无法实现的。

3. 结合低秩适应(LoRA)微调,并引入噪声和扩散先验更新调度技术,将训练过程加速了14倍。

广泛的实验结果表明,NaRCan在各种视频编辑任务中均优于现有方法,生成了连贯和高质量的编辑视频序列。

与传统基于规范的方法相比,NaRCan通过混合变形场和扩散先验的独特设计,确保生成的规范图像保持自然外观,同时大幅提高了训练效率。这为视频编辑、合成等应用提供了重要的技术支撑。

感兴趣的读者可以访问项目页面https://koi953215.github.io/NaRCan_page/查看视频结果,了解NaRCan的更多细节。精致的规范图像与扩散先验的集成用于视频编辑

简介:

这篇关于CV每日论文--2024.6.11的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1057874

相关文章

2024.6.24 IDEA中文乱码问题(服务器 控制台 TOMcat)实测已解决

1.问题产生原因: 1.文件编码不一致:如果文件的编码方式与IDEA设置的编码方式不一致,就会产生乱码。确保文件和IDEA使用相同的编码,通常是UTF-8。2.IDEA设置问题:检查IDEA的全局编码设置和项目编码设置是否正确。3.终端或控制台编码问题:如果你在终端或控制台看到乱码,可能是终端的编码设置问题。确保终端使用的是支持你的文件的编码方式。 2.解决方案: 1.File -> S

每日一练:攻防世界:5-1 MulTzor

一、XorTool 基于 XOR(异或)运算实现。它可以帮助您快速地对文本、二进制文件进行加密解密操作。 认识XorTool工具: 让我们先去认识一下工具: xortool.py 是基于 python 的脚本,用于完成一些 xor 分析,包括: 猜想 key 的长度 猜想 key 的值 解密一些经过 xoe 加密的文件 也就是说当遇到不知道文件类型的文件,可以尝试去看看它是否被xo

康奈尔大学之论文审稿模型Reviewer2及我司七月对其的实现(含PeerRead)

前言 自从我司于23年7月开始涉足论文审稿领域之后「截止到24年6月份,我司的七月论文审稿GPT已经迭代到了第五版,详见此文的8.1 七月论文审稿GPT(从第1版到第5版)」,在业界的影响力越来越大,所以身边朋友如发现业界有相似的工作,一般都会第一时间发给我,比如本部分要介绍的康奈尔大学的reviewer2 当然,我自己也会各种看类似工作的论文,毕竟同行之间的工作一定会互相借鉴的,我们会学他们

【论文精读】分类扩散模型:重振密度比估计(Revitalizing Density Ratio Estimation)

文章目录 一、文章概览(一)问题的提出(二)文章工作 二、理论背景(一)密度比估计DRE(二)去噪扩散模型 三、方法(一)推导分类和去噪之间的关系(二)组合训练方法(三)一步精确的似然计算 四、实验(一)使用两种损失对于实现最佳分类器的重要性(二)去噪结果、图像质量和负对数似然 论文:Classification Diffusion Models: Revitalizing

【python】python葡萄酒国家分布情况数据分析pyecharts可视化(源码+数据集+论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C++/Python语言 👉公众号👈:测试开发自动化【获取源码+商业合作】 👉荣__誉👈:阿里云博客专家博主、51CTO技术博主 👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。 python葡萄酒国家分布情况数据分析pyecharts可视化(源码+数据集+论文)【独一无二】 目录 python葡

论文阅读--Efficient Hybrid Zoom using Camera Fusion on Mobile Phones

这是谷歌影像团队 2023 年发表在 Siggraph Asia 上的一篇文章,主要介绍的是利用多摄融合的思路进行变焦。 单反相机因为卓越的硬件性能,可以非常方便的实现光学变焦。不过目前的智能手机,受制于物理空间的限制,还不能做到像单反一样的光学变焦。目前主流的智能手机,都是采用多摄的设计,一般来说一个主摄搭配一个长焦,为了实现主摄与长焦之间的变焦,目前都是采用数字变焦的方式,数字变焦相比于光学

【LLM之KG】CoK论文阅读笔记

研究背景 大规模语言模型(LLMs)在许多自然语言处理(NLP)任务中取得了显著进展,特别是在零样本/少样本学习(In-Context Learning, ICL)方面。ICL不需要更新模型参数,只需利用几个标注示例就可以生成预测。然而,现有的ICL和链式思维(Chain-of-Thought, CoT)方法在复杂推理任务上仍存在生成的推理链常常伴随错误的问题,导致不真实和不可靠的推理结果。

【python】python基于akshare企业财务数据对比分析可视化(源码+数据集+论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C++/Python语言 👉公众号👈:测试开发自动化【获取源码+商业合作】 👉荣__誉👈:阿里云博客专家博主、51CTO技术博主 👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。 系列文章目录 目录 系列文章目录一、设计要求二、设计思路三、可视化分析 一、设计要求 选取中铁和贵州茅

AIGC-Animate Anyone阿里的图像到视频 角色合成的框架-论文解读

Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation 论文:https://arxiv.org/pdf/2311.17117 网页:https://humanaigc.github.io/animate-anyone/ MOTIVATION 角色动画的

【python】python股票量化交易策略分析可视化(源码+数据集+论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C++/Python语言 👉公众号👈:测试开发自动化【获取源码+商业合作】 👉荣__誉👈:阿里云博客专家博主、51CTO技术博主 👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。 【python】python股票量化交易策略分析可视化(源码+数据集+论文)【独一无二】 目录 【python】pyt