Local Texture Estimator for Implicit Representation Function

2024-05-10 13:44

本文主要是介绍Local Texture Estimator for Implicit Representation Function,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • CVPR2022
  • https://github.com/jaewon-lee-b/lte
  1. 问题引入
  • 现在的任意超分辨率方法使用MLP模型,无法很好的生成高频信息,所以本文提出了一个模型来增加高频信息生成能力,也就是增加超分的细节信息,对应的问题是spectral bias problem;
  • 类似于NeRF输入不是直接坐标,而是进行了映射,本文将坐标输入之前也进行了映射;
  1. 方法:
  • 整体概览:包含encoder和本文提出的LTE,LTE输出主频率和对应的傅里叶系数,之后一个MLP利用这些输出来重建任意尺寸的HR,低频信息通过一个跳跃连接加入;
    在这里插入图片描述
  • SR网络: I L R ∈ R H × W × 3 → I H R ∈ R r y H × r x W × 3 I^{LR}\in\mathbb{R}^{H\times W\times 3}\rightarrow I^{HR}\in\mathbb{R}^{r_yH\times r_xW\times 3} ILRRH×W×3IHRRryH×rxW×3,之前的任意分辨率超分网络例如LIIF公式 s ( x , I L R ; Θ ) = ∑ j ∈ J w j f θ ( z j , x − x j ) s(x,I^{LR};\Theta)=\sum_{j\in J}w_jf_\theta(z_j,x-x_j) s(x,ILR;Θ)=jJwjfθ(zj,xxj)其中 z = E ψ ( I L R ) z = E_\psi(I^{LR}) z=Eψ(ILR)表示latent vector,输入坐标和latent code输出像素值,最后结果是四个方向插值的结果,本文定义local grid是上式中的 x − x j x-x_j xxj
  • 本文为了解决spectral bias problem问题,提出LTE网络,将输入坐标在输入MLP之前先映射到傅里叶域,对应的公式 s ( x , I L R ; Θ , ψ ) = ∑ j ∈ J w j f θ ( h ψ ( z j , x − x j ) ) s(x,I^{LR};\Theta,\psi)=\sum_{j\in J}w_jf_\theta(h_\psi(z_j,x-x_j)) s(x,ILR;Θ,ψ)=jJwjfθ(hψ(zj,xxj))
  • LTE包含三个部分,amplitude estimator h a ( ⋅ ) : R C → R 2 K h_a(\cdot):\mathbb{R}^C\rightarrow \mathbb{R}^{2K} ha():RCR2K,frequency estimator h f ( ⋅ ) : R C → R K × 2 h_f(\cdot):\mathbb{R}^C\rightarrow \mathbb{R}^{K\times 2} hf():RCRK×2,phase estimator h p ( ⋅ ) : R 2 → R K h_p(\cdot):\mathbb{R}^2\rightarrow \mathbb{R}^{K} hp():R2RK,现有 δ ( = x − x j ) ∈ R 2 \delta(=x-x_j)\in\mathbb{R}^2 δ(=xxj)R2 h ψ ( ⋅ , ⋅ ) : ( R C , R 2 ) → R 2 K h_\psi(\cdot,\cdot):(\mathbb{R}^C,\mathbb{R}^2)\rightarrow \mathbb{R}^{2K} hψ(,):(RC,R2)R2K,计算如下,其中 ⊙ \odot 表示的是按元素相乘,得到的结果是estimated frequencies and corresponding Fourier coefficients
    在这里插入图片描述
  • 还加入了scale进公式, c c c表示cell的尺寸, c ^ = m a x ( c , c t r ) \widehat{c}=max(c,c_{tr}) c =max(c,ctr) c t r c_{tr} ctr是最小cell尺寸:
    在这里插入图片描述
    在这里插入图片描述

这篇关于Local Texture Estimator for Implicit Representation Function的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/976611

相关文章

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close

AutoGen Function Call 函数调用解析(一)

目录 一、AutoGen Function Call 1.1 register_for_llm 注册调用 1.2 register_for_execution 注册执行 1.3 三种注册方法 1.3.1 函数定义和注册分开 1.3.2 定义函数时注册 1.3.3  register_function 函数注册 二、实例 本文主要对 AutoGen Function Call

(function() {})();只执行一次

测试例子: var xx = (function() {     (function() { alert(9) })(); alert(10)     return "yyyy";  })(); 调用: alert(xx); 在调用的时候,你会发现只弹出"yyyy"信息,并不见弹出"10"的信息!这也就是说,这个匿名函数只在立即调用的时候执行一次,这时它已经赋予了给xx变量,也就是只是

js私有作用域(function(){})(); 模仿块级作用域

摘自:http://outofmemory.cn/wr/?u=http%3A%2F%2Fwww.phpvar.com%2Farchives%2F3033.html js没有块级作用域,简单的例子: for(var i=0;i<10;i++){alert(i);}alert(i); for循环后的i,在其它语言像c、java中,会在for结束后被销毁,但js在后续的操作中仍然能访

rtklib.h : RTKLIB constants, types and function prototypes 解释

在 RTKLIB 中,rtklib.h 是一个头文件,包含了与 RTKLIB 相关的常量、类型和函数原型。以下是该头文件的一些常见内容和翻译说明: 1. 常量 (Constants) rtklib.h 中定义的常量通常包括: 系统常量: 例如,GPS、GLONASS、GALILEO 等系统的常量定义。 时间常量: 如一年、一天的秒数等。 精度常量: 如距离、速度的精度标准。 2. 类型

【AI大模型应用开发】2.1 Function Calling连接外部世界 - 入门与实战(1)

Function Calling是大模型连接外部世界的通道,目前出现的插件(Plugins )、OpenAI的Actions、各个大模型平台中出现的tools工具集,其实都是Function Calling的范畴。时下大火的OpenAI的GPTs,原理就是使用了Function Calling,例如联网检索、code interpreter。 本文带大家了解下Function calling,看

访问controller404:The origin server did not find a current representation for the target resource

ider build->rebuild project。Rebuild:对选定的目标(Project),进行强制性编译,不管目标是否是被修改过。由于 Rebuild 的目标只有 Project,所以 Rebuild 每次花的时间会比较长。 参考:资料

Vite + Vue3 +Vant4出现Toast is not a function

今天写前端的时候出现了这个问题搞了我一会 搜集原因: 1:是vant版本的问题,Toast()的方法是vant3版本的写法,而我用的是vant4,vant4中的写法改成了showToast()方法,改正过来 import {showToast} from "vant";  发现还是报错,说是找不到对应的样式文件 2:Vant 从 4.0 版本开始不再支持 babel-plugin-i

Android studio jar包多层嵌套,Add library '__local_aars__:...@jar' to classpath问题

在添加jar包,早app下的build.gradle中的 implementation files('libs/jar包的名字.jar') 修改为 api files('libs/jar包的名字.jar') implementation 单层引用,只引用当前jar包层, api 多层引用,应用当前jar包层,已经jar包引用的jar包层

Ollama Qwen2 支持 Function Calling

默认 Ollama 中的 Qwen2 模型不支持 Function Calling,使用默认 Qwen2,Ollama 会报错。本文将根据官方模板对 ChatTemplate 进行改进,使得Qwen2 支持 Tools,支持函数调用。 Ollama 会检查对话模板中是否存在 Tools,如果不存在就会报错,下面的代码是 Ollama 解析模板的代码。 Ollama 3.1 是支持 Tools