perceptual专题

UPerNet 统一感知解析:场景理解的新视角 Unified Perceptual Parsing for Scene Understanding

论文题目:统一感知解析:场景理解的新视角 Unified Perceptual Parsing for Scene Understanding 论文链接:http://arxiv.org/abs/1807.10221(ECCV 2018) 代码链接:https://github.com/CSAILVision/unifiedparsing 一、摘要   研究了一个新的任务,称为统一感知解析

GAN网络生成:感知损失(Perceptual Losses)

Reference: http://blog.csdn.net/stdcoutzyx/article/details/54025243 本文是参考文献[1]的笔记。该论文是Li Fei-Fei名下的论文。 引入 最近新出的图像风格转换算法,虽然效果好,但对于每一张要生成的图片,都需要初始化,然后保持CNN的参数不变,反向传播更新图像,得到最后的结果。性能问题堪忧。 但是图像风

说说 style gan 中的感知路径长度(Perceptual Path Length)

我在之前的博库中介绍了 style gan 的基本原理,原文中有提出感知路径长度(Perceptual Path Length)的概念。这是一种评价生成器质量的方式。         PPL基本思想:给出两个随机噪声 z 1 , z 2 ​ ,为求得两点的感知路径长度PPL,采用微分的思想。把两噪声点插值路径细分成多个小段,求每个小段的长度,再求平均

说说 style gan 中的感知路径长度(Perceptual Path Length)

我在之前的博库中介绍了 style gan 的基本原理,原文中有提出感知路径长度(Perceptual Path Length)的概念。这是一种评价生成器质量的方式。         PPL基本思想:给出两个随机噪声 z 1 , z 2 ​ ,为求得两点的感知路径长度PPL,采用微分的思想。把两噪声点插值路径细分成多个小段,求每个小段的长度,再求平均

Learning-Based Just-Noticeable-Quantization- Distortion Modeling for Perceptual Video Coding

基于学习的恰可察觉量化 - 失真建模用于感知视频编码 摘要 - 传统的基于预测视频编码的方法正在达到其潜在的编码效率改进的极限,因为计算复杂性严重增加。作为替代方法,感知视频编码(PVC)已经尝试通过消除感知冗余来实现高编码效率,使用实时可观失真(JND)定向的PVC。先前的JND通过将白高斯噪声或特定信号模式添加到原始图像中来建模,这不适合于由于能量减少的失真而找到JND阈值。在本文中,我们提

论文阅读 Perceptual Generative Adversarial Networks for Small Object Detection

文章目录 Perceptual Generative Adversarial Networks for Small Object DetectionAbstract1. Introduction2. Related Work3. Perceptual GANs3.1. Overview3.2. Conditional Generator Network Architecture3.3. Di

论文Perceptual sensitivity-based rate control method for highefficiency video coding阅读笔记——比特分配

论文来源:Multimed Tools Appl (2016)  作者团队:华侨大学&香港中文大学 Abstract 最新的视频编码标准——高效视频编码(HEVC)在平方误差和(SSE)方面优化了其编码效率,这没有充分考虑输入视频的感知特性。因此,HEVC在感知视频编码的意义上是无效的。为了解决这一问题,基于人类视觉系统(HVS)的观察,提出了一种高效的基于感知灵敏度的HEVC速率控制(PS

对抗样本(论文解读五):Perceptual-Sensitive GAN for Generating Adversarial Patches

准备写一个论文学习专栏,先以对抗样本相关为主,后期可能会涉及到目标检测相关领域。 内容不是纯翻译,包括自己的一些注解和总结,论文的结构、组织及相关描述,以及一些英语句子和相关工作的摘抄(可以用于相关领域论文的写作及扩展)。 平时只是阅读论文,有很多知识意识不到,当你真正去着手写的时候,发现写完之后可能只有自己明白做了个啥。包括从组织、结构、描述上等等很多方面都具有很多问题。另一个是对于专业