disentangled专题

论文研读 Disentangled Information Bottleneck

解耦信息瓶颈 摘要: 信息瓶颈方法是一种从源随机变量中提取与预测目标随机变量相关的信息的技术,通常通过优化平衡压缩和预测项的IB拉格朗日乘子f来实现,然而拉格朗日乘子很难优化,需要多次实验来调整拉格朗日乘子的值,此外我们还证明了随着压缩强度的增大 预测性会严重降低,本文从监督解纠缠的角度来实现信信息瓶颈的方法,DisenIB 旨在保证目标与测性能不损失的前提下,最大化的压缩性信息源大量的理论和

《Style Transformer: Unpaired Text Style Transfer without Disentangled Latent Representation》浅析

文章目录 摘要发展模型问题描述步骤模型训练机制 代码解析效果 摘要 传统的文本样式转换通常是通过分解隐空间中的内容和风格的方式。这种方式存在如下两种问题: 很难从句子的语义中完全剥离样式信息基于编解码器模式的RNN难以保持长程依赖,导致内容保真度有损 本文提出一种不用隐空间假设,基于注意力机制的模型——Style Transformer,能够较好的保持文本内容,同时很好的转

论文研究11:Audio-visual Speech Separation with Adversarially Disentangled Visual Representation

论文研究11:Audio-visual Speech Separation with Adversarially Disentangled Visual Representation abstract 语音分离旨在从多个同时讲话者的音频混合中分离出单个语音。尽管仅音频方法具有令人满意的性能,但它们基于处理预定义条件的策略,从而限制了它们在复杂听觉场景中的应用。针对鸡尾酒会问题,我们提出了一种新

DENet:用于可见水印去除的Disentangled Embedding网络笔记

1 Title         DENet: Disentangled Embedding Network for Visible Watermark Removal(Ruizhou Sun、Yukun Su、Qingyao Wu)[AAAI2023 Oral] 2 Conclusion         This paper propose a novel contrastive learn

[论文阅读]Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression

该论文发表于CVPR2021 Background 背景 该论文关注的是的是自底向上的关键点回归人体姿态估计,作者认为回归关键点坐标的特征必须集中注意到关键点周围的区域,才能够精确回归出关键点坐标。因此提出了一种名为解构式关键点回归(DEKR)的方法。这种直接回归坐标的方法超过了以前的关键点热度图检测并组合的方法,并且在 COCO 和 CrowdPose 两个数据集上达到了目前自底向上姿态

CausalVAE: Disentangled Representation Learning via Neural Structural Causal Models

简介 这篇论文我觉得最大的贡献是把因果关系、因果模型引入到解耦表征领域,使得解耦的潜变量z具有可解释性;对z加一个的扰动可以反映到VAE网络生成图像的对应物理量上。 贡献:1)我们提出了一个新的框架CausalVAE,支持因果分离和do-operation;2) 给出了模型可辨识性的理论证明;3)我们对合成的和真实的人脸图像进行了综合实验,以证明所学习的因素具有因果语义,并且可以被干预以生成不