《Style Transformer: Unpaired Text Style Transfer without Disentangled Latent Representation》浅析

本文主要是介绍《Style Transformer: Unpaired Text Style Transfer without Disentangled Latent Representation》浅析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 摘要
  • 发展
  • 模型
    • 问题描述
    • 步骤
    • 模型
    • 训练机制
  • 代码解析
  • 效果

摘要

传统的文本样式转换通常是通过分解隐空间中的内容和风格的方式。这种方式存在如下两种问题:

  • 很难从句子的语义中完全剥离样式信息
  • 基于编解码器模式的RNN难以保持长程依赖,导致内容保真度有损

本文提出一种不用隐空间假设,基于注意力机制的模型——Style Transformer,能够较好的保持文本内容,同时很好的转化文本风格

发展

文本样式转换定义:改变文本的风格属性,同时尽可能保留文本的内容信息。
难点:文本风格的定义比较含糊,因此很难构建具有相同内容和不同风格配对句子。

  • 从内容与风格分离的角度入手

    • 方式:
      • encoder: 将文本表征为与风格独立的表示
      • decoder: 根据encoder输出的表示生成相同内容不同风格的新文本
      • 损失:对抗损失
    • 缺点:
      • 由于难以从句子的语义中分离风格模式,因此分解质量难以判定
      • 一个好的解码器可以通过覆盖原始样式从编码的输出表示中生成所需风格的文本,即可不需要分解内容和样式
      • 由于向量长度有限,所容纳信息有限,因此文本信息会有所损失,尤其是长文本
      • RNN作为编解码器捕捉句子中单词之间长程依赖性的能力较差
    • 发展
      • a cross-aligned auto-encoder 交叉对齐自编码器(2017)
      • combines variational auto-encoder and holistic attribute discriminators 结合变分自动编码器和整体属性鉴别器(2017)
      • 以及基于上面方法的一些改进办法
  • 非分解方式

    • a cycled reinforcement learning method 循环强化学习方法(2018)
    • a three-stage method 三步法(2018)
      • 提取内容词汇
      • 提取目标风格的介词
      • 组合
    • denoising Auto-encoder and back-translation 将文本风格转换问题转变为无监督机器翻译问题
  • 如上两者方式的不足:没有注意力机制,具有长程依赖问题

  • 本文方式

    • 第一个引入Transformer 模型
    • 引入一种新颖的训练方法,该方法不用基于分离隐空间的假设,因此可以采用注意力机制来进一步提高性能
    • 效果好

模型

问题描述

将一种风格的文本转为另一种风格的文本:
{ D i } , i = 1 , 2 , . . . , k \{D_i\},i=1,2,...,k {Di},i=1,2,...,k表示 k k k个数据集,每个数据集一种风格,即有 k k k种风格 { s i

这篇关于《Style Transformer: Unpaired Text Style Transfer without Disentangled Latent Representation》浅析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/704655

相关文章

浅析Python中的绝对导入与相对导入

《浅析Python中的绝对导入与相对导入》这篇文章主要为大家详细介绍了Python中的绝对导入与相对导入的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1 Imports快速介绍2 import语句的语法2.1 基本使用2.2 导入声明的样式3 绝对import和相对i

前端 CSS 动态设置样式::class、:style 等技巧(推荐)

《前端CSS动态设置样式::class、:style等技巧(推荐)》:本文主要介绍了Vue.js中动态绑定类名和内联样式的两种方法:对象语法和数组语法,通过对象语法,可以根据条件动态切换类名或样式;通过数组语法,可以同时绑定多个类名或样式,此外,还可以结合计算属性来生成复杂的类名或样式对象,详细内容请阅读本文,希望能对你有所帮助...

浅析如何使用Swagger生成带权限控制的API文档

《浅析如何使用Swagger生成带权限控制的API文档》当涉及到权限控制时,如何生成既安全又详细的API文档就成了一个关键问题,所以这篇文章小编就来和大家好好聊聊如何用Swagger来生成带有... 目录准备工作配置 Swagger权限控制给 API 加上权限注解查看文档注意事项在咱们的开发工作里,API

浅析Rust多线程中如何安全的使用变量

《浅析Rust多线程中如何安全的使用变量》这篇文章主要为大家详细介绍了Rust如何在线程的闭包中安全的使用变量,包括共享变量和修改变量,文中的示例代码讲解详细,有需要的小伙伴可以参考下... 目录1. 向线程传递变量2. 多线程共享变量引用3. 多线程中修改变量4. 总结在Rust语言中,一个既引人入胜又可

浅析Spring Security认证过程

类图 为了方便理解Spring Security认证流程,特意画了如下的类图,包含相关的核心认证类 概述 核心验证器 AuthenticationManager 该对象提供了认证方法的入口,接收一个Authentiaton对象作为参数; public interface AuthenticationManager {Authentication authenticate(Authenti

【Python报错已解决】AttributeError: ‘list‘ object has no attribute ‘text‘

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 前言一、问题描述1.1 报错示例1.2 报错分析1.3 解决思路 二、解决方法2.1 方法一:检查属性名2.2 步骤二:访问列表元素的属性 三、其他解决方法四、总结 前言 在Python编程中,属性错误(At

(入门篇)JavaScript 网页设计案例浅析-简单的交互式图片轮播

网页设计已经成为了每个前端开发者的必备技能,而 JavaScript 作为前端三大基础之一,更是为网页赋予了互动性和动态效果。本篇文章将通过一个简单的 JavaScript 案例,带你了解网页设计中的一些常见技巧和技术原理。今天就说一说一个常见的图片轮播效果。相信大家在各类电商网站、个人博客或者展示页面中,都看到过这种轮播图。它的核心功能是展示多张图片,并且用户可以通过点击按钮,左右切换图片。

Transformer从零详细解读

Transformer从零详细解读 一、从全局角度概况Transformer ​ 我们把TRM想象为一个黑盒,我们的任务是一个翻译任务,那么我们的输入是中文的“我爱你”,输入经过TRM得到的结果为英文的“I LOVE YOU” ​ 接下来我们对TRM进行细化,我们将TRM分为两个部分,分别为Encoders(编码器)和Decoders(解码器) ​ 在此基础上我们再进一步细化TRM的

【ReactJS】困惑于text/babel与browser.js还是babel.js?

使用JSX   使用JSX,可以极大的简化React元素的创建,JSX抽象化了React.createElement()函数的使用,其语法风格类似于HTML语法风格。对比如下代码可以让你更好的理解这一点。 // 使用React.createElement()return React.createElement('div',null,'Hello',this.props.name);//使用J

访问controller404:The origin server did not find a current representation for the target resource

ider build->rebuild project。Rebuild:对选定的目标(Project),进行强制性编译,不管目标是否是被修改过。由于 Rebuild 的目标只有 Project,所以 Rebuild 每次花的时间会比较长。 参考:资料