论文笔记-语境重构

2024-03-24 15:40
文章标签 笔记 论文 重构 语境

本文主要是介绍论文笔记-语境重构,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原文出自彼得攀的小站

论文来自于华为和滑铁卢大学
该文章主要针对解决了汉语对话中语境重构的问题,即把代词、零代词等指称短语替换为它们指代的名词,这样可以在没有上下文中的情况,直接对当前对话句子进行处理。

Motivation

  • 作者认为语境重构任务可以被分解为引用表达式检测(即代词和零代词检测)和引用还原(将代词还原为所指代的实体)
    基于这样的认知,作者提出了一种新的端到端结构,来完成语境重构任务。该模型的主要特点是它包括基于神经网络的词性和位置编码以及一种新的代词掩模机制。

  • 在构建此类模型时,一个长期存在的问题是缺乏训练数据,为解决这个问题,本文通过扩展以前提出的方法来生成大量实际的训练数据。由于结合了更多的数据和更好的模型,在共同引用解析(coreference resolution )和端到端上下文重建方面,本文模型可以获得比最先进的方法更高的精度

语境重构的目标是,从对轮对话历史中恢复历史信息,这样可以消除当前对话对于之前对话历史的依赖->这样当前对话的句子可以有全部且上下文无关的语义信息。

Introduction

文章利用词性标注模型来来解决指代和省略问题

文章的主要贡献:

  1. 将对话语境重构问题定义为一个检测问题和一个排序问题,并提出了其与传统的代词检测和零代词检测等任务的区别,提出了候选项的选择
  2. 分析了神经网络在对话系统中的应用,包括step-step和end-to-end的方法
  3. 提出了对话语境重构任务,并提出了一种构建大量有效数据的方法

coreference resolution(指代还原)被认为是两个任务:

  • referring expressions detection
    referring expression主要包含两个部分:
    1. 代词: 如: 他/he,她/she
    2. 零代词:在汉语中十分普遍,汉语有一个特征:“倘若一个名词短语能够在阅读的过程中被他人从该名词短语所处的语境中猜测出其语义,那么这一名词短语就不需要在该句中明确地出现”,这种语法现象曾经被认为是省略,但现在大多认为是零回指/零代词

与该任务接近的任务是coreference detection,该任务旨在寻找指代相同实体的名词短语和代词。

  • mention candidate ranking
    该任务旨在将detection任务找到的referring expression还原为对应的实体

论文经过实验发现coreference detection(尤其是zero pronoun detection)是语境重构任务的瓶颈。

Method

语境重构任务可以被分为两个子任务:detection and resolution

Detection是一个序列标注任务,其会去识别需要被恢复的referring experssion,代词会被标记出来,零回指则会以一个符号∅来标记
Resolution是一个ranking的任务,对detection出来的referring expression, 进行排序。排序对象是一个三元组。

上图是一个语境重构的例子:假设一个输入话语为q,它的上下文由c来重构的(c来源于之前的对话)。
在detection任务中,输入q中的的她(代词)和∅(省略的零代词)会被识别出来。

在resolution任务中,会对三元组 ( c , q , m ) (c,q,m) (c,q,m)进行排序,其中 m ∈ { m 1 , m 2 , … , m k } m\in\{m_1,m_2,… ,m_k\} m{m1,m2,,mk}是c中被挑选出来作为candidate的名词短语。在推理时,选择得分最高的candidate m作为替代词。这里选用的是Pairwise的排序模型。c和q是为了共同得到referring expression的representation。而例子中,“她”被替换为女朋友,“∅”被替换为短信

Masking Structure:即加入一个masked sentence representation层,即将序列标注的结果作为mask vector, 和sentence representation 相乘,从而得到一个masked sentence representation 。该过程会突出代词/零代词附近的词。

该论文还引入了一种构建数据集的方式:从百度知道和搜狗问问的数据中构建,为了生成可用的数据,作者使用了以下方式

  • 代词: 用代词来替换句子中的实体
  • 零代词: 省略句子中的实体
  • 负样本:
    • 不包括代词和零代词的样本
    • 包括代词和零代词,但是没有对应candidate的词

作者构建的数据集叫CAQ.

实验结果

论文在三个数据集中做了实验CONLL2012,OntoNote,CQA数据集
Detection
在CQA数据集上的referring expression detection结果

在CQA数据集上的mention candidate排序结果

Resolution
在CQA数据集上coreference resolution任务的结果

在CONLL2012上, 零代词mention candidate ranking的结果

End-to-end
在OntoNote数据集上,zero pronoun resolution 任务的结果

这篇关于论文笔记-语境重构的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/842036

相关文章

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

《offer来了》第二章学习笔记

1.集合 Java四种集合:List、Queue、Set和Map 1.1.List:可重复 有序的Collection ArrayList: 基于数组实现,增删慢,查询快,线程不安全 Vector: 基于数组实现,增删慢,查询快,线程安全 LinkedList: 基于双向链实现,增删快,查询慢,线程不安全 1.2.Queue:队列 ArrayBlockingQueue:

操作系统实训复习笔记(1)

目录 Linux vi/vim编辑器(简单) (1)vi/vim基本用法。 (2)vi/vim基础操作。 进程基础操作(简单) (1)fork()函数。 写文件系统函数(中等) ​编辑 (1)C语言读取文件。 (2)C语言写入文件。 1、write()函数。  读文件系统函数(简单) (1)read()函数。 作者本人的操作系统实训复习笔记 Linux

LVGL快速入门笔记

目录 一、基础知识 1. 基础对象(lv_obj) 2. 基础对象的大小(size) 3. 基础对象的位置(position) 3.1 直接设置方式 3.2 参照父对象对齐 3.3 获取位置 4. 基础对象的盒子模型(border-box) 5. 基础对象的样式(styles) 5.1 样式的状态和部分 5.1.1 对象可以处于以下状态States的组合: 5.1.2 对象

DDS信号的发生器(验证篇)——FPGA学习笔记8

前言:第一部分详细讲解DDS核心框图,还请读者深入阅读第一部分,以便理解DDS核心思想 三刷小梅哥视频总结! 小梅哥https://www.corecourse.com/lander 一、DDS简介         DDS(Direct Digital Synthesizer)即数字合成器,是一种新型的频率合成技术,具有低成本、低功耗、高分辨率、频率转换时间短、相位连续性好等优点,对数字信

数据库原理与安全复习笔记(未完待续)

1 概念 产生与发展:人工管理阶段 → \to → 文件系统阶段 → \to → 数据库系统阶段。 数据库系统特点:数据的管理者(DBMS);数据结构化;数据共享性高,冗余度低,易于扩充;数据独立性高。DBMS 对数据的控制功能:数据的安全性保护;数据的完整性检查;并发控制;数据库恢复。 数据库技术研究领域:数据库管理系统软件的研发;数据库设计;数据库理论。数据模型要素 数据结构:描述数据库

【软考】信息系统项目管理师(高项)备考笔记——信息系统项目管理基础

信息系统项目管理基础 日常笔记 项目的特点:临时性(一次性)、独特的产品、服务或成果、逐步完善、资源约束、目的性。 临时性是指每一个项目都有确定的开始和结束日期独特性,创造独特的可交付成果,如产品、服务或成果逐步完善意味着分步、连续的积累。例如,在项目早期,项目范围的说明是粗略的,随着项目团队对目标和可交付成果的理解更完整和深入时,项目的范围也就更具体和详细。 战略管理包括以下三个过程

【软考】信息系统项目管理师(高项)备考笔记——信息化与信息系统

信息化与信息系统 最近在备考信息系统项目管理师软考证书,特记录笔记留念,也希望可以帮到有需求的人。 因为这是从notion里导出来的,格式上可能有点问题,懒的逐条修改了,还望见谅! 日常笔记 核心知识 信息的质量属性:1.精确性 2.完整性 3.可靠性 4.及时性 5.经济性 6.可验证下 7.安全性 信息的传输技术(通常指通信、网络)是信息技术的核心。另外,噪声影响的是信道

flex布局学习笔记(flex布局教程)

前端笔试⾯试经常会问到:不定宽⾼如何⽔平垂直居中。最简单的实现⽅法就是flex布局,⽗元素加上如下代码即 可: display: flex; justify-content: center; align-items :center; 。下⾯详细介绍下flex布局吧。   2009年,W3C提出了 Flex布局,可以简便⼂完整⼂响应式地实现各种页⾯布局。⽬前已得到了所有浏览器的⽀持,这意味着,现