论文笔记 | Simple and Effective Text Matching with Richer Alignment Features

本文主要是介绍论文笔记 | Simple and Effective Text Matching with Richer Alignment Features,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


作者:李瑾

单位:燕山大学


论文地址: https://arxiv.org/pdf/1908.00300.pdf
代码地址:https://github.com/hitvoice/RE2


目录

  • 一、 概述
  • 二、 模型
    • 2.1 模型介绍
    • 2.2 Augmented Residual Connections
    • 2.3 Alignment Layer
    • 2.4 Fusion Layer
    • 2.5 Prediction Layer
  • 三、 实验分析

一、 概述

  文本匹配任务是自然语言处理的核心任务。包括自然语言推断(Natural Language Inference)、释义识别(Paraphrase Identification)、回答选择(Answer Selection)等众多的任务。因此,对于通用文本匹配模型的研究非常重要。
  论文提出了RE2模型,作者在SNLI、SciTail 、Quora Question 、WikiQA数据集上分别与之前的模型做了比较。相比较之前的模型来说,RE2模型的速度更快,鲁棒性也有所提升,同时在不同的文本匹配任务上都取得更好的效果。

二、 模型

2.1 模型介绍

  图中的白色矩形表示词向量,带条纹的矩形表示经过模块输出后的残差向量,黑色矩形表示经过Encoder编码后的向量。
  在RE2模型中,将需要进行文本匹配的文本分别输入图中所示模型(右侧模型与左侧一致)。将Encoder、Alignment和Fusion打包成一个块,连续堆叠N次。在块中,将Encoder得到的向量与它的输入进行拼接作为Alignment和Fusion的输入,在每一次堆叠的过程中都将上一次Fusion的结果作为Encoder输入。最后将N次堆叠结果送入Polling层,通过预测层得到结果。需要注意的是,两段文本的Alignment参数是共享的,但N个块的参数都是独立的。

2.2 Augmented Residual Connections

  为了为Alignment提供丰富的文本特征,作者使用增强剩余连接来连接打包好的块。
第n个块 x ( n ) x^{(n)} x(n)(n≥2)的输入是拼接第一个块 x ( 1 ) x^{(1)} x(1)的输入与前两个块的输出之和的结果:
x i ( n ) = [ x i ( 1 ) ; o i ( n − 1 ) + o i ( n − 2 ) ] x_{i}^{(n)} = [x_{i}^{(1)};o_{i}^{(n-1)}+o_{i}^{(n-2)}] xi(n)=[xi(1);oi(n1)+oi(n2)]
  使用剩余残差连接,使得融合和对齐的输入均包括了嵌入特征、残差特征和通过Encoder编码的上下文序列特征。作者对着三种特征均做了消融实验,实验结果表明,三种特征在文本匹配的过程中均起到了作用。

2.3 Alignment Layer

  在对齐的过程中,作者使用文本a( a = a 1 , a 2 , . . . . a l a a = a_{1},a_{2},....a_{l_{a}} a=a1,a2,....ala)和文本b( b = b 1 , b 2 , . . . . b l b b = b_{1},b_{2},....b_{l_{b}} b=b1,b2,....blb)的相同位置的向量点积作为投影向量,以此来衡量相似度( e i j e_{ij} eij):
e i j = F ( a i ) T F ( b j ) e_{ij} = F(a_{i})^{T}F(b_{j}) eij=F(ai)TF(b</

这篇关于论文笔记 | Simple and Effective Text Matching with Richer Alignment Features的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1017993

相关文章

uva 10014 Simple calculations(数学推导)

直接按照题意来推导最后的结果就行了。 开始的时候只做到了第一个推导,第二次没有继续下去。 代码: #include<stdio.h>int main(){int T, n, i;double a, aa, sum, temp, ans;scanf("%d", &T);while(T--){scanf("%d", &n);scanf("%lf", &first);scanf

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓