SIGIR 2019 | Teach Machine How to Read : Reading Behavior Inspired Relevance Estimation

本文主要是介绍SIGIR 2019 | Teach Machine How to Read : Reading Behavior Inspired Relevance Estimation,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在本论文中,作者先总结了受实际用户行为模式而来的阅读启发法(reading heuristic),这些启发可以被分为显式和隐式。通过重新审视现有的检索的模型及其变形,论文作者发现,它们仅满足了一部分的阅读启发法。通过消融学习,作者指出每个阅读启发对检索性能都有积极的影响。同时整合了全部有效的阅读启发法进去了检索模型,并将它命名为Reading Inspired Model(RIM)。实验结果表明RIM的性能超过了现在大多数的模型,说明了阅读启发法的有效性。

论文地址:
http://www.thuir.org/group/~YQLiu/publications/SIGIR2019Li.pdf

引言

在判断相关性的阅读行为和普通的阅读行为是不一致的。当需要获得某些知识去满足用户的信息需求时,他们有许多特别的阅读模式。一般来说,有这样的三种模式,1)大部分的注意力是在文章的开头的,而且当越往下阅读时,这些注意力会逐步递减。2)阅读的注意力在一篇文档里面是有选择的,而不是均匀分布在整个文档。3)一旦用户有了一个可信的相关性判断,他们会通过跳过某些片段甚至终止阅读来减少阅读时间。
检索模型是为了评估query和众多documents之间的相关度,对用户行为的理解可以在相关度评判和检索模型设计中提供有价值的信息。然而,现在的检索模型主要集中在query和document的匹配程度,而忽略了从用户阅读行为中得到的启发。
该论文的主要贡献有三个方面:
1)详细研究了实际用户在做出相关性判断时的阅读模式,并提出了六种的阅读启发法。
2)检验了这六种阅读启发法的有效性,并根据有效的阅读启发法结合强化学习框架提出了一个新的阅读启发的检索模型(RIM)
3)作者所提出的模型在一个大规模数据集和两个NTCIR数据上面的效果都超越现有大多数的模型。

相关工作

用户阅读行为是一个复杂的认知过程,通过收集用户眼球的运动数据来进行研究的。眼球运动包含了眼定和眼动两个过程。然而,在信息检索中的阅读行为与一般的阅读行为是不一致的。用户通常会跳过无关的句子和选择比较重要的句子去进行细读,但他们对已经阅读过的文档有比较清楚的理解后,他们会通过跳读来加快阅读速度,甚至直接停止阅读。许多的实验表明,好的检索模型是和用户的行为紧密相关的。
检索模型主要有统计的和基于深度学习的。基于深度学习的又分为基于表示的和基于交互的。基于表示的是指对query和document通过encoder获得他们的向量表示,对这些表示计算余弦相似度得到相关性。然而,这些模型都较少使用了阅读启发。该论文主要是全面、系统地研究用户的阅读模式以及将这些阅读模式加入到检索模型中。
在该论文中,作者也使用了强化学习去建模显式的阅读启发,其中的选择性注意力(selective attention)和早停止(early stop)可以被认为是马尔科夫决策过程中的动作。

相关性判断里面的阅读启发

相关性判断中共有六种阅读启发。分别为顺序阅读(sequential reading)、垂直递减注意力(vertical decaying attention)、问题中心指引(query centric guidance)、上下文有关阅读(context-aware reading)、选择性注意力(selective attention)、阅读早停止(early stop reading)。对于每个阅读启发的具体含义,可以参考图1。在图1中,a-d是隐式的,e-f是显式。
图1. 各个阅读启发的含义
现有的模型包含了上面这些阅读启发中的一种或者几种,也可以没包含。各个模型可能包含的阅读启发如图2所示。
图2.检索模型所具有的阅读启发类型

阅读启发的模型

对于隐式的阅读启发,作者在模型中加入特殊的设计。例如,问题中心指引这个启发指出了怎么去对问题和文章之间语义匹配进行建模。对于显式的阅读启发,我们将他们建模为马尔科夫决策过程,而这个过程是通过强化学习来进行优化。RIM的流程图如图3所示。
图3. RIM流程图

Local Matching Layer

该层的目的主要是通过问题中心指引去捕捉query和document之间的语义匹配。主要是构建两个矩阵 M c o s M^{cos} Mcos M x o r M^{xor} Mxor,公式如下所示:

其中的, w i w_i wi代表query里面的第i个单词, v j v_j vj代表有个T个句子的document d里面某个句子里面的第j个单词。对于矩阵 M c o s M^{cos} Mcos M x o r M^{xor} Mxor里面的每个元素 M i j M_{ij} Mij,我们可以延展其为三维矩阵。公式如下所示:




其中 W c W_c Wc为在训练中学习的压缩矩阵。最终的句子embedding输出为串联两个交互矩阵。如下所示:

隐式启发模型

对于顺序阅读,可以通过selector选择需要阅读的句子,并将这些挑选出来的句子顺序输入到一个RNN模型里面。RNN模型包含了上下文有关阅读这个隐式阅读启发。将RNN模型换为一个简单的非线性模型即可取消上下文有关的阅读启发。RNN模型的计算公式如下所示:

其中的 T ’ T’ T是选择出来的句子的个数,小于 T T T
对于垂直递减注意力,可以对用户真实的注意力分布使用Gamma分布进行拟合。对于每个位置上面的注意力,计算如下所示:

其中的 p p p是一篇文档里面的垂直位置, l l l, k k k, θ θ θ是位置参数,分别为1.36、4.37和1.36。这个衰减因子加入到RNN模型的隐状态的输出。计算公式为:

获得 T ’ T^’ T个状态输出后,将这些状态通过一个全连接层,获得一个相关度的分数,选择前K个分数比较高的句子。

显式启发建模

选择性注意力和早停止是两种显式阅读启发,可以通过马尔科夫决策过程进行模拟。在图3中,真体Selector控制着我们的模型需要阅读哪些句子,或者跳过哪些句子。另外一个真体Finish Net控制着是否提前终止阅读,和评估该文章的相关度。这两个真体的决策策略公式如下所示:

σ σ σ是一个sigmoid函数。在训练阶段,会采用上面的公式进行采样。在测试阶段,会使用最大的概率值的动作进行预测。
该模型采用了延迟奖励的方式去引导策略学习。而且针对三种的结果形式,使用了三种不同的奖励表达。如下所示:

使用了REINFORCE算法和策略梯度方法去最大化预期的奖励。该策略的梯度如下所示:

实验

在该实验小节中,主要是为了验证所提出的六种阅读启发有没有效果,还有整合了六种阅读启发的RIM相对其他模型提升的效果,。
主要使用的数据集如图4所示。其中的click代表点击模型给出来的点击相关度标签,而Mannual指的是人类标注的标签。
图4.两种数据集
BaseReader是对RIM模型去除了显式阅读启发和垂直递减注意力后得到的模型,和HiNT在顺序阅读里面得到的结果如图5所示。可以发现顺序阅读可以大幅度提高排序的性能。
图5. HiNT和BaseReader在不同顺序下面的ranking性能表现
在图6中,作者指出,垂直递减注意力对模型的性能没有改变。
图6. HiNT和BaseReader在是否添加垂直递减注意力时的ranking性能表现
在图7中,作者指出对于点击相关的标签数据集,上下文相关的阅读启发是有提升效果的,而对于人类标注的标签则没有提升效果。
图7. HiNT和BaseReader在是否添加上下文相关阅读时的ranking性能表现
对于显式阅读启发,RIM-select是在BaseReader的基础上加上selector,而RIM-stop是在BaseReader的基础上加上了Finish Net。图8表明了两者在检索模型上面均有明显的提升。
图8. BaseReader与分别添加两种不同的阅读启发时的ranking性能表现
总的来说,在这六种阅读启发中,只有垂直递减注意力是没有起效果的。因此,在作者把它排除到了整合后的RIM之外。整合了五种阅读启发的RIM和其他检索模型的ranking性能对比如图9所示。
图9.RIM和其他检索模型的ranking性能对比
从图9可以看出,RIM在大多数的指标上面超过了其他的基础模型。

结论

该论文详细列出了全部的人阅读行为带来的启发改进,并系统地研究了这六种的加入到模型后是否有性能上面的提升,在整合了有效的五种阅读启发加入的检索模型RIM,性能在各种指标上面都超越了其他的基础模型。
本文研究的仔细和深入值得我们好好学习。



扫码识别关注,获取更多新鲜论文解读

这篇关于SIGIR 2019 | Teach Machine How to Read : Reading Behavior Inspired Relevance Estimation的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/588602

相关文章

BUUCTF靶场[web][极客大挑战 2019]Http、[HCTF 2018]admin

目录   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 [web][HCTF 2018]admin 考点:弱密码字典爆破 四种方法:   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 访问环境 老规矩,我们先查看源代码

vue 父组件调用子组件的方法报错,“TypeError: Cannot read property ‘subDialogRef‘ of undefined“

vue 父组件调用子组件的方法报错,“TypeError: Cannot read property ‘subDialogRef’ of undefined” 最近用vue做的一个界面,引入了一个子组件,在父组件中调用子组件的方法时,报错提示: [Vue warn]: Error in v-on handler: “TypeError: Cannot read property ‘methods

[轻笔记] pip install : Read timed out. (closed)

添加超时参数(单位秒) pip --default-timeout=10000 install ${package_name}

Cannot read property ‘length‘ of null while opening vscode terminal

同一问题地址:Cannot read property ‘length’ of null while opening vscode terminal 问题描述 One day, 我在ubuntu 18.04下用vscode打开一个项目,并想和往常一样在vscode使用终端,发现报错Cannot read property 'length' of null。 解决 打开setting.jso

ZOJ 3324 Machine(线段树区间合并)

这道题网上很多代码是错误的,由于后台数据水,他们可以AC。 比如这组数据 10 3 p 0 9 r 0 5 r 6 9 输出应该是 0 1 1 所以有的人直接记录该区间是否被覆盖过的方法是错误的 正确方法应该是记录这段区间的最小高度(就是最接近初始位置的高度),和最小高度对应的最长左区间和右区间 开一个sum记录这段区间最小高度的块数,min_v 记录该区间最小高度 cover

2019学习计划

工作三年了,第一年感觉是荒废的,第二年开始学习python,第三年开始自动化 感觉自己会的东西比较少,而且不够深入,流于表面 现制定一下今年大概的学习计划 需持续巩固加强:python、ui自动化、接口自动化、sql等 代码量需提升,敲的不够(重点) 学习: 1.移动端测试,appium等 2.前端知识系统整理学习  3.性能测试 4.docker入门,环境搭建 5.shell

王立平--Failed to push selection: Read-only file system

往android模拟器导入资源,失败。提示:只读文件、 mnt是只读文件。应点击sdcard,,在导入

uniapp微信小程序开发踩坑日记:Pinia持久化报错Cannot read property ‘localStorage‘ of undefined

插件默认使用 localStorage 实现持久化,小程序端不兼容,需要替换持久化 API import { defineStore } from 'pinia'   export const useCommonStore = defineStore('pack-store', {state: (): State => ({wwInfo: {},globalData: {},timerLoc

最简单的使用JDBC[连接数据库] mysql 2019年3月18日

最极简版本的, 我们这里以mysql为例: 首先要创建maven工程, 需要引入jar包:,这里需要注意, 如果你安装的是mysql最新版本8以上的, 下面有些地方需要更改,具体就是mysql连接的url, 和5版本的不一样,具体解决请自行百度哈.这里只演示mysql5版本的? 依赖: <dependency>   <groupId>mysql</groupId>   <artifactId

macos 系统文件操作时提示 Read-only file system 解决方法

这个情况是因为文件系统为只读, 需要我们执行一下命令重新将系统文件挂载为读写模式, 命令如下: sudo mount -uw / 这里的 mount 就是硬盘挂载命令, 后面的 -uw选项说明如下, 最后的 / 表示的是跟目录, 可以指定要修改的挂载路径,也可以默认. -u     -u标志表示应更改已装载文件系统的状态。上述任何选项(-o选项)都可以更改;文件系统也可以从只读更改为读写,