POSIT-DRMM(18’Google)

2023-10-11 02:59
文章标签 18 google posit drmm

本文主要是介绍POSIT-DRMM(18’Google),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

 Deep Relevance Ranking Using Enhanced Document-Query Interactionshttps://github.com/nlpaueb/deep-relevance-ranking.

Introduction

在DRMM(它使用对上下文不敏感的术语编码和查询-文档术语交互)的基础上,整个模型中注入了丰富的对上下文敏感的编码。并研究了多种变体。都为基于交互的神经检索模型。

预备知识

DRMM(匹配直方图):
在这里插入图片描述
PACRR和PACRR-DRMM
在这里插入图片描述
PACRR:首先计算q和d的相似度矩阵,然后卷积—max pooling----按行取k-max pooling—形成多个(filter的数量)矩阵—将所有矩阵行进行连接送入Dense layers—得到匹配得分
PACRR-DRMM:将每一行用一个独立的MLP评分,最后通过线性层汇总

ABEL-DRMM

在这里插入图片描述

Context-sensitive Term Encodings

与PACRR不同,ABEL-DRMM将交互信息融入在编码之后,具体地:
首先使用Bi-LSTM编码q和d(pre-train embedding),然后将原始编码和输出的隐藏状态结合,作者认为这个空间中的相似性已经是上下文敏感的:
在这里插入图片描述
形式上:
给定文档 d d d={ d 1 d_1 d1,…, d m d_m dm}和查询 q q q={ q 1 q_1 q1,…, q n q_n qn},首先计算每一个 d j d_j dj q i q_i qi的注意力分数(点乘):
在这里插入图片描述
得到 d d d q q q的关注表示:
在这里插入图片描述
然后结合q得到doc-aware query 编码(可以使用多种函数代替:比如;欧氏距离的平方)(L2正则化):
在这里插入图片描述
直观地说,如果文档包含一个或多个与 q i q_i qi相似的terms d j d_j dj,attention机制将会更加强调这些terms

POSIT-DRMM

在这里插入图片描述

出发点

既希望模型奖励q-term和文档之间的最大number匹配,也奖励(几个q-term和文档之间的)平均匹配,以奖励具有更高匹配密度的文档。ABEL-DRMM的doc-aware q-term 评分没有考虑到这一点,因为注意力总和隐藏了单个或多个 term 是否高度相似匹配。

细节

首先,使用余弦相似度计算每一个 d j d_j dj q i q_i qi的注意力分数(注意,没有softmax):
在这里插入图片描述
接下来并不加权,而是连接这些注意力分数:
在这里插入图片描述
然后再 a i a_i ai上应用两个pooling操作创造一个 q i q_i qi的2维doc-aware编码:
在这里插入图片描述

多view

第二个view是将pre-train的q和d的嵌入看作另外2个维度
第三个view是q和d的one-hot向量作为2个维度

实验

 https://github.com/nlpaueb/deep-relevance-ranking.

任务:re-rank
dataset :TREC ROBUST 2004 and BioASQ
结果:
在这里插入图片描述
attention 可视化:
在这里插入图片描述

这篇关于POSIT-DRMM(18’Google)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/185013

相关文章

消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法

消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法   消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法 [转载]原地址:http://blog.csdn.net/x605940745/article/details/17911115 消除SDK更新时的“

react笔记 8-18 事件 方法 定义方法 获取/改变数据 传值

1、定义方法并绑定 class News extends React.Component {constructor(props) {super(props)this.state = {msg:'home组件'}}run(){alert("我是一个run") //方法写在类中}render() {return (<div><h2>{this.state.msg}</h2><button onCli

com.google.gson.JsonSyntaxException:java.lang.IllegalStateException异常

用Gson解析json数据的时候,遇到一个异常,如下图: 这个异常很简单,就是你的封装json数据的javabean没有写对,你仔细查看一下javabean就可以了 比如:我的解析的代码是             Gson gson = new Gson();             ForgetJson rb = gson.fromJson(agResult.mstrJson, For

Google Earth Engine——高程数据入门和山体阴影和坡度的使用

目录 山体阴影和坡度 对图像应用计算 应用空间减速器 高程数据 通过从“重置”按钮下拉菜单中选择“清除脚本”来清除脚本。搜索“elevation”并单击 SRTM Digital Elevation Data 30m 结果以显示数据集描述。单击导入,将变量移动到脚本顶部的导入部分。将默认变量名称“image”重命名为“srtm”。使用脚本将图像对象添加到地图: Map

The import com.google cannot be resolved

The import com.google cannot be resolved,报错: 第一感觉就是缺少jar包,因为项目用maven管理,所以在pom.xml中添加: <dependency>  <groupId>com.google.code.gson</groupId>  <artifactId>gson</artifactId>  <version>2.3.1</ver

C++常见异常汇总(三): fatal error: google/protobuf/port_def.inc

文章目录 1、fatal error : sw/redis++/redis.h2、fatal error: dwarf.h: No such file or directory3、fatal error: elfutils/libdw.h: No such file or directory4、fatal error: libunwind.h: No such file or directo

Day18_0.1基础学习MATLAB学习小技巧总结(18)——MATLAB绘图篇(1)

利用空闲时间把碎片化的MATLAB知识重新系统的学习一遍,为了在这个过程中加深印象,也为了能够有所足迹,我会把自己的学习总结发在专栏中,以便学习交流。 参考书目:《MATLAB基础教程 (第三版) (薛山)》 之前的章节都是基础的数据运算用法,对于功课来说更加重要的内容是建模、绘图、观察数据趋势,接下来我会结合自己的使用经验,来为大家分享绘图、建模使用的小技巧。 二维图形绘制 在本章开

18. 4 Sum

题目: 解答: 与之前的三数之和的解法类似,也是先排序,然后不断剔除不可能的条件,最后两个参数,通过两头求和计算得出。 代码: class Solution {public:vector<vector<int>> fourSum(vector<int>& nums, int target) {vector<vector<int>> result;int len = nums.size

系统架构师考试学习笔记第三篇——架构设计高级知识(18)面向服务架构设计理论与实践

本章考点:         第18课时主要学习面向服务架构设计理论与实践。根据考试大纲,本课时知识点会涉及单选题型(约占2~5分)和案例题(25分),本课时内容偏重于方法的掌握和应用,根据以往全国计算机技术与软件专业技术资格(水平)考试的出题规律,概念知识的考查内容多数来源于实际应用,还需要灵活运用相关知识点。         本课时知识架构如图18.1所示。 一、SOA的相关概念 (

AI聊天应用不能上架?Google play对AI类型应用的规则要求是什么?

随着生成式AI模型的广泛应用,很多开发者都有在开发AI应用或将其整合到应用中。我们知道,谷歌是非常注重应用生态的,去年开始就推出了一些针对生成式AI应用的政策,对AI应用的内容质量和合规性问题提出了一些要求。 几天前,还有开发者聊到,现在AI类型应用(如AI聊天)上架越来越难了。 (可斯信进qun与众多开发者交流上架经验) 这很可能是没了解清楚Google play 对AI应用的一些