一种基于知识库回答多步复杂问题的查询图生成方法 翻译

2024-06-21 07:38

本文主要是介绍一种基于知识库回答多步复杂问题的查询图生成方法 翻译,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公众号 系统之神与我同在

Query Graph Generation for Answering Multi-hop Complex Questions from Knowledge Bases​aclanthology.org/2020.acl-main.91/

摘要

过去,知识库中的复杂问题通常被分为两类:有约束的问题和有多重关系的问题。在本文中,我们提出一种方法能够同时处理这两类问题。由于早期在查询图中加入约束可以更有效的修剪搜索空间,我们基于这个观点,提出了一种改进的,分阶段的查询图生成方法。实验结果表明,该方法在三个基准知识库问答数据集上达到了先进水平。

  1. 导言

知识库问题回答(KBQA)旨在回答知识库(KB)中的仿真问题。近年来,这一方向受到大量关注(Bordes et al., 2014; Xu et al., 2016; Yu et al.,2017; Liang et al., 2017; Hu et al., 2018; Petrochukand Zettlemoyer, 2018.)。早期关于知识库问题回答(KBQA)的工作侧重于包含单一关系的简单问题(Yih et ai.,2014;Bordes et ai.,2015;Dong et ai.,2015;Hao et ai.,2017)。然而,现实问题往往更加复杂,近年来有学者针对复杂的知识库问答(KBQA)展开了研究。

近些年的研究针对两种复杂问题:(1)有约束的单步关系的问题。例如,在问句“谁是美国第一任总统?”答案实例“总统”和问题实例“美国”之间只有单步关联,同时,我们又有“第一任”总统的约束需要满足。对于这类复杂问题,前人已经提出了一种分阶段的查询图生成方法,该方法首先识别单步关系的路径,然后对其添加约束以形成查询图(Yih et ai.,2015;Bao et ai.,2016;Euo et ai.,2018)。(2)具有多步关系的问题。例如,在问题“谁是Facebook创始人的妻子?”中,答案与“Facebook”有关,经过了“创始人”和“妻子”两步的关系。为了回答这类多步关系(multiple hops)问题,我们需要考虑更长的关系路径,以便获得正确的答案。这里的主要挑战是如何限制搜索空间,即减少要考虑的多步关系路径的数目,因为搜索空间随着关系路径的长度成指数增长。一个想法是使用束搜索(beam shearch)。例如,Chen et ai(2019)和Ean et ai(2019b)建议在扩展关系路径时仅考虑最佳匹配关系,而不是考虑所有关系。然而,几乎没有人提出能够同时处理这两种复杂问题的方法。

本文针对复杂知识库问答(KBQA)问题,提出了一种能够同时处理约束问题和多步问题的方法。我们提出了改进的分段查询图生成方法,使得该方法可以处理更长的关系路径。然而,我们不是在构造关系路径之后才添加约束,而是同时引入约束和扩展关系路径。这允许我们更有效地减少搜索空间。在 ComplexWebQuestions数据集上,我们的方法大大优于现有的方法,在 Prec@1中改进了 3.3 个百分点,在 F1中改进了 3.9个百分点。在另外两个基准知识库问答数据集上,我们的

方法也不低于以前的方法(达到了the-state-of-art)。

  1. 方法
    1. 预备知识

一个知识库(KB)可以表示为一个三元数组K.={(h,r,t)}。其中h和t是来自实例集ε的实例,和r是来自关系集R的一个关系。对于问题Q,知识库问答(KBQA)试图找到一个实例α∈ε回答该问题。

我们的方法很大程度上受到现有的分阶段的查询图生成方法的启发(Yih et ai,2015;Bao et ai,2016;Loo et ai,2018),我们在这里简要介绍这种方法。查询图有四种类型的节点:基础实例(阴影矩形)是知识库(KB)中现有的实例。存在变量(existential variables)(白底矩形)是一个不连续的实例(ungrounded entity)。lambda变量(圆)也是一个不连续的(ungrounded)实例,但它代表答案。最后,聚合函数(菱形)是对一组实体进行求和操作的函数,如argmin和count。查询图的边是来自关系集R的一个关系。查询图应恰好具有一个lambda变量来表示答案,至少一个基础实体,以及零个或多个存在变量和聚合函数。图 1 显示了“谁是 JeffProbst Show提名的TV制片人的第一任妻子”这一问题的示例查询图。

谁是被提名电视制片人的第一任妻子?

图1:上面显示的是一个问题的查询图的例子。假设我们从话题实例JeffProbstShow开始,核心关系路径是将JeffProbstShow链接到lambda变量x的路径。查询图中有两个约束。注意,y1和y3是用于n元关系的CVT节点。

我们将分阶段查询图的生成方法总结如下。(详见Yih et al., 2015; Bao et al., 2016)。

  1. 首先,从问题中找到的基础实体(称为主题实体),标识出将主题实体链接到lambda变量的核心关系路径2。现有研究考虑了包含单一关系的核心关系路径(Yih et ai, 2015; Bao et ai, 2016; Loo et ai, 2018)
  2. 在步骤1中标识的核心关系路径中,添加问题里的一个或多个约束。一个约束包含基础实例,聚合函数和一个关系。
  3. 对于从步骤1和步骤2生成的所有候选查询图,通过测量它们与问题的相似度来对它们排序。这通常通过诸如CNN的神经网络模型来完成(Yih et ai,2015;Bao et ai,2016)。
  4. 选取知识库(KB)执行排名最高的查询图以获得答案实体。

动机

图2:延伸连接集合体注意,查询图(d)对应于“谁是第一个被提名为候选人”的问题JeffProbst秀?”

当直接将上面概述的现有方法应用于受限多跳知识库问题回答(KBQA)时,我们面临的主要挑战是,包含多跳关系的问题(例如图1中的示例)不能被处理,因为现有工作仅考虑具有单跳的核心关系路径(或具有一个CVT节点的两跳)。如果我们通过允许核心关系路径更长来进行简单的修改,搜索空间会突然变得大得多。例如,在ComplexWebQuestions数据集上,如果我们允许核心关系路径高达3跳,那么平均而言,每个问题将有大约10,000个核心关系路径,这在计算上非常昂贵。

最近关于多跳知识库问答(KBQA)的工作通过定向搜索来解决该问题,即,在生成(t+l)跳关系路径之前仅保留前K项t-跳关系路径(Chen et al., 2019; Lanet al., 2019b)。然而,这种方法在生成关系路径时忽略了约束。我们观察到,在问题中发现的约束往往有助于减少搜索空间,并引导核心关系路径的生成朝着正确的方向发展。

以图1中的问题为例。给定一个部分核心关系路径(JeffProbstShow,natimated_for,y1,nominee,y2),如果我们要在y2扩展该路径,再增加一个关系,那么我们需要考虑与y2的绑定相关联的知识库(KB)中的所有关系,该知识库包括所有被JeffProbstShow提名的实体。但是如果我们先把约束(is_a,电视制片人)附加到y2,那么我们只需要考虑那些与“被提名参加JeffProbst秀的电视制片人”相关的关系。

因此,我们提出了一种改进的分阶段查询图生成方法,它不需要等待每个核心关系路径的完全生成再给其附加约束。这种更灵活的查询图生成方式,结合定向搜索机制和语义匹配模型来指导修剪,探索更小的搜索空间,同时仍然保持找到正确查询图的高几率。

  1. 查询图生成

形式上,我们的方法使用定向搜索迭代地生成候选查询图。我们假设第t次迭代产生一组K个查询图,记为为Gt。在第(t+l)次迭代中,对于每个g∈Gt,我们应用{extend、connect、aggregate}动作中的一个(在下面解释)来将g扩展到一个或更多的边缘和节点。我们为所有g∈Gt和适用于每个g的所有动作这样做。设G’t+1表示所有结果查询图的集合。然后,我们使用评分函数(在第2.4节中解释)对G’t+1中的所有查询图进行排序,并将它们的前K个放在Gt+1中。我们继续迭代直到不存在g∈Gt+1的得分比g∈Gt的得分高。

我们使用以下操作生成查询图。图2显示了这些操作的示例。

  1. 扩展操作(extend):通过R中的一个或者多个关系来扩展核心路径。如果当前查询图仅包含主题实体e,则扩展操作在知识库(KB)中找到与e相连的关系r,并增长路径r。它还使r的另一端成为lambda变量x。如果当前查询图具有lambda变量x,则扩展动作将x改变为存在变量y,通过对知识库(KB)执行当前查询图来在知识库(KB)中找到y的所有绑定,找到链接到这些实体之一的关系r,并且最后将r附加到y。r的另一端成为新的lambda变量x。
  2. 连接操作(connect):除了当前核心关系路径开始时的主题实体外,问题中经常发现其他基础实体。连接操作将这种基础实体e链接到任一个lambda变量x或者一个与x相连的存在变量的CVT节点6。为了决定使用哪个关系r来链接e和x,我们再次可以通过执行当前查询图来找到x的所有绑定,然后找到这些实体之一和e之间存在的关系。
  3. 聚合操作(aggregate):继Looet ai(2018)之后,我们可以使用一组预定义关键字从问题中检测聚合函数。聚合动作将检测到的聚合函数作为新节点附加到lambda变量x或一个CVT节点上(CVT节点:与x相连的存在变量)。

我们方法的新颖之处在于,扩展动作可以在连接和集合动作之后应用,而以前的方法不允许这样做。

  1. 查询图排序

在第t次迭代结束时,我们对G’t中的候选查询图进行排序。排序的方法是:为每个g∈G’t导出一个7维的特征向量vg,并将这些向量输入到一个全连接层,通过softmax函数导出p(g|Q)。

vg的第一个维度来自一个基于BERT的语义匹配模型。具体地说,我们通过构造g的一系列操作将g转换为一个关键词(token)序列,并在每个步骤向序列中依次添加实体和关系的文本描述。存在变量和lambda变量被忽略。例如,本文图2(a)所示的查询图被转换成以下序列:(jeff、probst、show、destination、for、adement)7

6在这里我们只考虑与lambda变量连接的存在变量,因为我们应该在过去的迭代中已经考虑其他存在变量。

7这个例子是为了说明目的。在实际的数据中,关系描述与图1中所展示的有所不同。因此,对于该示例,实际的token序列是不同的。我们还将问题转换为一系列标记。例如,“谁是Facebook创始人的妻子?”成为facebook创始人的妻子。然后,我们将查询图序列和问题序列连接成一个序列。

v的其他6个维度如下:第一个维度是查询图中所有基础实体的累计链接得分。第二个是查询图中出现的基础实体的数量。第三类至第三类分别是查询图中的实体类型、时间表达式和最高值。最后一个特性是查询图的回答实体的数量。

  1. 学习

为了训练我们的模型,我们使用成对的问题和正确答案,没有任何实际的真实查询图。在Daset ai(2018)框架下,我们使用REINFORCE算法以端到端的方式学习策略函数p_theta(g|Q),其中theta是我们想要学习的参数集,包括要更新的BERT参数和7维向量vg与全连接层的连接权重。我们使用Fl得分作为奖励函数。

实验实验

    1. 实施细则

我们的方法要求从问题中识别出实体,并将其链接到知识库(KB)中的相应条目。为了命名实体链接,我们使用ComplexWebQuestions数据集的现有链接工具8,以及与其他两个数据集的数据集一起发布的已经提取的主题实体。对于实体类型的链接,我们利用训练问题集和他们的答案来学习链接模型。对于时间表达式和最高链接,我们只是使用正则表达式和最高单词列表。最高级的单词人为映射到两个聚合函数:argmax和argmin。

我们使用BERT基础模型9来初始化排名器中的BERT模块。其它参数被随机初始化。对于BERT模型中的超参数,将丢弃率设置为0.1,隐层大小设置为768。神经元层数和多头注意力数被分别设置为6和12。我们使用最新的Freebase作为全部数据的知识库(KB),对于beam搜索,我们设置beam的大小K=3。

使用特殊的令牌[CLS]分隔它们。然后,我们使用标准的BERT模型(Devlin et ai..2019)处理整个序列,并在顶层获得分数。注意,我们在学习期间调整预训练的BERT参数。

  1. 数据集

我们使用三个数据集来评估我们的方法:ComplexWebQuestons(CWQ)(Talmor和Berant),

  1. 、WebQuestionsSP(WQSP)(Yih等人,2015年)和复杂问题(CQ)(Bao等人,2016年)。我们把ComplexWebQuestons(CWQ)作为主要的评估数据集,因为ComplexWebQuestons(CWQ)具有多跳关系和约束的复杂问题的比例非常高,如表1a.11所示。注意,我们不能为复杂问题(CQ)数据集收集类似的统计数据,因为它没有提供基础真值查询图,但我们观察到复杂问题(CQ)中的主要问题为1跳关系。
    1. 比较方法

我们将我们的方法和下面的现有方法相比较。首先,我们比较现有的无法处理多跳问题的分阶段查询图生成方法(Yih et ai,2015;Bao et ai,2016;Loo et ai,2018)。接下来,我们与(Lan et ai.,2019a)进行比较,后者可以处理约束并考虑多跳关系路径,但没有使用波束搜索或约束来减少搜索空间。我们还与(Chen et al.,2019)进行比较,它使用波束大小为1的波束搜索来处理多跳问题,但没有处理约束问题。最后,我们与(Bhutaniet al., 2019)和(Ansari et al., 2019)进行比较。Bhutaniet (2019)将复杂的问题分解为简单的问题,并在CWQ12上实现了Prec@1的SOTA。Ansari et ai(2019)通过从问题token逐个生成查询程序,在WebQuestionsSP(WQSP)上实现了SOTA。

  1. 主要结果

我们在表1b中显展示了总体比较。我们可以看到,在ComplexWebQuestons(CWQ)数据集上,我们的方法在F1和Prec@1上取得了最佳的效果,并且取得提升也很大,在Prec@1上有3.3%的提升,在F1上有3.9%的提升。这验证了我们的假设,即我们的方法特别适用于具有约束和多跳关系的复杂问题。对于其他两个数据集,WebQuestionsSP(WQSP)和复杂问题(CQ),我们的方法也达到了SOTA,优于以往的方法 ,证明了我们的方法的鲁棒性。

8该工具可以在https://developers.google.com/知识图上找到。

9预先训练的BERT基础模型可以在https://github.com/huggingface/pyphotor-transformers上找到。

10 知识库(KB)可从https://developers.google.com/freebase/下载。

11 注意,我们将具有CVT节点的2跳关系路径视为1跳路径。

12我们注意到,在ComplexWebQuestons(CWQ)的领导板中,Sun et ai(2019)实现了最好的Prec1。然而,它们的方法使用带注释的主题实体,因此这里不可比。

(c)

  1. 消融研究

我们还进行了一次消融研究以便更好地理解我们的模型。为了验证该方法的有效性不是由于BERT的使用,我们用LSTM代替了BERT。从表lc中可以看出,基于LSTM的方法的版本仍然可以胜过现有技术。这表明,我们的模型的有效性不仅仅是由于BERT的使用。我们还测试了我们方法的三个版本,每个版本都删除了一个操作,以便了解是否需要所有三个操作。结果也显示在表lc中。我们可以看到,聚合动作是最不重要的动作,而扩展动作是最重要的。然而,我们需要将所有三个行动结合在一起,以实现最佳性能。

  1. 误差分析

我们随机抽取100个错误案例进行人工检查。我们将错误归纳为以下几类。

排序错误:65%的错误来自查询图的错误预测。我们仔细观察这些错误案例。我们发现即使用人类的判断力也难以发现某些关系。例如,我们的模型错误地预测了“谁是尼克松的副总统?”正确的关系是“副总裁”。理解“副总裁”是“副总裁”的缩写,如果在培训数据中没有观察到这种映射,则需要外部知识。主题链接错误:我们观察到由于实体或表达式链接错误而出现的错误有27%以上。例如,“科里·泰勒弹什么吉他?”具有约束类型“吉他”,但是在链接过程中没有检测到它。生成限制:查询图生成策略的限制导致6%以上的错误。对于“约翰·亚当斯担任总统之前有哪些工作”的问题,我们不可能找到与我们的策略相匹配的查询图。

  1. 结论

本文针对多跳关系和约束的复杂问题,提出了一种改进的分段查询图生成方法。通过早期将约束引入查询图中,结合束搜索,可以限制搜索空间。实验表明,在ComplexWebQuestions数据集上,我们的方法明显优于现有的方法,在另外两个知识库问题回答(KBQA)数据集上也优于现有技术。

这篇关于一种基于知识库回答多步复杂问题的查询图生成方法 翻译的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080609

相关文章

Java调用Python代码的几种方法小结

《Java调用Python代码的几种方法小结》Python语言有丰富的系统管理、数据处理、统计类软件包,因此从java应用中调用Python代码的需求很常见、实用,本文介绍几种方法从java调用Pyt... 目录引言Java core使用ProcessBuilder使用Java脚本引擎总结引言python

Apache Tomcat服务器版本号隐藏的几种方法

《ApacheTomcat服务器版本号隐藏的几种方法》本文主要介绍了ApacheTomcat服务器版本号隐藏的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需... 目录1. 隐藏HTTP响应头中的Server信息编辑 server.XML 文件2. 修China编程改错误

解决mybatis-plus-boot-starter与mybatis-spring-boot-starter的错误问题

《解决mybatis-plus-boot-starter与mybatis-spring-boot-starter的错误问题》本文主要讲述了在使用MyBatis和MyBatis-Plus时遇到的绑定异常... 目录myBATis-plus-boot-starpythonter与mybatis-spring-b

Java中switch-case结构的使用方法举例详解

《Java中switch-case结构的使用方法举例详解》:本文主要介绍Java中switch-case结构使用的相关资料,switch-case结构是Java中处理多个分支条件的一种有效方式,它... 目录前言一、switch-case结构的基本语法二、使用示例三、注意事项四、总结前言对于Java初学者

使用Python实现大文件切片上传及断点续传的方法

《使用Python实现大文件切片上传及断点续传的方法》本文介绍了使用Python实现大文件切片上传及断点续传的方法,包括功能模块划分(获取上传文件接口状态、临时文件夹状态信息、切片上传、切片合并)、整... 目录概要整体架构流程技术细节获取上传文件状态接口获取临时文件夹状态信息接口切片上传功能文件合并功能小

Oracle Expdp按条件导出指定表数据的方法实例

《OracleExpdp按条件导出指定表数据的方法实例》:本文主要介绍Oracle的expdp数据泵方式导出特定机构和时间范围的数据,并通过parfile文件进行条件限制和配置,文中通过代码介绍... 目录1.场景描述 2.方案分析3.实验验证 3.1 parfile文件3.2 expdp命令导出4.总结

更改docker默认数据目录的方法步骤

《更改docker默认数据目录的方法步骤》本文主要介绍了更改docker默认数据目录的方法步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1.查看docker是否存在并停止该服务2.挂载镜像并安装rsync便于备份3.取消挂载备份和迁

JavaScript DOM操作与事件处理方法

《JavaScriptDOM操作与事件处理方法》本文通过一系列代码片段,详细介绍了如何使用JavaScript进行DOM操作、事件处理、属性操作、内容操作、尺寸和位置获取,以及实现简单的动画效果,涵... 目录前言1. 类名操作代码片段代码解析2. 属性操作代码片段代码解析3. 内容操作代码片段代码解析4.

SpringBoot3集成swagger文档的使用方法

《SpringBoot3集成swagger文档的使用方法》本文介绍了Swagger的诞生背景、主要功能以及如何在SpringBoot3中集成Swagger文档,Swagger可以帮助自动生成API文档... 目录一、前言1. API 文档自动生成2. 交互式 API 测试3. API 设计和开发协作二、使用

mysql主从及遇到的问题解决

《mysql主从及遇到的问题解决》本文详细介绍了如何使用Docker配置MySQL主从复制,首先创建了两个文件夹并分别配置了`my.cnf`文件,通过执行脚本启动容器并配置好主从关系,文中还提到了一些... 目录mysql主从及遇到问题解决遇到的问题说明总结mysql主从及遇到问题解决1.基于mysql