论文阅读笔记 | 《Constraint-Based Question Answering with Knowledge Graph》

本文主要是介绍论文阅读笔记 | 《Constraint-Based Question Answering with Knowledge Graph》,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 主要内容

在KBQA(基于知识库的问答)的基础上,由于其他问答系统都是回答简单问题,本文提出一种方法可以回答复杂问题(多个限制下的问题),并且提供一个数据集,名为ComplexQuestion,以此评测回答复杂问题的KBQA系统性能。

2个被用作benchmark的数据集:WebQuestions,SimpleQuestions.

多限制问题可以分为六种:多实体限制;答案类型限制;明确的时间限制;不明确的时间限制;序数限制;聚集限制

主要技术:基础查询图(basic query graph)+限制序列(constraint sequence)

2.  重要引用和影响

改进了2015年Yih等人的stage graph,使得实体限制可以加在多个KB fact上,并且考虑的约束要比之前多(stage graph对于非实体约束的处理不恰当)

Pengcheng Yin, Nan Duan, Ben Kao, Junwei Bao, and Ming Zhou. 2015. Answering questions with complex semantic constraints on open knowledge bases. In Proceedings of the 24th ACM International on Conference on Information and Knowledge Management, pages 1301–1310. ACM.

2.1 生成基础查询图

通过实体链接方法检测问题中提到的实体,并且以这个实体为顶点,在KB中找到一跳或两跳的路径作为基础查询图(即查询子图)。

Yi Yang and Ming-Wei Chang. 2015. S-mart: Novel tree-based structured learning algorithms applied to tweet entity linking.

同时,基于CNN模型计算question和基础查询图中的路径(the path of the basic query graph)之间的相似性,以此来评估构建的基础查询图的质量。

Jianfeng Gao, Li Deng, Michael Gamon, Xiaodong He, and Patrick Pantel. 2015. Modeling interestingness with
deep neural networks
, December 17. US Patent 20,150,363,688.

2.2 约束检测与绑定

包括两个阶段:约束检测(Constraint Detection)和约束绑定(Constraint Binding)。

接下来讲了怎样将六种限制加到基础的查询图上。

1) 识别问题的类型(type),用到Yao和Durme提出的简单高效的方法

Xuchen Yao and Benjamin Van Durme. 2014. Information extraction over structured data: Question answering
with freebase.
In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics,
ACL 2014, June 22-27, 2014, Baltimore, MD, USA, Volume 1: Long Papers, pages 956–966.

2) 使用Stanford NER检测时间短语(只能检测明确的时间短语)

Jenny Rose Finkel, Trond Grenager, and Christopher Manning. 2005. Incorporating non-local information into
information extraction systems by gibbs sampling.
In Proceedings of the 43rd Annual Meeting on Association
for Computational Linguistics, pages 363–370. Association for Computational Linguistics.

 对于表述不明确的时间短语(如:after the Civil War stared),只能利用预定义的关键字进行匹配(when, before, after, during, etc)

3) 使用WordNet提供的手工收集的序号列表和最高级词汇来检测序号和函数操作。

 

2.3 生成查询空间

  •  第3行:检测问题中的实体entity(可能有多个)
  • 第4,5行:对于每个实体,结合知识库,生成basic query graph
  • 第6-9行:将每一个basic query graph加入到T和H集合中
  • 第11,12行:对于每一个basic query graph,结合问句、知识库、实体得到一系列约束
  • 第13-19行:对于得到的约束进行排列,将每一种排列的约束都加入到H集合中

2.4 相似度评分机制

跟web search类似的模型:Yelong Shen, et al. 2014b. Learning semantic representations using convolutional neural networks for web search.

 3. 实验

所用工具:Freebase dump; entity linker; Stanford NER;

数据集:ComplexQuestions;WebQuestions;SimpleQuestions

评价标准:average F1 score


Strong Points:

s1: 提出一种将多限制问题转换为多限制查询图的KBQA方法

s2: 提供了一个多限制问题的数据集ComplexQuestions。(目的是评测多限制问答系统的性能,因为之前的数据集只能支持评估简单问题问答系统的性能)

Weak Points:

w1:

 

 


推荐一篇好文章:从 Vision 到 Language 再到 Action,万字漫谈三年跨域信息融合研究(作者:阿德莱德大学助理教授吴琦)讲了Knowledge和computer vision还有reasoning的内容,而且还有论文可以读。

https://baijiahao.baidu.com/s?id=1601049742854576610&wfr=spider&for=pc

这篇关于论文阅读笔记 | 《Constraint-Based Question Answering with Knowledge Graph》的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/890778

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit