###haohaohao####知识图谱补全技术

2024-05-07 13:48

本文主要是介绍###haohaohao####知识图谱补全技术,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

导读:当前知识图谱已经被广泛应用在自然语言处理的各项任务中,但知识图谱中实体间关系的缺失也给其实际的应用带来了很多问题。因此,目前学术界围绕知识图谱的补全进行了大量的研究工作。本文主要对知识图谱补全相关的研究进展进行了归纳与分享。

01

背景介绍

首先和大家分享下知识图谱的背景。

图片

知识图谱,在互联网行业已经被广泛应用于多种不同的领域,如推荐系统、搜索引擎、智能对话系统等。在AI时代,知识图谱是一项非常重要的技术。

1. 知识图谱主要研究方向

图片

知识图谱的主要研究方向包括知识获取、知识表示、时序知识图谱、知识应用等方向。本次分享,主要聚焦于知识获取中的一个子任务——知识图谱补全。

2. 为什么要做知识图谱的补全

图片

知识图谱普遍存在不完备的问题。以上图为例,黑色的箭头表示已经存在的关系,红色的虚线则是缺失的关系。我们需要做的,是基于图谱里已有的关系,去推理出缺失的关系。

3. 知识图谱补全的难点与挑战

  • 如何更好的建模知识的结构和推理规则?如何查找路径?强化学习可用吗?如何建模逻辑规则?

  • 如何解决长尾数据问题?few-shot learning?

02

问题定义

知识图谱补全问题定义

给定知识图谱G = {E, R, F},其中E表示所有实体的集合,R表示所有关系的集合,F为所有三元组的集合。

知识图谱补全的任务是预测出当前知识图谱中缺失的三元组F'={(h, r, t) | (h, r, t)∉F, r∈R}

根据补全的实体是否在E中,知识图谱补全可分为两个子任务:

  • 封闭域的知识图谱补全,限制要补全的三元组的实体都在E中

  • 开放域的知识图谱补全,不限制实体一定在E中

后面分享中除非特别提到,否则主要指封闭域的知识图谱补全。

03

知识图谱补全技术发展

知识图谱补全技术,可归纳为以下几种:基于知识表示的方法、基于路径查找的方法、基于推理规则的方法、基于强化学习的方法、基于元学习的方法。

1. 基于知识表示的方法

基于知识表示的方法,是最直接的一种方式。

图片

  • 知识表示学习:对知识图谱中的实体和关系学习其低维度的嵌入式表示。

  • 常见的知识表示学习方法:上图涵盖了常见的知识表示学习方法,主要是以TransE法为核心,针对空间映射等场景做的改进。

  • 基于实体和关系的表示对缺失三元组进行预测;

  • 许多前面提到的知识表示方法都可以用在知识图谱补全中。

以上图中的三元组为例,已知头实体以及头实体间的关系,预测其尾实体。可将头实体的embedding组合到一起,在尾实体的candidate列表中计算score(可自定义score计算方法,例如相似度);从candidate中选择一个分数最高的尾实体作为补全。

基于这种方法可以做进一步的改进——引入实体描述信息,构建神经网络:

图片

  • 利用实体描述信息,可以解决开放域实体补全的问题;

  • 使用类似于attention的机制进行描述内容的masking,使得与关系关联紧密的描述内容对结果影响更大;

  • 使用CNN来对masking后的实体描述进行特征抽取(target fusion)。

通过以上步骤,将文本提取成两种特征:一种是含有三元组(即头实体、尾实体和关系名)上下文信息的特征,一种是偏向利用实体描述信息抽取新实体相关知识的特征。将两类特征输入到全连接网络中,做最终补全结果的预测。

2. 基于路径查找的方法

基于知识表示方法,一般不能处理下图这种多步知识推理。(图中从微软到美国,需要经过4步推理才能获得)

图片

可使用基于路径查找的方法来处理这类多步推理问题。

传统的路径查找方法主要是PRA方法(Path Ranking Algorithm);但是这种方法对于包含较大规模的知识图谱来说,会由于路径数量爆炸式增长,导致特征空间急剧膨胀。

解决的方式,可以尝试用embedding的方式表示关系,对关系进行泛化,并基于此对知识的补全进行建模,以缓解路径数量过多导致的特征空间膨胀问题。

图片

  • 给定实体对集合,利用PRA查找一定数量的路径;

  • 使用RNN沿着路径进行向量化建模;

  • 通过比较路径向量与待预测关系向量间的关联度来进行关系补全。

此方法仍然存在一些问题:

  • 建模时未考虑路径上的实体信息;

  • 每个关系类型需要使用一个单独的RNN模型;

  • 建模时仅使用了实体对间的一条路径。

基于此,后续的工作对以上方法做了如下改进:

图片

  • 路径计算过程中加入实体类型信息(减少长尾实体影响);

  • RNN模型参数在不同关系之间共享;

  • 提出新的分数计算方式,可以综合运用多条路径信息:

假设{s1,s2, …, sn}为两个实体{es,et}间所有路径与关系r之间的相似度分数集合,那么该实体对拥有关系r的概率可有以下几种计算方式:

图片

这里特别提到LogSumExp法,将所有相似度分数计算指数和后取对数;这种计算方法,在误差反向传播的过程中,分数高的路径获得的梯度分配更多;类似于根据分数计算贡献的方式。

3. 基于强化学习的方法

前面提到的两种方法,仍然存在若干的问题:

  • 需要基于random walk来查找路径;

  • 而random walk算法在离散空间中运行,难以评价知识图谱中相似的实体和关系;

  • 超级结点可能影响random walk算法运行速度。

基于以上问题,有很多研究者开始尝试强化学习方法:

  • 在连续空间中进行路径搜索;

  • 通过引入多种奖励函数,使得路径查找更加灵活、可控。

这里介绍DeepPath这种强化学习方法:

图片

① 任务:查找Band of Brothers和English之间的关系。

② 路径起点:Band of Brothers

③ 状态:实体中的embedding

④ 动作:图谱中的关系;

⑤ 奖励:

  • Binary,是否到达终点

  • 路径长度

  • 路径多样性

⑥ 策略网络:使用全连接网络。

DeepPath方法仍然存在一些缺陷:知识图谱本身的不完善很可能对路径查找造成影响。

基于此,研究者提出了更加开放的知识图谱补全方法,在路径查找过程中,通过抽取关系,将缺失的路径补全。

图片

上图中,任务是查找Barack_Obama为哪个组织工作。在原图谱中,John_McCain和Rudy_Giuliani之间的路径是断的;通过弱监督的方式,从原文本中训练出一个关系抽取器,通过这个关系抽取器将缺失的关键路径补充完整。至于是否有必要做路径补充,以及哪一条路径需要补充,则是强化学习中策略选择的工作。

下面介绍一下该模型中的一些细节:

图片

模型包括两个部分:

① 关系抽取(Extractor):使用PCNN-ATT,将文本输入到模型中,可预测出一部分关系;将原图谱中存在的关系和根据预测出来的关系结合,丰富了实体间的关系网络,扩大了当前节点的关系选择范围。

② 关系推理(Reasoner):基于RNN神经网络的推理,将节点当前状态和当前节点可能存在的关系注入到模型中,从而判断推理路径。

4. 基于推理规则的方法

知识推理是针对知识的一项重要应用,很自然的会考虑将其应用在知识补全中;与路径查找不同,知识推理更侧重于对逻辑规则本身建模。

传统的推理规则挖掘方法搜索空间庞大,会导致搜索速度慢。针对这一缺陷,有两类不同的优化方案:

  • 推理规则与embedding结合

  • 神经网络模型与传统的推理模型结合

首先介绍推理规则与embedding结合的方法:

图片

训练知识图谱的embedding的时候,可能会存在很多长尾的实体或关系,会使模型的训练变得不可靠;而单纯使用规则进行推理,挖掘规则本身是个搜索空间非常大。因此结合以上两项工作,互相弥补各自优缺点。对于长尾的实体或关系,用规则进行扩充;对于搜索空间很大的规则来说,借助embedding转换成向量计算,大大降低计算量

这种方法的input是个Knowledge Graph,通过该Graph训练出一个embedding;选取一些已有规则(如自反规则、传递规则、逆转规则等7种规则,如下表所示),对知识图谱中的已有规则进行扩展,进而生成命题:

  • 针对每个关系,利用它周围的实体与关系随机获取具体的命题(随机抽取k个含有该关系的三元组,经证明k有一个可控上界)

  • 在整个图谱中查找能够支持命题的实例,如果能够查到则保留。

图片

命题形成后,可通过关系表达满足度分数等指标来判断命题是否成立;如命题成立,可将其落地到原知识图谱中,形成可扩充的三元组,并根据命题分数和三元组的分数去计算每个三元组的置信度;将高置信度的三元组扩充回到知识图谱中,训练新的embedding,不断迭代下去。

接下来介绍另一种优化方案——神经网络模型与传统的推理模型结合。这里的传统推理模型主要指马尔可夫逻辑网。使用马尔科夫逻辑网定义三元组的联合分布:

①假设:逻辑规则推理得到的三元组,与基于KG embedding获得的三元组,分布一致。

②基于以上假设,使用EM算法进行训练:

  • E-step: 限定逻辑规则的权重,基于逻辑规则生成三元组,学习KGE模型权重。

  • M-step: 限定KGE模型,更新逻辑规则的权重

图片

5. 基于元学习的方法

前面介绍的几种方法,往往都需要大量的训练数据;而在知识图谱中,大量关系出现频次很低(即长尾数据);而越是低频的关系,越可能需要补全。为了解决这样的矛盾,有人提出了使用元学习方法。

图片

传统的机器学习,通常是基于训练数据去学习一种“从数据到标签的映射”;而元学习,学习的是“一种更高阶的映射”,即从数据到函数的映射。(见上图)

相较于传统机器学习,元学习可以用较少的数据去完成学习任务。

问题定义:基于极少量的已知三元组,对缺失的三元组进行预测

图片

以上表为例,Training过程由几个Task组成,每个Task面向不同的关系;对于每个Task,会有一个自己的训练集和测试集(其中训练集的数量会比较少);Testing过程中,会有很少标签数量的训练集,让模型很好地在该标签下工作。

元学习有两种方法:

  • 基于度量的方法

  • 基于优化的方法

图片

基于度量的方法:One-Shot Relational Learning for Knowledge Graphs。该方法直接对训练数据和测试数据之间的关联进行建模。

思路:利用知识图谱背景知识对实体对编码,进而让模型能够学习到含有相同关系的实体对间的相似性,并基于此判断测试数据的实体对之间是否存在某关系。

图片

基于优化的方法:Meta Relational Learning for Few-Shot Link Prediction in Knowledge Graphs。该方法用来训练一个模型,该模型在很小的数据上可以快速收敛优化达到较好的效果。

与基于度量的算法相比,主要的区别:

  • 直接寻找预测一个实体对间是否含有某个关系所需要的核心信息

  • 不需要已有的知识图谱作为背景知识,具有更强的鲁棒性

模型训练的关键点:

  • 使用support set生成gradient meta协助快速学习relation meta

  • 使用query set结果的Loss更新模型参数

04

总结与展望

1. 小结

  • 基于知识表示的方法模型简单清晰,但是可解释性较差,并且难以对复杂的知识推理建模

  • 在知识图谱中进行路径查找可以进行更加复杂的知识推理,重点在于如何缓解大规模的图谱中的路径数量爆炸以及无用信息过多的问题

  • 基于推理的方法将逻辑规则与图谱表示相结合,缓解了稀疏数据的表示学习问题,并且增强了逻辑规则的泛化能力

  • 元学习算法致力于解决知识图谱补全中长尾关系的问题,让模型在极少量训练数据的情况下有快速适配的能力

2. 未来的方向

  • 概率化逻辑推理与知识表示结合,解决推理过程中的不确定性问题

  • 持续强化知识推理的可解释性

  • 知识推理的可扩展性

这篇关于###haohaohao####知识图谱补全技术的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/967529

相关文章

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

2、PF-Net点云补全

2、PF-Net 点云补全 PF-Net论文链接:PF-Net PF-Net (Point Fractal Network for 3D Point Cloud Completion)是一种专门为三维点云补全设计的深度学习模型。点云补全实际上和图片补全是一个逻辑,都是采用GAN模型的思想来进行补全,在图片补全中,将部分像素点删除并且标记,然后卷积特征提取预测、判别器判别,来训练模型,生成的像

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

系统架构设计师: 信息安全技术

简简单单 Online zuozuo: 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo :本心、输入输出、结果 简简单单 Online zuozuo : 文章目录 系统架构设计师: 信息安全技术前言信息安全的基本要素:信息安全的范围:安全措施的目标:访问控制技术要素:访问控制包括:等保

前端技术(七)——less 教程

一、less简介 1. less是什么? less是一种动态样式语言,属于css预处理器的范畴,它扩展了CSS语言,增加了变量、Mixin、函数等特性,使CSS 更易维护和扩展LESS 既可以在 客户端 上运行 ,也可以借助Node.js在服务端运行。 less的中文官网:https://lesscss.cn/ 2. less编译工具 koala 官网 http://koala-app.

Spring的设计⽬标——《Spring技术内幕》

读《Spring技术内幕》第二版,计文柯著。 如果我们要简要地描述Spring的设计⽬标,可以这么说,Spring为开发者提供的是⼀个⼀站式的轻量级应⽤开发框架(平台)。 作为平台,Spring抽象了我们在 许多应⽤开发中遇到的共性问题;同时,作为⼀个轻量级的应⽤开发框架,Spring和传统的J2EE开发相⽐,有其⾃⾝的特点。 通过这些⾃⾝的特点,Spring充分体现了它的设计理念:在