8.21 知识图谱嵌入技术研究综述-知网-张天成、田雪、孙相会等-软件学报.2023,34(01)-动态知识图谱嵌入

本文主要是介绍8.21 知识图谱嵌入技术研究综述-知网-张天成、田雪、孙相会等-软件学报.2023,34(01)-动态知识图谱嵌入,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

(三)双曲几何模型

        虽然嵌入方法已经在许多应用中被证明是成功的,但它们存在一个普遍的局限性,即对复杂模式的建模能力本质上受到嵌入空间维数的限制。目前还没有一种方法能够在不丢失信息的情况下计算大型图结构数据的嵌入。

        Adcock 等人的实证分析表明,许多现实世界网络表现出潜在的树状结构。为了利用这种结构性质学习更有效的表示方法,Nickel 等人提出在双曲空间 (具有常负曲率的空间) 中计算嵌入,这是因为双曲空间天然适合于建模层次结构,或者也可以认为,双曲空间是树的连续版本,相比欧式空间 (零曲率空间) 可以更准确、更简洁的表示分层数据。Nickel 等人提出了基于双曲空间Poincare ball 模型的 Poincare 方法,非常适合于基于梯度的优化。

        实际上,多关系知识图谱往往表现出多个层次结构,为了解决这一问题,提出了 MuRP 模型。MuRP 相对于 Poincare 模型而言更加完善,它是一种在双曲空间的 Poincare ball 模型中嵌入分层多关系数据的方法,通过矩阵-向量乘法和加法学习关系特定参数来转换实体嵌入。

        关系矩阵是对角的,因此 MuRP 的参数数量随实体和关系的数量线性增加,使其可以用于大型知识图谱。

(四)其他模型

         除了利用卷积神经网络对 KGE 进行建模的方法,最近也有研究将胶囊网络应用于解决 KGE 问题。例如:CapsE 模型,该模型探索了一种用于对关系三元组建模的胶囊网络。总体来说,CapsE 在 ConvKB 卷积提取特征映射后加入两个胶囊层,在第一层中,构造 k 个胶囊,其中来自所有特征映射相同维度的条目被封装到一个相应的胶囊中,每个胶囊可以捕捉嵌入三元组中相应维度条目之间的许多特征。这些特征被概括并输入到第二层的胶囊中,该胶囊产生一个向量输出,其长度用作三元组的分数。

        CapsE 是首个考虑将胶囊网络用于知识图谱补全的方法。 

        此外,CrossE 模型进一步考虑了实体与关系之间的双向影响,显式地建模交叉交互。Cross模型主要包括 4 个步骤:(1) 为头实体 h 生成交互嵌入; (2) 生成关系 r 的交互嵌入;(3) 结合交互嵌入;(4) 比较组合嵌入 与尾实体嵌入的相似性。

(五)模型总结

         本节归纳总结了最新的知识图谱嵌入方法,由卷积神经网络模型,旋转模型,双曲几何模型和其他模型 4 个部分组成,表 4 对相关的最新知识图谱嵌入研究方法进行了总结。

三大类知识图谱嵌入方法,即:基于距离的模型,语义匹配模型与最新的 KGE 模型。表 5 从类别、方法、提出年份及优缺点 4 方面对这几类知识图谱嵌入方法的部分代表模型进行对比。

3  动态知识图谱嵌入

        当前 KGE 的研究主要集中于静态知识图谱,其中事实不会随时间发生变化,例如:TransE,TransH,TransR,RESCAL 等。但是,在实际应用中,知识图谱通常是动态的,例如 Twitter 中的社交知识图,DBLP 中的引文知识图等,其中事实随时间演变,仅在特定时间段内有效。以往的静态 KGE 方法完全忽略了时间信息,这使得静态 KGE 方法无法在这些实际场景中工作。因此,有必要设计一种用于动态知识图谱嵌入的方法。

        t-TransE 是第一个考虑将时间信息用于 KGE 的方法,使用时间顺序约束建模中时间敏感关系之间的转换,并强制嵌入在时间上保持一致。t-TransE 认为时间敏感事实的发生时间可以表示事实和时间敏感关系的特定时间顺序。因此,t-TransE 是一个结合时间顺序信息而提出来的时间感知链接预测模型。

        然而,t-TransE 不是直接将时间整合到学习的嵌入中,而是首先学习关系之间的时间顺序。然后在 KGE 阶段将这些关系顺序合并为约束,因此,t-TransE 学习到的嵌入不是显式时间感知的。

        Know-Evolve使用双线性嵌入学习方法对 KG 元素的非线性时间演化进行建模。然而,它将域限制为本质上非常密集的基于事件交互类型的数据集。

        Dasgupta 等人从 TransH 方法中获得启发,在 2018 年提出了 HyTE 方法。HyTE 是一个基于超平面的时间感知知识图谱嵌入方法,该方法将每个时间戳与相应的超平面相关联,将时间显式的合并到实体关系空间中。因此,它不仅能够利用时间指导来进行 KG 推理,还可以预测缺少时间注释的关系事实的时间范围。

        为了在保持动态 KG 固有结构的同时,在学习的嵌入中结合时间信息。一种通常的做法是将动态 KG 分割成多个静态子 KG,每个子 KG 对应于特定的时间段,然后分别在这些段上学习嵌入 (HyTE, Flexible Translation 就采用了这种做法)。这类模型虽然在嵌入过程中考虑了 KG 的时间信息,但不能显式地建模动态 KG 的演化过程。最 近,Tang 等人提出了一个结合时间演化的可感知时间间隔的动态知识图谱嵌入方法 (TDG2E),TDG2E 是一种鲁棒的动态知识图谱嵌入方法,将时间信息直接编码到学习的嵌入中。

        TDG2E 既保留了当前子 KG 的结构信息,又能同时保留动态 KG 的演化模式。它首先将时间范围内的输入 KG 分割为多个静态子 KG,每个子 KG 对应于一个时间单元,并将每个子 KG 的实体和关系投影到时间感知超平面中。然后利用基于 GRU 的模型处理动态知识图谱嵌入的学习过程中涉及到的子 KG 之间的依赖关系。此外,考虑累积的结构信息直接导致连续的结构,进一步引入辅助损失,通过利用先前的结构信息 (即 GRU 的隐藏状态) 监督下一个子 KG 的学习过程。

        表 6 将 TDG2E 模型与其他动态 KGE 方法进行对比,直观地展示了 TDG2E 方法的优越性。然而,从大量文献中可以得出结论:现有的大多数知识图谱嵌入方法仍然关注于静态知识图谱,忽略了知识图谱中时间范围信息的可用性与重要性。实际上,在表示学习过程中合并时间信息可能会产生更好的 KG 嵌入,时间感知的知识图谱嵌入研究仍然是一个有待于进一步探索的领域。

什么是GRU?

        门控循环神经网络(gated recurrent neural network)是为了更好地捕捉时序数据中间隔较大的依赖关系,门控循环单元(gated recurrent unit,GRU)是一种常用的门控循环神经网络。

参考:

GRU简介

这篇关于8.21 知识图谱嵌入技术研究综述-知网-张天成、田雪、孙相会等-软件学报.2023,34(01)-动态知识图谱嵌入的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/237391

相关文章

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

第10章 中断和动态时钟显示

第10章 中断和动态时钟显示 从本章开始,按照书籍的划分,第10章开始就进入保护模式(Protected Mode)部分了,感觉从这里开始难度突然就增加了。 书中介绍了为什么有中断(Interrupt)的设计,中断的几种方式:外部硬件中断、内部中断和软中断。通过中断做了一个会走的时钟和屏幕上输入字符的程序。 我自己理解中断的一些作用: 为了更好的利用处理器的性能。协同快速和慢速设备一起工作

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

动态规划---打家劫舍

题目: 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一个代表每个房屋存放金额的非负整数数组,计算你 不触动警报装置的情况下 ,一夜之内能够偷窃到的最高金额。 思路: 动态规划五部曲: 1.确定dp数组及含义 dp数组是一维数组,dp[i]代表

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

hdu 2602 and poj 3624(01背包)

01背包的模板题。 hdu2602代码: #include<stdio.h>#include<string.h>const int MaxN = 1001;int max(int a, int b){return a > b ? a : b;}int w[MaxN];int v[MaxN];int dp[MaxN];int main(){int T;int N, V;s

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

软件设计师备考——计算机系统

学习内容源自「软件设计师」 上午题 #1 计算机系统_哔哩哔哩_bilibili 目录 1.1.1 计算机系统硬件基本组成 1.1.2 中央处理单元 1.CPU 的功能 1)运算器 2)控制器 RISC && CISC 流水线控制 存储器  Cache 中断 输入输出IO控制方式 程序查询方式 中断驱动方式 直接存储器方式(DMA)  ​编辑 总线 ​编辑

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识