【知识图谱】王昊奋-第1课笔记-知识图谱概论

2023-11-20 15:10

本文主要是介绍【知识图谱】王昊奋-第1课笔记-知识图谱概论,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、知识图谱与语义技术概述

1. 起源

人的思想是偏重关联的(Vannevar Bush)→以“链接”(超文本)为中心的系统Web→维基百科

2. 语义网

链接文本(Web of Texts, Web of Documents)链接数据(Web of Objects, Web of Data, Web of Things)

i.e. Web中有各种类型的事物,事物(Things not strings)之间有多种类型的连接

3.

谷歌知识图谱:搜索到的是对象(而不是string),从搜索结果中体现关联

Facebook兴趣图谱:结构化搜索(Graph Search)

4. 知识图谱的概念演化

知识图谱的发展得益于Web的发展(更多的是数据层面)。

5. 知识图谱可以做什么

(1)KG辅助搜索(手工众包、传统数据库格式转换、元组抽取、实体融合、链接预测、推理补全)

(2)KG辅助问答(机器人及IoT设备的智能化都依赖于背景知识库,eg., IBM Waston、Siri)

(3)KG辅助决策(政府决策领域Palantir、金融决策领域Kensho)

(4)KG辅助人工智能:常识推理(NLP领域关注)

6. 知识图谱的本质

7. Smart AI vs. Knowledgeable AI

二、典型知识库项目简介

1. CYC(目标最大的常识知识库)

2. Wordnet(普林斯顿大学,最著名的词典知识库,主要用于英文单词词义消歧义)

3. ConceptNet(MIT常识知识库,三元组组织)

4. Freebase(开源免费且允许商业化)

5. Wikidata(CC0完全自由协议,目标全球最大免费知识库)

6. DBPedia(30亿RDF三元组)

7. YAGO(德国马普研究所,集成Wikipedia、WordNet、GeoNames,增加时间维度和空间维度的属性描述)

8. BabelNet(类似于WordNet的多语言词典知识库)

9. NELL(CMU,采用互联网挖掘方法从Web上抽取三元组知识)

10. 微软Concept Graph(概念化)

11. OpenKG(中文知识图谱资源库,zhishi.me)

12. cnSchema(开放的中文知识图谱Schema)

三、知识图谱相关技术简介

1. 知识图谱的技术体系

2. 知识表示:怎样用计算机符号表示人脑中的知识,以及怎样通过符号之间的运算模拟人脑的推理过程

(1)资源描述框架(Resource Description Framework,RDF):Triple-based Assertion Model(基于三元组的断言模型)

(2)RDF Graph:Directed Labeled Graph(有向标记图)

(3)RDFS(RDF Schema):Simple Vocabulary and Schema

(4)RDF的序列化格式

(5)OWL:Web Ontology Language(网页本体语言)

(6)OWL extends RDF Schema

(7)SPARQL:RDF的查询语言,是一种子图匹配

(8)JSON-LD:JSON for linking data,适用于程序之间的数据交换格式

(9)RDFa,HTML5 MicroData:在网页中嵌入语义数据

(10)知识图谱的分布式表示:KG Embedding,从离散的符号表示到连续稠密的低维向量表示

3. 知识抽取

(1)目标:从非结构化文本数据到三元组、多元关系、模态知识等用于KR

(2)主要方法:知识工程(正则表达式、模板匹配、规则约束)、基于本体抽取(知识挖掘/推理)、基于模型抽取(SVM、Logistic Model、CRF、LSTM)

4. 知识存储

(1)知识比数据的结构复杂,知识存储需要综合考虑图的特点、知识的存储、索引和查询的优化问题。

(2)典型知识存储引擎分为基于关系数据库的存储和基于原生图的存储。实践中多为混合存储结构。

5. 知识问答:KQBA 基于知识库的知识问答

6. 知识推理:基于已知事实推出未知事实的计算过程

(1)搜索引擎实例:姚明的妻子的女儿的父亲?

(2)按解决方法分类:基于描述逻辑的推理、基于规则挖掘的推理、基于概率逻辑的推理、基于表示学习和神经网络的推理

(3)按推理类型分类:缺省推理、连续变化推理、空间推理、因果推理

(4)基于描述逻辑的推理:本体推理

(5)基于统计规则挖掘的推理

(6)基于表达学习的推理

7. 知识融合

(1)目标:在不同数据集中找出同一实体的描述记录,对不同数据源的实体信息进行整合,形成更加全面的实体信息

(2)典型工具:Dedupe、LIMES

8. 知识众包:Wikibase、Schema.org

四、典型应用案例

1. 医疗健康:Open PHACTS、中医药知识平台

2. 电商:阿里巴巴知识图谱

3. 企业知识图谱(SAP)

4. 金融:知识图谱支撑下的量化金融

5. 博物馆:大英博物馆

6. 新闻:BBC在伦敦奥运会中应用知识图谱

 

思考

1. KG是一个兼容性很强的方向,可以包含应用的东西非常广泛。(KR、ML、NLP、Web等)

2.现有的各领域开放知识库可以直接用吗?不同模型结构的知识库在进行知识融合时会不会很困难?

3.多库存储的难点在哪里?

4.对于行业KG,KBDA如何处理复杂句?

5.知识图谱在小冰、小娜中的应用。

6.离散型知识表示和连续型知识表示、分布式知识表示的关系、优劣。

7.知识图谱可以用于科研评价吗?(THU唐杰团队Aminer)

这篇关于【知识图谱】王昊奋-第1课笔记-知识图谱概论的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/395503

相关文章

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓

忽略某些文件 —— Git 学习笔记 05

忽略某些文件 忽略某些文件 通过.gitignore文件其他规则源如何选择规则源参考资料 对于某些文件,我们不希望把它们纳入 Git 的管理,也不希望它们总出现在未跟踪文件列表。通常它们都是些自动生成的文件,比如日志文件、编译过程中创建的临时文件等。 通过.gitignore文件 假设我们要忽略 lib.a 文件,那我们可以在 lib.a 所在目录下创建一个名为 .gi