【数据应用案例】知识图谱技术与应用指南

2024-09-06 04:18

本文主要是介绍【数据应用案例】知识图谱技术与应用指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

案例来源:@机器之心
案例地址: https://mp.weixin.qq.com/s/fuI9U7aZpuk-WX6GQNtOuA

1. 知识图谱
1)包含实体与实体间关系
2)实体与关系可以有属性
3)学界常采用RDF三元组存储(如Jena),缺点是难以表达实体的属性;业界常用图存储数据库(如Neo4j、OrientDB、JanusGraph),可以表达实体和关系的属性,同时利于检索
4)知识抽取过程
a. 命名实体识别
b. 实体间关系识别
c. 实体统一
d. 指代消解(如他她它)

2. 金融知识图谱搭建:业务理解与知识图谱的设计非常重要
1)定义具体业务问题:如金融领域的欺诈。注意如果要使用知识图谱而不是传统数据库,要考虑几个问题:
a. 有强烈的可视化需求
b. 经常涉及深度的关系搜索
c. 对关系查询有实时性要求
2)数据收集与预处理:内部信息源与外部数据,外部一般需要做实体识别和关系识别等处理
3)知识图谱设计
a. 业务原则:图谱能反映业务逻辑
b. 分析原则:
c. 效率原则:知识图谱尽量轻化,一些关系不大、分析时使用较少的属性可以放在传统数据库中。可以把知识图谱和传统数据库的关系看成内存与硬盘的关系
d. 冗余原则
4)上层应用开发:主要有两类,一类是基于规则的,一类是基于概率的
a. 基于规则的方法论
i1. 不一致性检查:找出潜在矛盾点,如两个人的公司电话是相同的,但是公司却不同
i2. 基于规则的特征提取:如“申请人的二度实体里有多少进了黑名单”
i3. 基于模式的判断:通过一些模式找出可能存在风险的子图(如团伙欺诈)。可以根据共享的实体数量定义团伙,也可以定义强连通子图为团伙
b. 基于概率的方法论:如社区挖掘、标签传播、聚类
c. 基于动态网络的分析:知识图谱网络在T到T+1时刻发生了显著变化,可能蕴含着风险信息

3. 知识图谱在其它领域的应用
1)教育领域:根据学习路径构建知识网络,帮助学生制定个性化培养方案
2)证券领域:我们经常关心“A事件发生会影响哪些公司的股价”,可以用知识图谱回答哪些公司会受到影响

这篇关于【数据应用案例】知识图谱技术与应用指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1140978

相关文章

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

Spring Boot结成MyBatis-Plus最全配置指南

《SpringBoot结成MyBatis-Plus最全配置指南》本文主要介绍了SpringBoot结成MyBatis-Plus最全配置指南,包括依赖引入、配置数据源、Mapper扫描、基本CRUD操... 目录前言详细操作一.创建项目并引入相关依赖二.配置数据源信息三.编写相关代码查zsRArly询数据库数

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

JavaScript错误处理避坑指南

《JavaScript错误处理避坑指南》JavaScript错误处理是编程过程中不可避免的部分,它涉及到识别、捕获和响应代码运行时可能出现的问题,本文将详细给大家介绍一下JavaScript错误处理的... 目录一、错误类型:三大“杀手”与应对策略1. 语法错误(SyntaxError)2. 运行时错误(R

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Android Kotlin 高阶函数详解及其在协程中的应用小结

《AndroidKotlin高阶函数详解及其在协程中的应用小结》高阶函数是Kotlin中的一个重要特性,它能够将函数作为一等公民(First-ClassCitizen),使得代码更加简洁、灵活和可... 目录1. 引言2. 什么是高阶函数?3. 高阶函数的基础用法3.1 传递函数作为参数3.2 Lambda

Python使用date模块进行日期处理的终极指南

《Python使用date模块进行日期处理的终极指南》在处理与时间相关的数据时,Python的date模块是开发者最趁手的工具之一,本文将用通俗的语言,结合真实案例,带您掌握date模块的六大核心功能... 目录引言一、date模块的核心功能1.1 日期表示1.2 日期计算1.3 日期比较二、六大常用方法详