陈华钧等 | OpenKG区块链:构建可信开放的联邦知识图谱平台

本文主要是介绍陈华钧等 | OpenKG区块链:构建可信开放的联邦知识图谱平台,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章导读

本文介绍了OpenKG在区块链方向的一些实践和尝试。经过一年努力,OpenKG初步完成了底层区块链平台测试,以及OpenKG数据集、工具集和Openbase细粒度知识众包的上链测试工作。在这个测试平台中,已包含1033位确权的知识贡献者。上链测试两个月,累计由真实知识消费者触发的知识点亮和链上存证次数已达55万次(日均峰值一万多次),并首次测试实现了实体/三元组粒度的知识确权。目前,通过OpenKG发布的开放图谱和开源工具,以及通过Openbase众包采集的三元组,OpenKG都在链上进行存证操作,并计算和分配产生的荣誉值。OpenKG希望通过这项工作为知识图谱社区提供更加可信、可溯源的知识众包平台。

本文也梳理了在OpenKG上链实践过程中的一些思考:知识是有价值的,即使是权限可控的单一机构内部,知识来源也是多样化的,必定存在知识的价值量化、确权、溯源、隐私及可信等多方面问题。要在知识生产和消费闭环中平衡知识的责、权、利,并有效的激励众包,一种方法就是让知识上链,并构建知识的区块链系统。OpenKG作为新技术测试床,在相关方向努力做一些粗浅尝试,也希望为各企业机构建立知识图谱众包平台提供参考。在实践过程中,我们也发现很多问题和挑战,如细粒度知识确权带来的性能问题、细粒度知识众包的价值计算公平性问题、知识图谱的去中心化存储问题等,这些都需要更深入的研究和实践。

本文作者:陈华钧(浙江大学)、胡凝(Onchain)、漆桂林(东南大学)、王昊奋(同济大学)毕桢(浙江大学)、李捷(Onchain)、杨帆(浙江大学)

版权声明:本文版权归OpenKG及作者所有,转发及摘录请注明来源


目录

1. 知识图谱的价值联邦

1.1 从语义网的三个内涵说起

1.2 知识的价值链

1.3 联邦知识图谱众包

2 知识图谱与区块链

 2.1 关于区块链与分布式账本

 2.2 链上知识:知识的区块链

 2.3 开放知识图谱与区块链

3 OpenKG上链:链上的知识图谱

 3.1 OpenKG上链架构

 3.2 OpenKG的价值模型

 3.2.1 K-Point:知识价值度量

 3.2.2 OpenKG Token:荣誉值度量

 3.3. OpenKG区块链的技术实现

 3.3.1 OpenKG上链基本技术架构

 3.3.2 OpenKG中的知识确权

 3.3.3 OpenKG的知识溯源

 3.3.4 OpenKG的可信度量

 3.3.5 OpenKG区块链启动方案

 3.4 OpenKG.CN上链实践:数据集与工具集上链

 3.4.1 OpenKG.CN简介 

 3.4.2 图谱资源注册与上链

 3.4.3 图谱资源的价值点亮

 3.5 OpenBase上链实践:细粒度知识的上链

 3.5.1 OpenBase简介

 3.5.2 细粒度知识上链

 3.5.3 细粒度的知识点亮

4 总结与展望

5 致谢


1. 知识图谱的价值联邦

1.1 从语义网的三个内涵说起

知识图谱的早期理念源于Web之父 Tim Berners Lee 关于语义网(The Semantic Web) 的设想,旨在采用图的结构来建模和记录世界万物之间的关联关系,并沉淀关于万物的知识。经过近二十年的发展,知识图谱的相关技术已经在搜索引擎、智能问答、语言及视觉理解、大数据决策分析、智能设备物联等众多领域得到广泛应用,被公认为是实现认知智能和智能互联的重要基石。

尽管知识图谱技术取得飞速进步,但仍然仅实现了语义网的三分之一的愿景。根据Tim Berners Lee的早期设想,语义互联网的目标是“Using the WWW infrastructure to create a global, decentralized, weblike mesh of machine-processable knowledge”。这有三个方面的内涵:知识互联、去中心化和知识的可信。三个内涵分别对应互联网的三个核心问题。

  • 知识互联旨在设计一种统一的知识表示框架来将分散的数据相互关联起来,以便利用图的结构特点来实现体验更好的搜索、问答、分析等能力。早期的Linked Data即是这一理念的体现。而知识图谱则是目前知识互联最有影响力的体现。

  • 去中心化是对Web架构的设想。尽管Web仍然没有实现去中心化设计,但互联网数据具有分散自治的特点,知识的生产者理应拥有知识的所有权和控制权。因此,去中心化构想反映的是对知识确权的要求。

  • 知识的可信是指通过互联网发布的知识应该是可溯责的(Accountability)。由于互联网的开放性和匿名性,知识可能真假难辨,且会随着时间真假发生变化。因此,合理的知识发布机制还需要对知识进行可信度量和鉴别真假。

这三个内涵第一个与知识的表示框架有关,第二个与互联网的分布式架构有关,第三个与互联网的社会属性有关。而当前的企业级知识图谱管理架构主要考虑知识的互联,而忽视或弱化了知识的价值量化、分布式确权和可信度量等众多问题。

1.2 知识的价值链

  • 知识是有价值的

知识是有价值的。互联网中的知识之间存在相关性,这些知识相互链接,形成知识图谱。互联网作为知识保存的一个载体,同时支持知识使用的场景,也承载新知识的产生。更为具体来说互联网知识有以下几个特性:

  1. 知识图谱包含知识和知识之间的联系;

  2. 知识节点存在价值,知识的联系也有价值;

  3. 知识因为“被使用”而产生价值;

  4. 被“证伪”的知识也存在价值,甚至在某些场景中,“反知识”更加令人记忆深刻;

  5. 知识的价值可以随着知识的联系进行传递。

  • 知识的责、权、利

知识图谱技术强调将分散的碎片化数据相互关联、链接融合。即使是在单一的企业或机构内部,知识图谱的数据也通常来源于不同部门。知识图谱的构建通常需要依靠多部门协作完成。因此,一个好的知识图谱的构建平台需要有明晰的责、权、利方面的考虑,而非仅仅考虑数据清洗、算法抽取、协同编辑等功能。

如图1所示,从知识的生产者的视角,首先要考虑知识的价值量化方法。简单的价值量化模型可以依据知识的使用频率,即知识被使用的越多,知识的价值越高。合理的价值量化是知识众包激励的基本前提。

其次,要考量知识的所有权和控制权保护,即:知识确权。即便在一个权限可集中控制的企业内部,由于知识图谱中的知识粒度很细,在三元组级别考虑知识的确权问题也带来极大的技术挑战。知识的合理确权也是知识众包激励的基本保障。

再次,知识产生的结果未必总是正面的,错误、虚假甚至恶意的知识会给下游的知识使用者带来不利后果,因此不仅要考虑知识获取的正面激励,还需要提供必要的机制来追溯知识的来源,即:知识溯责(Accountability)。有效的知识溯责,可以帮助提升知识图谱的众包质量,对抗虚假和恶意的知识输入。

更进一步,知识最终需要解决知识的可信问题,即:可信度量。知识图谱中的每条三元组代表对客观世界的一条事实描述。这些事实型知识不仅有真假纬度的可信问题,也因为很多事实本身具有不确定和时效性,也带来知识不确定的可信度量问题。

             

图1. 知识图谱的价值联邦

  • 知识的价值点亮与传播

知识的消费是衡量知识价值最直接的方式。知识被用得越多,知识的价值越高。同时知识的消费触发知识的价值传播。我们将知识被消费的过程称为知识的价值点亮。知识图谱使用场景支持不同的知识使用者有限的“点亮”知识图谱中的节点,从而触发知识传播。

“搜索点亮”是指知识的使用者在搜索过程对知识进行消费,从而触发被搜索知识条目的价值点亮。知识图谱支持语义关联搜索,进一步的关联搜索将继续触发新的知识点亮。每一步点亮都对产生的价值进行记录和存证。同时由于知识来源于不同的生产者,价值也需要以合理的方式分配给价值传播链上对应的知识生产者。

“问答点亮”和“搜索点亮”比较类似,消费者和知识库进行问答交互的过程即是消费过程。被问答触及的知识条目是被问答点亮的知识,问答检索过程中从起始节点到达答案节点所遍历的中间节点也将被点亮和价值存证。

“推理点亮”是指推理过程触发的知识点亮。知识图谱中的知识通常是不完备的,对知识图谱的推理过程是基于知识图谱中的已有知识完成。同时,由于知识来源众多,推理点亮的过程可能也是以联邦的方式完成,即:联邦推理点亮。

“分析点亮”是指将来源不同的知识进行综合分析从而不断触发知识图谱中相关知识的点亮过程。同样的,由于知识来源多样,分析的过程也可能是以联邦方式完成的,比如可能通过联邦学习的方式建立分析模型。

如下图(横轴代表时间,每条曲线都经过校准,以便在同一坐标系内可见):

             

图2. 知识的价值曲线

 

这篇关于陈华钧等 | OpenKG区块链:构建可信开放的联邦知识图谱平台的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/851118

相关文章

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

如何解决线上平台抽佣高 线下门店客流少的痛点!

目前,许多传统零售店铺正遭遇客源下降的难题。尽管广告推广能带来一定的客流,但其费用昂贵。鉴于此,众多零售商纷纷选择加入像美团、饿了么和抖音这样的大型在线平台,但这些平台的高佣金率导致了利润的大幅缩水。在这样的市场环境下,商家之间的合作网络逐渐成为一种有效的解决方案,通过资源和客户基础的共享,实现共同的利益增长。 以最近在上海兴起的一个跨行业合作平台为例,该平台融合了环保消费积分系统,在短

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

Android平台播放RTSP流的几种方案探究(VLC VS ExoPlayer VS SmartPlayer)

技术背景 好多开发者需要遴选Android平台RTSP直播播放器的时候,不知道如何选的好,本文针对常用的方案,做个大概的说明: 1. 使用VLC for Android VLC Media Player(VLC多媒体播放器),最初命名为VideoLAN客户端,是VideoLAN品牌产品,是VideoLAN计划的多媒体播放器。它支持众多音频与视频解码器及文件格式,并支持DVD影音光盘,VCD影

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、