RDF Refine(Open Refine + RDF Refine)使用笔记

2023-10-08 16:38

文章标签 使用笔记 open refine rdf

本文主要是介绍RDF Refine(Open Refine + RDF Refine)使用笔记，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

RDF Refine(Open Refine + RDF Refine)使用示例

Open Refine（原名 Google Refine）是一个用来管理杂乱数据，进行整理与扩展的工具。如今的最新版是2.5，beta版为2.6 beta。

本文使用Open Refine同时借助RDF Refine扩展，对一个图书管理csv文件进行整理与扩展操作。最后导出为RDF格式的语义数据。

Open Refine(used name: Gooele Refine)安装

官方网址：

https://github.com/OpenRefine/OpenRefine/wiki/Installation-Instructions#linux

1、下载对应平台的安装包

2、解压

3、运行（Linux下直接运行./refine）

4、输入127.0.0.1:3333即可访问Google Refine的网址

5、如果需要接收任何ip地址发出的请求，需要在命令行运行时输入./refine -i0.0.0.0

安装RDF Refine

在http://refine.deri.ie/下载RDF Refine的extension包，放在Google Refine的webapp/extensions里面。重启Google Refine

在Project管理页面右上角看到下图所示RDF选项，说明加载成功。

增加reconciliation service

点击右上角RDF，选择Add reconciliationservice，在选择based on SPARQL

按照下图所示填写详细信息

注意Endpoint Type选择Virtuoso

在reconciliation结果的优化中可以对Label properties进行选择，可以选择other，然后手动键入URI

进行Reconciliation过程

如下图所示的上传内存中，我们点击name那里的下拉按钮，选择startreconciliation

然后选择DBpedia，经过一番计算与处理之后，中央的一个列表给出了一系列类型候选项。选择一项我们认为最为认可的type。

在持续了8分钟（具体耗时根据网络状况而定）的信息抽取与处理之后，pre-reconciliation终于给了我们一个列表：

我们选择dbo:Book这个类型，然后为了简便起见，直接点击StartReconciliation

这个提示框告诉我们reconciliation过程的进度

如下图所示，我们已经部分完成了reconciliation的过程

左侧边栏：

在name一栏有匹配到book name与未匹配到任何信息两类数据，exclude为删除对应的条目。

而下方的柱状图表可以用来拖拽，显示不同候选分值的条目用来显示。同时，点击change，我们可以对分值进行修改与自定义计算。

人工优化reconciliation结果

这里的两个勾选可以对user认为正确的条目进行确认。

在下面这个条目中有很多候选选项，本身的名字非常具有歧义性，所以需要用户进行更为细致的确认。

点击其中的候选项，查看详细信息。通过作者的匹配，基本上确认这本书在DBpedia中的具体条目。

同样对作者一栏进行reconciliation

结果中只有一个条目没有得到对应的匹配结果，我们选择新建这个条目

定义Schema信息

接下来定义schema信息

修改Base URI

添加主语属性：

添加类型信息：

点击这里的property修改谓语属性URI，先点击其中一个输入dc:title，点击确定加载，然后再相同操作输入一遍即可选择对应的谓语URI

修改后如下：

点击preview即可进行预览：

这里可以修改每一个宾语的类型信息。

添加一个property：

对添加的谓语所对应的宾语进行设置：

preview/edit对话框中，输入cell.recon.match.id

此时在预览框我们看到了和DBpedia中URI的对应关系：

添加另外一个属性：foaf:maker，同时选中Used As a URI

在预览框中我们可以看到新添加的内容：

我们点击OK，结束RDF Skeleton过程。

导出RDF文件

最后点击Export，选择RDF/XML，导出为RDF XML文件。

这篇关于RDF Refine(Open Refine + RDF Refine)使用笔记的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/166613。 23002807@qq.com

相关文章

Linux中的计划任务(crontab)使用方式

Linux中的计划任务(crontab)使用方式

《Linux中的计划任务(crontab)使用方式》：本文主要介绍Linux中的计划任务(crontab)使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、前言1、linux的起源与发展2、什么是计划任务（crontab）二、crontab基础1、cro

阅读更多...

kotlin中const 和val的区别及使用场景分析

kotlin中const 和val的区别及使用场景分析

《kotlin中const和val的区别及使用场景分析》在Kotlin中,const和val都是用来声明常量的,但它们的使用场景和功能有所不同,下面给大家介绍kotlin中const和val的区别,... 目录kotlin中const 和val的区别1. val:2. const:二代码示例1 Java

阅读更多...

C++变换迭代器使用方法小结

C++变换迭代器使用方法小结

《C++变换迭代器使用方法小结》本文主要介绍了C++变换迭代器使用方法小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1、源码2、代码解析代码解析：transform_iterator1. transform_iterat

阅读更多...

C++中std::distance使用方法示例

C++中std::distance使用方法示例

《C++中std::distance使用方法示例》std::distance是C++标准库中的一个函数,用于计算两个迭代器之间的距离,本文主要介绍了C++中std::distance使用方法示例,具... 目录语法使用方式解释示例输出：其他说明：总结std::distance&n编程bsp;是 C++ 标准

阅读更多...

vue使用docxtemplater导出word

vue使用docxtemplater导出word

《vue使用docxtemplater导出word》docxtemplater是一种邮件合并工具,以编程方式使用并处理条件、循环,并且可以扩展以插入任何内容,下面我们来看看如何使用docxtempl... 目录docxtemplatervue使用docxtemplater导出word安装常用语法封装导出方

阅读更多...

Linux换行符的使用方法详解

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

阅读更多...

使用Jackson进行JSON生成与解析的新手指南

使用Jackson进行JSON生成与解析的新手指南

《使用Jackson进行JSON生成与解析的新手指南》这篇文章主要为大家详细介绍了如何使用Jackson进行JSON生成与解析处理,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 核心依赖2. 基础用法2.1 对象转 jsON（序列化）2.2 JSON 转对象（反序列化）3.

阅读更多...

使用Python实现快速搭建本地HTTP服务器

使用Python实现快速搭建本地HTTP服务器

《使用Python实现快速搭建本地HTTP服务器》：本文主要介绍如何使用Python快速搭建本地HTTP服务器,轻松实现一键HTTP文件共享,同时结合二维码技术,让访问更简单,感兴趣的小伙伴可以了... 目录1. 概述2. 快速搭建 HTTP 文件共享服务2.1 核心思路2.2 代码实现2.3 代码解读3.

阅读更多...

Elasticsearch 在 Java 中的使用教程

Elasticsearch 在 Java 中的使用教程

《Elasticsearch在Java中的使用教程》Elasticsearch是一个分布式搜索和分析引擎,基于ApacheLucene构建,能够实现实时数据的存储、搜索、和分析,它广泛应用于全文... 目录1. Elasticsearch 简介2. 环境准备2.1 安装 Elasticsearch2.2 J

阅读更多...

使用C#代码在PDF文档中添加、删除和替换图片

使用C#代码在PDF文档中添加、删除和替换图片

《使用C#代码在PDF文档中添加、删除和替换图片》在当今数字化文档处理场景中,动态操作PDF文档中的图像已成为企业级应用开发的核心需求之一,本文将介绍如何在.NET平台使用C#代码在PDF文档中添加、... 目录引言用C#添加图片到PDF文档用C#删除PDF文档中的图片用C#替换PDF文档中的图片引言在当

阅读更多...