Jena进阶(一):简介+创建本体实例

2024-01-05 18:32

本文主要是介绍Jena进阶(一):简介+创建本体实例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文简单介绍JenaJena 2.4),使用Protégé 3.1(不是最新版本)创建一个简单的生物(Creature)本体,然后参照Jena文档中的一个例子对本体进行简单的处理,输出本体中的ClassProperty等信息。

本文内容安排如下:

Ø         介绍Jena

Ø         运行Jena

Ø         Jena Ontology API

Ø         例子

Ø         参考资料

 

一、介绍Jena

 

Jena HP Labshttp://www.hpl.hp.com)开发的Java开发工具包用于Semantic Web(语义网)中的应用程序开发;Jana是开源的,在下载的文档中有Jena的完整代码。Jena框架主要包括:

a)       RDF/XML、三元组形式读写RDF

资源描述框架是(RDF)是描述资源的一项标准(在技术上是W3C的推荐标准)Jena文档中有一部分呢详细介绍了RDFJena RDF API,其内容包括对Jena RDF包的介绍、RDF模型的创建、读写、查询等操作,以及RDF容器等的讨论。

b)       RDFSOWLDAML+OIL等本体的操作

Jena框架包含一个本体子系统(Ontology Subsystem),它提供的API允许处理基于RDF的本体数据,也就是说,它支持OWLDAML+OILRDFS。本体API与推理子系统结合可以从特定本体中提取信息,Jena 2还提供文档管理器(OntDocumentManager)以支持对导入本体的文档管理。

c)       利用数据库保存数据

    Jena 2允许将数据存储到硬盘中,或者是OWL文件,或者是关系数据库中。本文处理的本体就是OWL文件读入的。

d)       查询模型   

Jena 2提供了ARQ查询引擎,它实现SPARQL查询语言和RDQL从而支持对模型的查询。另外,查询引擎与关系数据库相关联,这使得查询存储在关系数据库中的本体时能够达到更高的效率。

e)       基于规则的推理

Jena 2支持基于规则的简单推理,其推理机制支持将推理器(inference reasoners)导入Jena,创建模型时将推理器与模型关联以实现推理。

 

Protégé是一个开源的本体编辑器(目前的版本是Protégé 3.2),用户可以在GUI环境下创建本体或者知识库。有一种说法是:Jena对应用程序就像Protégé对我们——我们使用Protégé操作本体,应用程序则是使用Jena来做同样的工作。当然这些应用程序还是得由我们来编写。

 

二、运行Jena

 

可以在Jena的主页(http://jena.sourceforge.net/downloads.html)下载Jena的最新版本,目前是Jena2.4版本。JenaJava API,所以需要Java运行环境。本文使用的是jdk1.5.0_04Eclipse3.2

将下载的Jena-2.4.zip解压到任意路径,解压之后生成Jena2.4文件夹,将Jena2.4 lib下的jar文件全部加入CLASSPATH,这样就可以在任意的Java编辑器中调用Jena API了。在解压目录下有一个test.bat文件,用于配置的测试。在控制台运行此程序,如果你的配置正确,测试将顺利完成。

如果使用Eclipse,则可以通过修改工程的Java创建路径的方法导入Jena jar文件。在Eclipse下创建Java工程,右健单击工程名字,选择“属性/Properties”,在打开的对话框中选择“Java创建路径/Java Build Path”,在右边标签中选择“库/Libraries,之后选择“添加外部文件/Add Extenal JARs”,找到Jena2.4 lib目录下的所有jar文件并将其添加到工程。这样就可以运行Jean文档中的例子了。

 

三、Jena Ontology API

 

Jena2.4Ontology API包含在ontology包(com.hp.hpl.jena.ontology)中,可以在目录 Jena-2.4 src com hp hpl jena ontology下查看所有程序的代码,Jena本体部分的说明网页是 Jena-2.4 doc ontology index.html,本部分内容以及程序的编写主要参考这两个文档。

在语义网上有很多表示本体信息的本体语言,其中表达能力最强的是OWLOWL按复杂程度分为 OWL FullOWL DLOWL Lite三个版本。其他的本体语言还有RDFSDAML+OILJena Ontology API为语义网应用程序开发者提供了一组独立于具体语言的一致编程接口。

Jena提供的接口本质上都是Java程序,也就是.java文件经过javac之后生成的.class文件。显然,class文件并不能提示本体创建使用的语言。为了区别于其他的表示方法,每种本体语言都有一个自己的框架(profile),它列出了这种语言使用的类(概念)和属性的构建方式和URI。因此,在DAML框架里,对象属性()的URIdaml:ObjectProperty,而在OWL框架里却是owl:ObjectPropertyRDFS并没有定义对象属性,所以在RDFS框架里,对象属性的URInull

Jena中,这种框架通过参数的设置在创建时与本体模型(Ontology Model)绑定在一起。本体模型继承自Jena中的Model类。Model允许访问RDF数据集合中的陈述(Statements),OntModel对此进行了扩展,以便支持本体中的各种数据对象:类(classes)、属性(properties)、实例(个体individuals)。

 

本部分简单介绍要用到的几个java类或者接口。

 

1.本体模型OntModel

本体模型(OntModel)是对Jena RDF模型的扩展(继承自RDF模型),提供了处理本体数据的功能。使用Jena处理本体首先就是要建立一个本体模型,之后就能够通过本体模型中所定义的方法操作模型,比如导入子模型()、获取模型中本体的信息、操作本体属性以及将本体的表示输出到磁盘文件等等。Jena通过model包中的ModelFactory创建本体模型,ModelFactoryJena提供用来创建各种模型的类,在类中定义了具体实现模型的成员数据以及创建模型的二十多种方法。一个最简单的创建本体模型的语句如下:

OntModel ontModel = ModelFactory.createOntologyModel();

该语句不含参数,应用默认设置创建一个本体模型ontModel,也就是说:它使用OWL语言、基于内存,支持RDFS推理。可以通过创建时应用模型类别(OntModelSpec)参数创建不同的模型,以实现不同语言不同类型不同推理层次的本体操作。例如,下面的语句创建了一个使用DAML语言内存本体模型。直观地讲,内存模型就是只在程序运行时存在的模型,它没有将数据写回磁盘文件或者数据库表。

OntModel ontModel = ModelFactory.createOntologyModel( OntModelSpec.DAML_MEM );

更多类型设置可以参照OntModelSpec类中的数据成员的说明。

我们所使用的本体是从OWL文件获得的,也就是说,是从磁盘读取的。读取的方法是调用Jena OntoModel提供的Read方法。例如

ontModel.read("file:D:/temp/Creatrue/Creature.owl");

就是读取位于D盘相应目录下的Creature.owl文件以建立本体模型。Read方法也有很多重载,上面调用的方法以文件的绝对路径作为参数。其他的方法声明如下

read( String url );

read( Reader reader, String base );

read( InputStream reader, String base );

read( String url, String lang );

read( Reader reader, String base, String Lang );

read( InputStream reader, String base, String Lang );

 

2.文档管理器Document manager

本体文档管理器(OntDocumentManager)是用来帮助管理本体文档的类,它包含了导入本体文档创建本体模型、帮助缓存下载网络上的本体等功能。每个本体模型都有一个相关联的文档管理器。在创建本体模型时,可以创建独立的文档管理器并作为参数传递给模型工厂(ModelFactory)。文档管理器有非常多的配置选项,基本可以满足应用的需求。首先,每个文档管理器的参数都可以通过Java代码来设置(注:OntDocumentManager有五种重载的构造函数)。另外,文档管理器也可以在创建的时候从一个RDF格式的策略文件读取相应设定值。

下面的例子创建一个文档管理器并将它与以创建的本体模型关联。

OntModel m = ModelFactory.createOntologyModel();

OntDocumentManager dm = m.getDocumentManager();

 

    3.接口OntClass

这个接口中定义了本体种与概念(也就是类Class)相关的操作,通过OntModel中的listClasses()便可以返回模型中的所有概念组成的迭代器(Iterator),然后调用OntClass的各种方法具体进行具体操作。OntoClass对概念之间的各种关系都有相应的定义方法,典型的有添加子类、添加约束、创建互斥概念、迭代返回某种类型的概念以及相关的逻辑判断等等。

第四部分的例子主要是应用这个类的方法。

 

4基本本体类型OntResource

所有本体API中用于表示本体的类继承自OntResource,这样就可以在OntResource中放置所有类公用的功能,并可以为一般的方法设置通用的返回值。Java接口OntResource扩展了JenaRDF资源接口,所以任何可以接受资源或者RDFNode的方法都可以接受OntResource,并且也就可以接受任何其他本体值。虽然这个类涵盖了涉及本体的所有类,在例子中并没有使用它。从Jena Java Doc可以获得它的详细信息。

 

四、例子

 

本文实现了一个简单的例子。通过Protégé 3.1创建一个Creature本体,并将其存储到OWL文件Creature.owl,然后使用和Jena通过读取该文件创建本体模型,实践Jena中的一些Ontology API。本文不涉及如何使用Protégé 3.1创建本体,您可以到Protégé的主页或者是http://www.chengtao.name/modules/wordpress/寻找详细的资料,后者虽然只是一个博客,但确实提供了很多我们需要的资源,比如一个完整的Protégé使用教程。本文例子中对Jena的使用主要参照Jena文档中 Jena-2.4 src-examples jena examples ontology下面的describeClass。它读取food.owlwine.owl两个文件建立本体模型,并显示模型中概念以及相关关系的详细信息。DescribeClass.java主要负责查询详细信息并显示出来,Main.java只是创建本体模型并调用DescribeClass.java的功能。

 

例子的主要代码如下列出。

 

// 创建使用OWL语言的内存模型

OntModel ontModel = ModelFactory.createOntologyModel(OntModelSpec.OWL_MEM);

ontModel.read("file:./Creature.owl"); // 读取当前路径下的文件,加载模型

// 定义一个类作为模型中Animal类的等等价类,并添加注释

OntClass cls = ontModel.createClass(":DongwuClass");

cls.addComment("the EquivalentClass of Animal...", "EN");

// 通过完整的URI取得模型中的Animal

OntClass oc = ontModel.

getOntClass("http://www.owl-ontologies.com/marine.owl#Animal");

oc.addEquivalentClass(cls); // 将先前定义的类添加为Animal的等价类

 

// 迭代显示模型中的类,在迭代过程中完成各种操作

for (Iterator i = ontModel.listClasses(); i.hasNext();) {

OntClass c = (OntClass) i.next(); // 返回类型强制转换

if (!c.isAnon()) { // 如果不是匿名类,则打印类的名字

System.out.print("Class");

// 获取类的URI并输出,在输出时对URI做了简化(将命名空间前缀省略)

System.out.println(c.getModel().getGraph().

getPrefixMapping().shortForm(c.getURI()));

                           

// 处理Animal

if (c.getLocalName().equals("Animal")) { // 如果当前类是Animal

       System.out.println("  URI@" + c.getURI()); // 输出它的完整URI                 // 取得它的的等价类并打印

       System.out.print("  Animal's EquivalentClass is "+

c.getEquivalentClass());

       // 输出等价类的注释

System.out.println(" [comments:" +

c.getEquivalentClass().getComment("EN")+"]");

}// 处理Animal结束

      

// 迭代显示当前类的直接父类

for (Iterator it = c.listSuperClasses(); it.hasNext();)

{

       OntClass sp = (OntClass) it.next();

       String str = c.getModel().getGraph()

                            .getPrefixMapping().shortForm(c.getURI()) // 获取URI

                            + "'s superClass is " ;

       String strSP = sp.getURI();

       try{ // 另一种简化处理URI的方法

              str = str + ":" + strSP.substring(strSP.indexOf('#')+1);

              System.out.println("  Class" +str);

       }catch( Exception e ){}

} // super class ends

 

// 迭代显示当前类的直接子类

for (Iterator it = c.listSubClasses(); it.hasNext();){

System.out.print("  Class");

OntClass sb = (OntClass) it.next();

System.out.println(c.getModel().getGraph().getPrefixMapping()

                                          .shortForm(c.getURI())+ "'s suberClass is "

                                          + sb.getModel().getGraph().getPrefixMapping()

                                          .shortForm(sb.getURI()));

}// suber class ends

// 迭代显示与当前类相关的所有属性

for(Iterator ipp = c.listDeclaredProperties(); ipp.hasNext();){

       OntProperty p = (OntProperty)ipp.next();

       System.out.println("  associated property: " + p.getLocalName());

       }// property ends

}// anonymity ends

else // 是匿名类

{}

}// for ends

 

部分输出结果如下,说明部分不在输出中。

Class:Animal

  URI@http://www.owl-ontologies.com/marine.owl#Animal  // 完整的URI

// 等价类及其注释

  Animal's EquivalentClass is :DongwuClass [comments:the EquivalentClass of Animal...]  Class:Animal's superClass is :Creature // 直接父类

  Class:Animal's suberClass is :MixAnimal // 直接子类

  Class:Animal's suberClass is :GrassAnimal

  Class:Animal's suberClass is :MeatAnimal

  associated property: eat // 关联属性

  associated property: beEated

  associated property: mainEat

 

后注:该例子没有涉及Jena的推理功能,没有实现属性的过滤(只返回以当前类为主体的属性),不能输出间接父类(父类的父类)或间接子类,等等。因此,有待对Jena进一步熟悉之后作更多的改进。


这篇关于Jena进阶(一):简介+创建本体实例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/573765

相关文章

MySQL分表自动化创建的实现方案

《MySQL分表自动化创建的实现方案》在数据库应用场景中,随着数据量的不断增长,单表存储数据可能会面临性能瓶颈,例如查询、插入、更新等操作的效率会逐渐降低,分表是一种有效的优化策略,它将数据分散存储在... 目录一、项目目的二、实现过程(一)mysql 事件调度器结合存储过程方式1. 开启事件调度器2. 创

mysql外键创建不成功/失效如何处理

《mysql外键创建不成功/失效如何处理》文章介绍了在MySQL5.5.40版本中,创建带有外键约束的`stu`和`grade`表时遇到的问题,发现`grade`表的`id`字段没有随着`studen... 当前mysql版本:SELECT VERSION();结果为:5.5.40。在复习mysql外键约

java图像识别工具类(ImageRecognitionUtils)使用实例详解

《java图像识别工具类(ImageRecognitionUtils)使用实例详解》:本文主要介绍如何在Java中使用OpenCV进行图像识别,包括图像加载、预处理、分类、人脸检测和特征提取等步骤... 目录前言1. 图像识别的背景与作用2. 设计目标3. 项目依赖4. 设计与实现 ImageRecogni

Python进阶之Excel基本操作介绍

《Python进阶之Excel基本操作介绍》在现实中,很多工作都需要与数据打交道,Excel作为常用的数据处理工具,一直备受人们的青睐,本文主要为大家介绍了一些Python中Excel的基本操作,希望... 目录概述写入使用 xlwt使用 XlsxWriter读取修改概述在现实中,很多工作都需要与数据打交

Window Server创建2台服务器的故障转移群集的图文教程

《WindowServer创建2台服务器的故障转移群集的图文教程》本文主要介绍了在WindowsServer系统上创建一个包含两台成员服务器的故障转移群集,文中通过图文示例介绍的非常详细,对大家的... 目录一、 准备条件二、在ServerB安装故障转移群集三、在ServerC安装故障转移群集,操作与Ser

Window Server2016 AD域的创建的方法步骤

《WindowServer2016AD域的创建的方法步骤》本文主要介绍了WindowServer2016AD域的创建的方法步骤,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、准备条件二、在ServerA服务器中常见AD域管理器:三、创建AD域,域地址为“test.ly”

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

Java操作ElasticSearch的实例详解

《Java操作ElasticSearch的实例详解》Elasticsearch是一个分布式的搜索和分析引擎,广泛用于全文搜索、日志分析等场景,本文将介绍如何在Java应用中使用Elastics... 目录简介环境准备1. 安装 Elasticsearch2. 添加依赖连接 Elasticsearch1. 创

使用C#代码计算数学表达式实例

《使用C#代码计算数学表达式实例》这段文字主要讲述了如何使用C#语言来计算数学表达式,该程序通过使用Dictionary保存变量,定义了运算符优先级,并实现了EvaluateExpression方法来... 目录C#代码计算数学表达式该方法很长,因此我将分段描述下面的代码片段显示了下一步以下代码显示该方法如

Java中的Opencv简介与开发环境部署方法

《Java中的Opencv简介与开发环境部署方法》OpenCV是一个开源的计算机视觉和图像处理库,提供了丰富的图像处理算法和工具,它支持多种图像处理和计算机视觉算法,可以用于物体识别与跟踪、图像分割与... 目录1.Opencv简介Opencv的应用2.Java使用OpenCV进行图像操作opencv安装j