粗浅看 XML

2024-08-26 20:18
文章标签 xml 粗浅

本文主要是介绍粗浅看 XML,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

概述 

eXtensible Markup Language 可扩展标记语 言——由 W3C 组织发 布,目前推荐遵守的是 W3C 组织于 2000 年发 布的 XML1.0 规范。

XML 的使命,就是以一 个统一的格式,组织有 关系的数据,为不同平 台下的应用程序服务。


<?xml version="1.0" encoding="utf-8"?> 

<中国>

<北京>

<海淀></海淀>

<丰台></丰台>

</北京>

<湖南>

<长沙></长沙>

<岳阳></岳阳>

</湖南>

<湖北>

<武汉></武汉>

<荆州></荆州>

</湖北>

</中国>


主要用途

配置文件

   JavaWeb

框架 数据交换

   Ajax WebService

数据存储

   保存关系型数据

 

 

语法

文档结构



文档声明

①在编写 XML 文档时,必须在文件的第一行书写文档声明。 最简单的声明语法:<?xml version="1.0" ?>

②用 encoding 属性说明读取文档所用的解码的字符集:

<?xml version="1.0" encoding="GB2312" ?>

这样就要求保存文件时,必须用 GB2312 编码保存。此时要求 XML 文档的作者确 认当前编辑器保存文档的编码方式。

eclipse 会自动按照解码字符集进行编码保存 记事本需要另存为指定的字符集


语法规则

①第一行为 XML 声明,且必须顶格写

②只能有一个根标签

③标签必须正确结束

④标签不能交叉嵌套

⑤严格区分大小写

⑥属性必须有值,且必须加引号

⑦标签不能以数字开头


转义字符

特殊字符

替代符号

&lt;

&gt;

&

&amp;

&quot;

&apos;

 

CDATA 区

①当 XML 文档中需要写一些程序代码、SQL 语句或其他不希望 XML 解析器进行 解析的内容时,就可以写在 CDATA 区中

②XML 解析器会将 CDATA 区中的内容原封不动的输出

③CDATA   区的定义格式:<![CDATA[„]]> 例如:

 

注释

①Xml 文件中的注释采用:“<!--注释-->” 格式。注意:

●XML 声明之前不能有注释

●注释不能嵌套


处理指令

①处理指令,简称 PI  (processing instruction)。处理指令用来指挥解析引擎如何解析 XML 文档内容。

②处理指令必须以“<?”作为开头,以“?>”作为结尾,XML 声明语句就是最常 见的一种处理指令。

例如,在 XML 文档中可以使用 xml-stylesheet 指令,通知 XML 解析引擎,应用 css

文件显示 xml 文档内容。

<?xml-stylesheet type="text/css" href="p.css"?>

解析

解析方式

dom:(Document Object Model,  即文档对象模型)  是 W3C  组织推荐的处理

XML  的一种方式。 它下面有两个分支:jDom 与 dom4j

它们可都可以对 xml 文件进行增删改查的操作

sax: (Simple API for XML) 不是官方标准,但它是 XML  社区事实上的标准, 几乎所有的 XML  解析器都支持它。

只能进行解析(查询)

pull:     Pull 解析和 Sax 解析很相似,都是轻量级的解析,它是一个第三方开 源的 Java 项目,但在 Android 的内核中已经嵌入了 Pull  。 只能进行解析(查询)


解析技术体系


DOM 解析

1. DOM 中对象接口关系图


l    Node:xml 文件所有对象的根接口  节点

l    Document:代表 xml 文件的整个内容的对象的接口

l    Element:代表某个元素或标签的对象的接口

l    Attr:代表某个元素的某个属性对象的接口

l    Text:代表标签体文本标签本对象的接口 

l    NodeList:代表包含多个 Node 接口对象的集合对象

2.主要方法概览

Node

appendChild(newChild)

将新的节点添加为最后一个子节点

 

insertBefore(newChild,refChild)

在某个子节点前插入一个新子节点

 

removeChild(oldChild)

删除指定的某个子节点

 

replaceChild(newChild,oldChild)

将指定的子节点替换成新的子节点

 

setTextContent(textContent)

设置文本内容(一般用在元素对象上)

 

getNodeName()

得到节点名称(一般用在元素对象上)

 

getParentNode()

得到父节点(一般用在元素对象上)

 

getTextContent()

得到文本内容(一般用在元素对象上)

 

getFirstChild()

得到第一个子节点

 

getLastChild()

得到最后一个子节点

 

getNextSibling()

得到下一个兄弟节点

 

getPreviousSibling()

得到上一个兄弟节点


Document

createElement(name)

创建一个指定名称的标签对象返回

 

getDocumentElement ()//getRootElement()

得到文档的根元素对象

 

getElementById(id)

根据子元素的 id 属性找到对应的子元素

 

getElementsByTagName(name)

根据标签名得到对应的子标签的集合

Element

 

 

 

setAttribute(name, value)

设置元素的属性名和属性值

 

removeAttribute(attrName)

根据属性名删除对应的属性

 

getAttribute(attrName)

根据属性名得到对应的属性

 

getElementsByTagName(name)

根据标签名得到对应的子标签的集合

 

getTagName()

得到标签名

Attr、Text

极少直接操作这两个接口的对象,一般通过 Element 对象来操作

NodeList

getLength()得到包含的节点对象的个数  item(index)根据下标得到某个节点


3.demo

读取 id 为 008 的员工的年龄

<?xml version="1.0" encoding="UTF-8"?><class>
<employeer id="007">
<name>王灵</name>
<age>18</age>
</ employeer >
< employeer id="008">
<name>张童</name>
<age>23</age>
</ employeer >
</class>


4.提示:获取解析器对象

javax.xml.parsers 包中的 DocumentBuilder 类用于加载 xml 文件,并产生一个 Document 对象

//创建一个 xml 文档解析器工厂对象

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();


//通过工厂创建一个 xml 文档解析器对象

DocumentBuilder builder = factory.newDocumentBuilder();


//通过解析器对象解析一个文件对象得到 Document 对象

Document document = builder.parse(new File("d:/users.xml")); 


XML dom4j解析

1.Dom4j 是一个简单、灵活的开放源代码的库。Dom4j 是由早期开发 JDOM 的人分离出来而 后独立开发的。与 JDOM 不同的是,dom4j 使用接口和抽象基类,虽然 Dom4j 的 API 相对要 复杂一些,但它提供了比 JDOM 更好的灵活性。

2.Dom4j 是一个非常优秀的 Java XMLAPI,具有性能优异、功能强大和极易使用的特点。现 在很多软件采用的 Dom4j,例如 Hibernate。使用Dom4j 开发,需下载 dom4j 相应的 jar 文 件。

3.获取 Document 对象

SAXReader reader = new SAXReader();

Document    document= reader.read(new File( "input.xml“ ));

4.元素操作

•     //获取文档的元素.

Element root = document.getRootElement();

•     //获取某个元素的指定名称的第一个子节点

Element element = element.element(“书名");


•     //获取某个元素的指定名称的所有子元素的集合

List list = element.elements(“书名”);

•     //添加一个指定名称的子元素

Element childEle =parentEle.addElement(“书名”);

•     //删除某个元素指定的子元素 parentEle.remove(childEle);

5.属性操作

•     //获取某个元素的指定名称的属性对象

Attribute attr = element.attribute(“id”);

•     //获取某个元素的指定名称的属性值

String id =element.attributeValue(“id”);

•     //给元素添加属性或更新其值

Attribute attr =element.addAttribute(“id”,”123”);

•     //删除某个元素的指定属性 element.remove(attribute);

6.文本操作

•     //获取某个元素的文本内容 String text = element.getText();

•     //给某个元素添加或更新文本内容

element.setText(“Tom”);

7.将文档写入 XML 文件,使更改生效

OutputFormat format = OutputFormat.createPrettyPrint();

XMLWriter writer = newXMLWriter( newFileOutput( "output.xml“),format);

writer.write(document); writer.close();


XPath解析

1. XPath  是在 XML 文档中查找信息的语言 XPath  是通过元素和属性进行查找 XPath 简化了 Dom4j 查找节点的过程 使用 XPath 必须导入 jaxen-1.1-beta-6.jar

否则出现

NoClassDefFoundError: org/jaxen/JaxenException 2.XPath 语法示例

/employeers/employeer

从根元素开始逐层找,以”/”开头

//name

直接获取所有 name 元素对象,以“//”开头

//employeer/*

获取所有employeer元素

 

 

 

 元素的所有子元素对象


//employeer[1]或

//employeer[last()]

获取所有 employeer 元素的第一个或最后一个

//employeer[@id]

获取所有带 id 属性的 employeer 元素对象

//employeer[@id=‘002']

获取 id 等于 002 的 employeer 元素对象

3.查询节点

•     获取所有符合条件的节点

–      document.selectNodes(String xpathExpression)  返回 List 集合

•     获取符合条件的单个节点

–      document.selectSingleNode(String xpathExpression)

–    返回一个 Node 对象。如果符合条件的节点有多个,那么返回第一个。


XML SAX 解析

1.  为什么会出现 SAX 解析?

在使用 DOM 解析 XML 文档时,需要读取整个 XML 文档,在内存中构架代表整个 DOM 树的 Doucment 对象,从而再对 XML 文档进行操作。此种情况下,如果 XML 文档特 别大,就会消耗计算机的大量内存,并且容易导致内存溢出。

SAX 解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。

注意:sax 只能用于读取 xml 文件,无法作更新

2. SAX 采用事件处理的方式解析 XML 文件,利用 SAX  解析 XML  文档,涉及两个部分:解 析器和事件处理器(对象):

解析器可以使用 JAXP 的 API 创建,创建出 SAX 解析器后,就可以指定解析器去解析某 个 XML 文档。

解析器采用 SAX 方式在解析某个 XML 文档时,它只要解析到 XML 文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的 xml 文件内容作为方法的参数传递给事件处理器。

事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到

sax 解析器解析到的数据,从而可以决定如何对数据进行处理。

3.解析方式

•      使用 SAXParserFactory 创建 SAX 解析工厂

SAXParserFactory factory = SAXParserFactory.newInstance();

•     通过 SAX 解析工厂得到解析器对象

SAXParser sp = factory.newSAXParser();

•     通过解析器对象得到一个 XML 的读取器

XMLReader xmlReader = sp.getXMLReader();

•     设置读取器的事件处理器


—————————————————————————————

xmlReader.setContentHandler(new BookParserHandler());

•     解析 xml 文件

xmlReader.parse("book.xml");


XML Pull 解析

1.  为什么会出现 PULL 解析?

Pull 解析与 sax 解析类似都是基于事件方法回调机制来实现对 xml 文件解析。

Sax 解析不足:即使已经找到所要的数据,xml 数据还是会全部加载进来并产生方法调 用。程序员无法停止这些无用的操作,而 pull 解析解决了此问题。

Pull 解析:加载每一部分数据产生方法调用,都必须通过程序员调用一个固定的方法才 能进行下去,否则解析工作就停止了。Next()

注意:pull 解析也只能用于读取 xml 文件,无法作更新

2. Pull 解析依赖两个 jar 包:xmlpull_1_0_5.jar 和 kxml2-2.3.0.jar 3.常用接口或类

XmlPullParserFactory XmlPullParser(既是解析器又是数据的存储器)XmlPullParserException 

业务思想

关于XML的总结自己感觉也是很有意思的,虽然经历了痛苦蜕变的整理过程,之后还是很有收获的。

作为一种可扩展的标记语言,项目中我们还是经常遇到的,所以呢,不得不学习明白哦。对于XML的使用,是我们最为关注的,抛砖引玉吧,写了一些小的demo,希望我们都可以做的更好!


这篇关于粗浅看 XML的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109570

相关文章

在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码

《在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码》在MyBatis的XML映射文件中,trim元素用于动态添加SQL语句的一部分,处理前缀、后缀及多余的逗号或连接符,示... 在MyBATis的XML映射文件中,<trim>元素用于动态地添加SQL语句的一部分,例如SET或W

Python xmltodict实现简化XML数据处理

《Pythonxmltodict实现简化XML数据处理》Python社区为提供了xmltodict库,它专为简化XML与Python数据结构的转换而设计,本文主要来为大家介绍一下如何使用xmltod... 目录一、引言二、XMLtodict介绍设计理念适用场景三、功能参数与属性1、parse函数2、unpa

关于Maven中pom.xml文件配置详解

《关于Maven中pom.xml文件配置详解》pom.xml是Maven项目的核心配置文件,它描述了项目的结构、依赖关系、构建配置等信息,通过合理配置pom.xml,可以提高项目的可维护性和构建效率... 目录1. POM文件的基本结构1.1 项目基本信息2. 项目属性2.1 引用属性3. 项目依赖4. 构

使用Python实现批量访问URL并解析XML响应功能

《使用Python实现批量访问URL并解析XML响应功能》在现代Web开发和数据抓取中,批量访问URL并解析响应内容是一个常见的需求,本文将详细介绍如何使用Python实现批量访问URL并解析XML响... 目录引言1. 背景与需求2. 工具方法实现2.1 单URL访问与解析代码实现代码说明2.2 示例调用

intellij idea generatorConfig.xml

generatorConfig.xml <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE generatorConfigurationPUBLIC "-//mybatis.org//DTD MyBatis Generator Configuration 1.0//EN""http://mybatis.org/dtd/mybatis-ge

xml概论

以下内容摘录自W3School 一、XML的特性 xml是用来传输和存储数据的,本身对数据没有任何操作。在这里要区别一下html,html是用来显示数据的。xml的焦点是数据内容,html的焦点是数据外观。 下面是xml的定义: •XML 指可扩展标记语言(EXtensible Markup Language) •XML 是一种标记语言,很类似 HTML

XML的创建

这里使用的是org.dom4j的jar包来完成xml格式数据的创建。 import java.io.IOException;import java.io.StringWriter;import org.dom4j.Document;import org.dom4j.DocumentHelper;import org.dom4j.Element;import org.dom4j.

Spring下自定义xml标签

dubbo自定义了很多xml标签,例如<dubbo:application>,那么这些自定义标签是怎么与spring结合起来的呢?我们先看一个简单的例子。 一 编写模型类 1 package com.hulk.testdubbo.model;2 3 public class Hero {4 private String name;5 private int

xml reader

// TODO Auto-generated method stub

spring事务属性的xml格式配置

实际是使用代理做的事务优化 <!--配置事务的属性--><tx:advice id="txAdvice" transaction-manager="transactionManager"> <tx:attributes> <!--匹配所有以add开头的方法--><tx:method name="add*" propagation="REQUIRED" /> <tx:metho