XML-DOM SAX解析

2024-09-06 09:38
文章标签 xml 解析 dom sax

本文主要是介绍XML-DOM SAX解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

XML基础

                1)XML的作用

                                1.1 作为软件配置文件

                                1.2 作为小型的“数据库”

                2)XML语法(由w3c组织规定的)

                                标签: 

                                                标签名不能以数字开头,中间不能有空格,区分大小写。有且仅有一个根标签。

                                属性:           

                                                可有多个属性,但属性值必须用引号(单引号或双引号)包含,但不能省略,也不能单                                                双混用。

                                文档声明:

                                                <?xml version="1.0"encoding="utf-8"?>      

                                                encoding="utf-8": 打开或解析xml文档时的编码

                                                注意:

                                        保存xml文档时的编码 和 解析xml文档时的编码要保持一致,才能避免中文乱码问题!

                3)XML解析

                                程序读取或操作xml文档

 

                                两种解析方式:   DOM解析   vs   SAX解析

 

                                DOM解析原理:一次性把xml文档加载成Document树,通过Document对象得到节点对象,通过节点对象访问xml文档内容(标签,属性,文本,注释)。

 

                                Dom4j工具(基于DOM解析原理):

                                                读取xml文档:

                                                            Document doc = newSAXReader().read("xml文件");

 

                                                节点:

                                                                nodeIterator();  所有节点

                                                标签:

                                                                element("名称")   指定名称的第一个子标签对象

                                                                elementIterator("名称");  指定名称的所有子标签对象

                                                                elements();  所有子标签对象

                                                属性:

                                                                attributeValue(“名称”)指定名称的属性值

                                                                attribute("名称")   指定名称的属性对象

                                                                                getName()  属性名称

                                                                                getValue()  属性值

                                                                atributeIterator()   所有属性对象(Iterator)

                                                                attributes()       所有属性对象(List)

                                                文本:

                                                                getText()  得到当前标签的文本

                                                                elementText("子标签名称")  得到子标签的文本

               

                               

今天的目标:     Dom4J修改xml   + xPath技术  + SAX解析 + XML约束

2 Dom4j修改xml文档

                2.1 写出内容到xml文档

                                XMLWriter writer = newXMLWriter(OutputStream, OutputForamt)

                                wirter.write(Document);

 

                2.2 修改xml文档的API

                        增加:

                                        DocumentHelper.createDocument()  增加文档

                                        addElement("名称")  增加标签

                                        addAttribute("名称",“值”)  增加属性

                        修改:

                                        Attribute.setValue("值")  修改属性值

                                        Element.addAtribute("同名的属性名","值")  修改同名的属性值

                                        Element.setText("内容")  修改文本内容

                        删除

                                        Element.detach();  删除标签 

                                        Attribute.detach();  删除属性

3 xPath技术 

                        3.1引入

                        问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!!

                        3.2xPath作用

                                主要是用于快速获取所需的节点对象。

 

                        3.3在dom4j中如何使用xPath技术

                                1)导入xPath支持jar包。  jaxen-1.1-beta-6.jar

                                2)使用xpath方法

                                                List<Node>  selectNodes("xpath表达式");   查询多个节点对象

                                                Node       selectSingleNode("xpath表达式");  查询一个节点对象

                               

                        3.4xPath语法

                                /     绝对路径      表示从xml的根位置开始或子元素(一个层次结构)

                                //    相对路径       表示不分任何层次结构的选择元素。

                                *     通配符         表示匹配所有元素

                                []     条件           表示选择什么条件下的元素

                                @    属性            表示选择属性节点

                                and    关系          表示条件的与关系(等价于&&)

                                text()   文本           表示选择文本内容

                 3.5 案例

                                用户登录功能:

                                        用户输入用户名和密码 -> 到“数据库”查询是否有对应的用户->

                                                有: 则表示登录成功

                                                没有: 则表示登录失败

 

                                用xml当做数据库

                                                user.xml   用来存储用户的数据

 

4 SAX解析

                        4.1回顾DOM解析

                                DOM解析原理:一次性把xml文档加载进内存,然后在内存中构建Document树。

                                                                对内存要求比较要。   

                                                缺点: 不适合读取大容量的xml文件,容易导致内存溢出。

                                       

                                SAX解析原理: 加载一点,读取一点,处理一点。对内存要求比较低。

 

                        4.2SAX解析工具    

                                        SAX解析工具-  Sun公司提供的。内置在jdk中。org.xml.sax.*

 

                                        核心的API:

                                                  SAXParser类: 用于读取和解析xml文件对象

                                                                parse(File f, DefaultHandler dh)方法:解析xml文件

                               

                                                参数一: File:表示 读取的xml文件。

                                            参数二: DefaultHandler: SAX事件处理程序。使用DefaultHandler的子类

例如:{

                  1.创建SAXParser对象 

              SAXParser parser=SAXParserFactory.newInstance().newSAXParser();

                  2.调用parse方法

            parser.parse(new File("./src/contact.xml"), new MyDefaultHandler());

}               [一个类继承class 类名(extendsDefaultHandler 在调用是创建传进去

 

                                DefaultHandler类的API:

                                                void startDocument()  :  在读到文档开始时调用

                                                void endDocument()  :在读到文档结束时调用

                                                voidstartElement(String uri, String localName, String qName, Attributes attributes) :读到开始标签时调用                             

                                                voidendElement(String uri, String localName, String qName)   :读到结束标签时调用

                                                voidcharacters(char[] ch, int start, int length) 读到文本内容时调用

 

                               

                                        ============DOM解析    vs  SAX解析             ========

       

DOM解析

SAX解析

原理: 一次性加载xml文档,不适合大容量的文件读取

原理: 加载一点,读取一点,处理一点。适合大容量文件的读取

DOM解析可以任意进行增删改成

SAX解析只能读取

DOM解析任意读取任何位置的数据,甚至往回读

SAX解析只能从上往下,按顺序读取,不能往回读

DOM解析面向对象的编程方法(Node,Element,Attribute),Java开发者编码比较简单。

SAX解析基于事件的编程方法。java开发编码相对复杂。

 

                总结:

                                1)Dom4j修改xml文档

                                         new XMLWrier();

                                                ......

                                2)xPath技术: 快速查询xml节点

                                                selectNodes()

                                                selectSinglNode();

                                        xpath表达式语言         

                                3) SAX解析

                                                SAXParser parse

                                                        parser()

                                        DefaultHandler类:

                                                        startElement();

                                                        characters();

                                                        endElement();

这篇关于XML-DOM SAX解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1141665

相关文章

在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码

《在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码》在MyBatis的XML映射文件中,trim元素用于动态添加SQL语句的一部分,处理前缀、后缀及多余的逗号或连接符,示... 在MyBATis的XML映射文件中,<trim>元素用于动态地添加SQL语句的一部分,例如SET或W

Python xmltodict实现简化XML数据处理

《Pythonxmltodict实现简化XML数据处理》Python社区为提供了xmltodict库,它专为简化XML与Python数据结构的转换而设计,本文主要来为大家介绍一下如何使用xmltod... 目录一、引言二、XMLtodict介绍设计理念适用场景三、功能参数与属性1、parse函数2、unpa

关于Maven中pom.xml文件配置详解

《关于Maven中pom.xml文件配置详解》pom.xml是Maven项目的核心配置文件,它描述了项目的结构、依赖关系、构建配置等信息,通过合理配置pom.xml,可以提高项目的可维护性和构建效率... 目录1. POM文件的基本结构1.1 项目基本信息2. 项目属性2.1 引用属性3. 项目依赖4. 构

使用Python实现批量访问URL并解析XML响应功能

《使用Python实现批量访问URL并解析XML响应功能》在现代Web开发和数据抓取中,批量访问URL并解析响应内容是一个常见的需求,本文将详细介绍如何使用Python实现批量访问URL并解析XML响... 目录引言1. 背景与需求2. 工具方法实现2.1 单URL访问与解析代码实现代码说明2.2 示例调用

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

SpringCloud配置动态更新原理解析

《SpringCloud配置动态更新原理解析》在微服务架构的浩瀚星海中,服务配置的动态更新如同魔法一般,能够让应用在不重启的情况下,实时响应配置的变更,SpringCloud作为微服务架构中的佼佼者,... 目录一、SpringBoot、Cloud配置的读取二、SpringCloud配置动态刷新三、更新@R

使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)

《使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)》在现代软件开发中,处理JSON数据是一项非常常见的任务,无论是从API接口获取数据,还是将数据存储为JSON格式,解析... 目录1. 背景介绍1.1 jsON简介1.2 实际案例2. 准备工作2.1 环境搭建2.1.1 添加

JavaScript DOM操作与事件处理方法

《JavaScriptDOM操作与事件处理方法》本文通过一系列代码片段,详细介绍了如何使用JavaScript进行DOM操作、事件处理、属性操作、内容操作、尺寸和位置获取,以及实现简单的动画效果,涵... 目录前言1. 类名操作代码片段代码解析2. 属性操作代码片段代码解析3. 内容操作代码片段代码解析4.

在C#中合并和解析相对路径方式

《在C#中合并和解析相对路径方式》Path类提供了几个用于操作文件路径的静态方法,其中包括Combine方法和GetFullPath方法,Combine方法将两个路径合并在一起,但不会解析包含相对元素... 目录C#合并和解析相对路径System.IO.Path类幸运的是总结C#合并和解析相对路径对于 C

Java解析JSON的六种方案

《Java解析JSON的六种方案》这篇文章介绍了6种JSON解析方案,包括Jackson、Gson、FastJSON、JsonPath、、手动解析,分别阐述了它们的功能特点、代码示例、高级功能、优缺点... 目录前言1. 使用 Jackson:业界标配功能特点代码示例高级功能优缺点2. 使用 Gson:轻量