XML-DOM SAX解析

2024-09-06 09:38
文章标签 xml 解析 dom sax

本文主要是介绍XML-DOM SAX解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

XML基础

                1)XML的作用

                                1.1 作为软件配置文件

                                1.2 作为小型的“数据库”

                2)XML语法(由w3c组织规定的)

                                标签: 

                                                标签名不能以数字开头,中间不能有空格,区分大小写。有且仅有一个根标签。

                                属性:           

                                                可有多个属性,但属性值必须用引号(单引号或双引号)包含,但不能省略,也不能单                                                双混用。

                                文档声明:

                                                <?xml version="1.0"encoding="utf-8"?>      

                                                encoding="utf-8": 打开或解析xml文档时的编码

                                                注意:

                                        保存xml文档时的编码 和 解析xml文档时的编码要保持一致,才能避免中文乱码问题!

                3)XML解析

                                程序读取或操作xml文档

 

                                两种解析方式:   DOM解析   vs   SAX解析

 

                                DOM解析原理:一次性把xml文档加载成Document树,通过Document对象得到节点对象,通过节点对象访问xml文档内容(标签,属性,文本,注释)。

 

                                Dom4j工具(基于DOM解析原理):

                                                读取xml文档:

                                                            Document doc = newSAXReader().read("xml文件");

 

                                                节点:

                                                                nodeIterator();  所有节点

                                                标签:

                                                                element("名称")   指定名称的第一个子标签对象

                                                                elementIterator("名称");  指定名称的所有子标签对象

                                                                elements();  所有子标签对象

                                                属性:

                                                                attributeValue(“名称”)指定名称的属性值

                                                                attribute("名称")   指定名称的属性对象

                                                                                getName()  属性名称

                                                                                getValue()  属性值

                                                                atributeIterator()   所有属性对象(Iterator)

                                                                attributes()       所有属性对象(List)

                                                文本:

                                                                getText()  得到当前标签的文本

                                                                elementText("子标签名称")  得到子标签的文本

               

                               

今天的目标:     Dom4J修改xml   + xPath技术  + SAX解析 + XML约束

2 Dom4j修改xml文档

                2.1 写出内容到xml文档

                                XMLWriter writer = newXMLWriter(OutputStream, OutputForamt)

                                wirter.write(Document);

 

                2.2 修改xml文档的API

                        增加:

                                        DocumentHelper.createDocument()  增加文档

                                        addElement("名称")  增加标签

                                        addAttribute("名称",“值”)  增加属性

                        修改:

                                        Attribute.setValue("值")  修改属性值

                                        Element.addAtribute("同名的属性名","值")  修改同名的属性值

                                        Element.setText("内容")  修改文本内容

                        删除

                                        Element.detach();  删除标签 

                                        Attribute.detach();  删除属性

3 xPath技术 

                        3.1引入

                        问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!!

                        3.2xPath作用

                                主要是用于快速获取所需的节点对象。

 

                        3.3在dom4j中如何使用xPath技术

                                1)导入xPath支持jar包。  jaxen-1.1-beta-6.jar

                                2)使用xpath方法

                                                List<Node>  selectNodes("xpath表达式");   查询多个节点对象

                                                Node       selectSingleNode("xpath表达式");  查询一个节点对象

                               

                        3.4xPath语法

                                /     绝对路径      表示从xml的根位置开始或子元素(一个层次结构)

                                //    相对路径       表示不分任何层次结构的选择元素。

                                *     通配符         表示匹配所有元素

                                []     条件           表示选择什么条件下的元素

                                @    属性            表示选择属性节点

                                and    关系          表示条件的与关系(等价于&&)

                                text()   文本           表示选择文本内容

                 3.5 案例

                                用户登录功能:

                                        用户输入用户名和密码 -> 到“数据库”查询是否有对应的用户->

                                                有: 则表示登录成功

                                                没有: 则表示登录失败

 

                                用xml当做数据库

                                                user.xml   用来存储用户的数据

 

4 SAX解析

                        4.1回顾DOM解析

                                DOM解析原理:一次性把xml文档加载进内存,然后在内存中构建Document树。

                                                                对内存要求比较要。   

                                                缺点: 不适合读取大容量的xml文件,容易导致内存溢出。

                                       

                                SAX解析原理: 加载一点,读取一点,处理一点。对内存要求比较低。

 

                        4.2SAX解析工具    

                                        SAX解析工具-  Sun公司提供的。内置在jdk中。org.xml.sax.*

 

                                        核心的API:

                                                  SAXParser类: 用于读取和解析xml文件对象

                                                                parse(File f, DefaultHandler dh)方法:解析xml文件

                               

                                                参数一: File:表示 读取的xml文件。

                                            参数二: DefaultHandler: SAX事件处理程序。使用DefaultHandler的子类

例如:{

                  1.创建SAXParser对象 

              SAXParser parser=SAXParserFactory.newInstance().newSAXParser();

                  2.调用parse方法

            parser.parse(new File("./src/contact.xml"), new MyDefaultHandler());

}               [一个类继承class 类名(extendsDefaultHandler 在调用是创建传进去

 

                                DefaultHandler类的API:

                                                void startDocument()  :  在读到文档开始时调用

                                                void endDocument()  :在读到文档结束时调用

                                                voidstartElement(String uri, String localName, String qName, Attributes attributes) :读到开始标签时调用                             

                                                voidendElement(String uri, String localName, String qName)   :读到结束标签时调用

                                                voidcharacters(char[] ch, int start, int length) 读到文本内容时调用

 

                               

                                        ============DOM解析    vs  SAX解析             ========

       

DOM解析

SAX解析

原理: 一次性加载xml文档,不适合大容量的文件读取

原理: 加载一点,读取一点,处理一点。适合大容量文件的读取

DOM解析可以任意进行增删改成

SAX解析只能读取

DOM解析任意读取任何位置的数据,甚至往回读

SAX解析只能从上往下,按顺序读取,不能往回读

DOM解析面向对象的编程方法(Node,Element,Attribute),Java开发者编码比较简单。

SAX解析基于事件的编程方法。java开发编码相对复杂。

 

                总结:

                                1)Dom4j修改xml文档

                                         new XMLWrier();

                                                ......

                                2)xPath技术: 快速查询xml节点

                                                selectNodes()

                                                selectSinglNode();

                                        xpath表达式语言         

                                3) SAX解析

                                                SAXParser parse

                                                        parser()

                                        DefaultHandler类:

                                                        startElement();

                                                        characters();

                                                        endElement();

这篇关于XML-DOM SAX解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1141665

相关文章

PostgreSQL的扩展dict_int应用案例解析

《PostgreSQL的扩展dict_int应用案例解析》dict_int扩展为PostgreSQL提供了专业的整数文本处理能力,特别适合需要精确处理数字内容的搜索场景,本文给大家介绍PostgreS... 目录PostgreSQL的扩展dict_int一、扩展概述二、核心功能三、安装与启用四、字典配置方法

深度解析Java DTO(最新推荐)

《深度解析JavaDTO(最新推荐)》DTO(DataTransferObject)是一种用于在不同层(如Controller层、Service层)之间传输数据的对象设计模式,其核心目的是封装数据,... 目录一、什么是DTO?DTO的核心特点:二、为什么需要DTO?(对比Entity)三、实际应用场景解析

深度解析Java项目中包和包之间的联系

《深度解析Java项目中包和包之间的联系》文章浏览阅读850次,点赞13次,收藏8次。本文详细介绍了Java分层架构中的几个关键包:DTO、Controller、Service和Mapper。_jav... 目录前言一、各大包1.DTO1.1、DTO的核心用途1.2. DTO与实体类(Entity)的区别1

Java中的雪花算法Snowflake解析与实践技巧

《Java中的雪花算法Snowflake解析与实践技巧》本文解析了雪花算法的原理、Java实现及生产实践,涵盖ID结构、位运算技巧、时钟回拨处理、WorkerId分配等关键点,并探讨了百度UidGen... 目录一、雪花算法核心原理1.1 算法起源1.2 ID结构详解1.3 核心特性二、Java实现解析2.

python删除xml中的w:ascii属性的步骤

《python删除xml中的w:ascii属性的步骤》使用xml.etree.ElementTree删除WordXML中w:ascii属性,需注册命名空间并定位rFonts元素,通过del操作删除属... 可以使用python的XML.etree.ElementTree模块通过以下步骤删除XML中的w:as

使用Python绘制3D堆叠条形图全解析

《使用Python绘制3D堆叠条形图全解析》在数据可视化的工具箱里,3D图表总能带来眼前一亮的效果,本文就来和大家聊聊如何使用Python实现绘制3D堆叠条形图,感兴趣的小伙伴可以了解下... 目录为什么选择 3D 堆叠条形图代码实现:从数据到 3D 世界的搭建核心代码逐行解析细节优化应用场景:3D 堆叠图

深度解析Python装饰器常见用法与进阶技巧

《深度解析Python装饰器常见用法与进阶技巧》Python装饰器(Decorator)是提升代码可读性与复用性的强大工具,本文将深入解析Python装饰器的原理,常见用法,进阶技巧与最佳实践,希望可... 目录装饰器的基本原理函数装饰器的常见用法带参数的装饰器类装饰器与方法装饰器装饰器的嵌套与组合进阶技巧

解析C++11 static_assert及与Boost库的关联从入门到精通

《解析C++11static_assert及与Boost库的关联从入门到精通》static_assert是C++中强大的编译时验证工具,它能够在编译阶段拦截不符合预期的类型或值,增强代码的健壮性,通... 目录一、背景知识:传统断言方法的局限性1.1 assert宏1.2 #error指令1.3 第三方解决

全面解析MySQL索引长度限制问题与解决方案

《全面解析MySQL索引长度限制问题与解决方案》MySQL对索引长度设限是为了保持高效的数据检索性能,这个限制不是MySQL的缺陷,而是数据库设计中的权衡结果,下面我们就来看看如何解决这一问题吧... 目录引言:为什么会有索引键长度问题?一、问题根源深度解析mysql索引长度限制原理实际场景示例二、五大解决

深度解析Spring Boot拦截器Interceptor与过滤器Filter的区别与实战指南

《深度解析SpringBoot拦截器Interceptor与过滤器Filter的区别与实战指南》本文深度解析SpringBoot中拦截器与过滤器的区别,涵盖执行顺序、依赖关系、异常处理等核心差异,并... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现