javaweb-day02-2(XML 解析 - Jaxp的sax方式解析)

2024-09-07 16:08

本文主要是介绍javaweb-day02-2(XML 解析 - Jaxp的sax方式解析),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Jaxp解析开发包


Sax解析方式只能做查询:


Sax解析方式和DOM解析方式的区别:

 

  •   在使用 DOM 解析 XML 文档时,需要读取整个 XML文档,在内存中构架代表整个DOM 树的Doucment对象,从而再对XML文档进行操作。此种情况下,如果XML 文档特别大,就会消耗计算机的大量内存,并且容易导致内存溢出。
  •   SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。

 

 

Sax解析方式的运行原理:

SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器:

  •   解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。
  •   解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。
  •   事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。

 


顺序:

1.        javax.xml.parsers 包SAXParserFactory. newInstance(). newSAXParser() 得到javax.xml.parsers 包SAXParser解析器对象。

2.        SAXParser 有方法:getXMLReader(),得到org.xml.sax 包 XMLReader对象。

3.        XMLReader 有方法:setContentHandler(ContentHandlerhandler) 可以设置一个自己写的内容处理器进去。

4.        XMLReader 有方法:parse(InputSourceinput)、parse(String systemId)  来解析xml文档。

 

 

最常用的事件处理器:

org.xml.sax包ContentHandler  常用的方法:

  •   解析器解析到 字符数据 时会自动调用:characters(char[]ch, int start, int length) 方法,解析到的字符数据会封装到char[]  ch里传进这个方法里。
  •   解析器解析到 开始标签 时就会自动调用:startElement(Stringuri, String localName, String qName, Attributes atts) 方法,它也会告诉我们:标签的名称:String qName, 标签的属性:Attributes atts。
    •   org.xml.sax包Attributes 属性,内部是一个List集合:通过getLength() 方法得到属性的个数、通过getQName(int index) 方法拿到属性名、通过getValue(int index)、getValue(String qName) 方法拿到属性的值。
  •   解析器解析到 结束标签 时就会调用:endElement(Stringuri, String localName, String qName) 方法,它也会告诉我们:标签的名称:StringqName。
  •   解析器解析到 处理指令 时就会调用:processingInstruction(Stringtarget, String data) 方法。
  •   解析器 开始解析xml文档 时会调用:startDocument() 方法。

实现org.xml.sax.ContentHandler 有点麻烦,需要实现所有方法。我们可以继承它的已知实现类: org.xml.sax.helpers .DefaultHandler,就可以只重写需要的方法。

 

 

package cn.mengmei.sax;import java.io.IOException;import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;public class Demo1 {public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {SAXParserFactory factory = SAXParserFactory.newInstance();SAXParser parser = factory.newSAXParser();XMLReader reader = parser.getXMLReader();reader.setContentHandler(new MyContentHandler2());reader.parse("src/book.xml");}}//如果实现的方法里参数不显示名称,按住Ctrl键点实现的那个类的名称,进到源码页面添加源码:
//External File: jdk1.7 里面有 src.zip 源码class MyContentHandler implements ContentHandler{@Overridepublic void startElement(String uri, String localName, String qName,Attributes atts) throws SAXException {System.out.println("开始标签:"+qName);for(int i=0;i<atts.getLength();i++){String name = atts.getQName(i);String value = atts.getValue(name);System.out.println("属性:"+name+"="+value);}}@Overridepublic void characters(char[] ch, int start, int length)throws SAXException {System.out.println(new String(ch,start,length));}@Overridepublic void endElement(String uri, String localName, String qName)throws SAXException {System.out.println("结束标签:"+qName);}@Overridepublic void setDocumentLocator(Locator locator) {// TODO Auto-generated method stub}@Overridepublic void startDocument() throws SAXException {// TODO Auto-generated method stub}@Overridepublic void endDocument() throws SAXException {// TODO Auto-generated method stub}@Overridepublic void startPrefixMapping(String prefix, String uri)throws SAXException {// TODO Auto-generated method stub}@Overridepublic void endPrefixMapping(String prefix) throws SAXException {// TODO Auto-generated method stub}@Overridepublic void ignorableWhitespace(char[] ch, int start, int length)throws SAXException {// TODO Auto-generated method stub}@Overridepublic void processingInstruction(String target, String data)throws SAXException {// TODO Auto-generated method stub}@Overridepublic void skippedEntity(String name) throws SAXException {// TODO Auto-generated method stub}}//获取第一个售价节点的值:
class MyContentHandler2 extends DefaultHandler{private boolean flag = false;private int num = 1;@Overridepublic void startElement(String uri, String localName, String qName,Attributes attributes) throws SAXException {if(qName.equals("售价")){flag = true;}}@Overridepublic void endElement(String uri, String localName, String qName)throws SAXException {if(qName.equals("售价")){flag = false;num--;}}@Overridepublic void characters(char[] ch, int start, int length)throws SAXException {if(flag && num==1){System.out.println(new String(ch,start,length));}}}


book.xml

<?xml version="1.0" encoding="UTF-8"?><书架><书 name="xxx"><书名>Java就业培训教程</书名><作者>张孝祥</作者><售价>39.00元</售价></书><书><书名>JavaScript网页开发</书名><作者>张孝祥</作者><售价>28.00元</售价></书>
</书架>



 

 

这篇关于javaweb-day02-2(XML 解析 - Jaxp的sax方式解析)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1145526

相关文章

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

JAVA系统中Spring Boot应用程序的配置文件application.yml使用详解

《JAVA系统中SpringBoot应用程序的配置文件application.yml使用详解》:本文主要介绍JAVA系统中SpringBoot应用程序的配置文件application.yml的... 目录文件路径文件内容解释1. Server 配置2. Spring 配置3. Logging 配置4. Ma

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

java脚本使用不同版本jdk的说明介绍

《java脚本使用不同版本jdk的说明介绍》本文介绍了在Java中执行JavaScript脚本的几种方式,包括使用ScriptEngine、Nashorn和GraalVM,ScriptEngine适用... 目录Java脚本使用不同版本jdk的说明1.使用ScriptEngine执行javascript2.

在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码

《在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码》在MyBatis的XML映射文件中,trim元素用于动态添加SQL语句的一部分,处理前缀、后缀及多余的逗号或连接符,示... 在MyBATis的XML映射文件中,<trim>元素用于动态地添加SQL语句的一部分,例如SET或W

Python xmltodict实现简化XML数据处理

《Pythonxmltodict实现简化XML数据处理》Python社区为提供了xmltodict库,它专为简化XML与Python数据结构的转换而设计,本文主要来为大家介绍一下如何使用xmltod... 目录一、引言二、XMLtodict介绍设计理念适用场景三、功能参数与属性1、parse函数2、unpa

Mybatis官方生成器的使用方式

《Mybatis官方生成器的使用方式》本文详细介绍了MyBatisGenerator(MBG)的使用方法,通过实际代码示例展示了如何配置Maven插件来自动化生成MyBatis项目所需的实体类、Map... 目录1. MyBATis Generator 简介2. MyBatis Generator 的功能3

Spring MVC如何设置响应

《SpringMVC如何设置响应》本文介绍了如何在Spring框架中设置响应,并通过不同的注解返回静态页面、HTML片段和JSON数据,此外,还讲解了如何设置响应的状态码和Header... 目录1. 返回静态页面1.1 Spring 默认扫描路径1.2 @RestController2. 返回 html2

关于Maven中pom.xml文件配置详解

《关于Maven中pom.xml文件配置详解》pom.xml是Maven项目的核心配置文件,它描述了项目的结构、依赖关系、构建配置等信息,通过合理配置pom.xml,可以提高项目的可维护性和构建效率... 目录1. POM文件的基本结构1.1 项目基本信息2. 项目属性2.1 引用属性3. 项目依赖4. 构