XML 使用Stax 基于XPath 和XMLEventReader迭代模型 和过滤方式的解析

本文主要是介绍XML 使用Stax 基于XPath 和XMLEventReader迭代模型 和过滤方式的解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

xml文件  放在src下

book.xml:

<?xml version="1.0" encoding="UTF-8"?>


<bookstore>
 
<book category="COOKING">
  <title lang="en">Everyday Italian</title>
  <author>Giada De Laurentiis</author>
  <year>2005</year>
  <price>30.00</price>
</book>


<book category="CHILDREN">
  <title lang="en">Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
</book>

 
<book category="WEB">
  <title lang="en">Learning XML</title>
  <author>Erik T. Ray</author>
  <year>2003</year>
  <price>39.95</price>
</book>

</bookstore>

 

 package xml.sg.stax;

import java.io.IOException;
import java.io.InputStream;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.stream.EventFilter;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.XMLStreamReader;
import javax.xml.stream.events.XMLEvent;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpressionException;
import javax.xml.xpath.XPathFactory;

import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class TestStax {
 // Stax解析xml
 @Test
 public void test01() {
  XMLInputFactory factory = XMLInputFactory.newInstance();
  InputStream stream = null;
  try {
   stream = TestStax.class.getClassLoader().getResourceAsStream(
     "book.xml");
   XMLStreamReader reader = factory.createXMLStreamReader(stream);
   while (reader.hasNext()) {
    int len = reader.next();
    // 判断是否是开始元素
    if (len == XMLStreamConstants.START_ELEMENT) {
     String name = reader.getName().toString();
     if (name.equals("book")) {
      System.out.println(reader.getAttributeName(0) + ":"
        + reader.getAttributeValue(0));
     }
    }
   }
  } catch (XMLStreamException e) {
   e.printStackTrace();
  } finally {
   if (stream != null) {
    try {
     stream.close();
    } catch (IOException e) {
     e.printStackTrace();
    }
   }
  }
 }

 @Test
 public void test02() {
  XMLInputFactory factory = XMLInputFactory.newInstance();
  InputStream stream = null;
  try {
   stream = TestStax.class.getClassLoader().getResourceAsStream(
     "book.xml");
   XMLStreamReader reader = factory.createXMLStreamReader(stream);
   while (reader.hasNext()) {
    int len = reader.next();
    // 判断是否是开始元素
    if (len == XMLStreamConstants.START_ELEMENT) {
     String name = reader.getName().toString();
     if (name.equals("title")) {
      System.out.println(reader.getElementText() + ":");
     }
     if (name.equals("price")) {
      System.out.println(reader.getElementText() + "/n");
     }
    }
   }
  } catch (XMLStreamException e) {
   e.printStackTrace();
  } finally {
   if (stream != null) {
    try {
     stream.close();
    } catch (IOException e) {
     e.printStackTrace();
    }
   }
  }
 }

 @Test
 public void test03() {
  XMLInputFactory factory = XMLInputFactory.newInstance();
  InputStream stream = null;
  try {
   stream = TestStax.class.getClassLoader().getResourceAsStream(
     "book.xml");
   // 基于迭代模型操作
   XMLEventReader reader = factory.createXMLEventReader(stream);
   while (reader.hasNext()) {
    // 通过XMLEvent来获取是否是某种节点类型
    XMLEvent event = reader.nextEvent();
    // 判断是否是开始元素
    if (event.isStartElement()) {
     // 通过event.asxxx来转换节点
     String name = event.asStartElement().getName().toString();
     if (name.equals("title")) {
      System.out.println(reader.getElementText() + ":");
     }
     if (name.equals("price")) {
      System.out.println(reader.getElementText() + "/n");
     }
    }
   }
  } catch (XMLStreamException e) {
   e.printStackTrace();
  } finally {
   if (stream != null) {
    try {
     stream.close();
    } catch (IOException e) {
     e.printStackTrace();
    }
   }
  }
 }

 @Test
 public void test04() {
  XMLInputFactory factory = XMLInputFactory.newInstance();
  InputStream stream = null;
  try {
   stream = TestStax.class.getClassLoader().getResourceAsStream(
     "book.xml");
   // 基于Filter的过滤方式 可以有效过滤掉不用进行操作的节点 效率更高一些
   XMLEventReader reader = factory.createFilteredReader(
     factory.createXMLEventReader(stream), new EventFilter() {
      @Override
      public boolean accept(XMLEvent event) {
       if (event.isStartElement()) {
        return true;
       }
       return false;
      }
     });
   while (reader.hasNext()) {
    // 通过XMLEvent来获取是否是某种节点类型
    XMLEvent event = reader.nextEvent();
    // 判断是否是开始元素
    if (event.isStartElement()) {
     // 通过event.asxxx来转换节点
     String name = event.asStartElement().getName().toString();
     if (name.equals("title")) {
      System.out.println(reader.getElementText() + ":");
     }
     if (name.equals("price")) {
      System.out.println(reader.getElementText() + "\n");
     }
    }
   }
  } catch (XMLStreamException e) {
   e.printStackTrace();
  } finally {
   if (stream != null) {
    try {
     stream.close();
    } catch (IOException e) {
     e.printStackTrace();
    }
   }
  }
 }

 @Test
 public void test05() {
  InputStream stream = null;
  try {
   stream = TestStax.class.getClassLoader().getResourceAsStream(
     "book.xml");
   //创建文档处理对象
   DocumentBuilder builder = DocumentBuilderFactory.newInstance()
     .newDocumentBuilder();
   //通过DocumentBuilder创建文档对象
   Document document = builder.parse(stream);
   //创建XPath
   XPath xPath = XPathFactory.newInstance().newXPath();
   //第一个参数是xpath 第二个参数是文档 找category='WEB'的title
   NodeList nodeList = (NodeList) xPath.evaluate("//book[@category='WEB']", document,XPathConstants.NODESET);
   for (int i = 0; i < nodeList.getLength(); i++) {
    //遍历输入的相应结果
    Element element = (Element) nodeList.item(i);
    System.out.println(element.getElementsByTagName("title").item(0).getTextContent());
   }
   
  } catch (XPathExpressionException e) {
   e.printStackTrace();
  } catch (SAXException e) {
   e.printStackTrace();
  } catch (IOException e) {
   e.printStackTrace();
  } catch (ParserConfigurationException e) {
   e.printStackTrace();
  }
 }
}

 

 

 

这篇关于XML 使用Stax 基于XPath 和XMLEventReader迭代模型 和过滤方式的解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/714278

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象