SAX 解析到文件,缓存到内存

2024-04-01 21:58
文章标签 内存 解析 缓存 sax

本文主要是介绍SAX 解析到文件,缓存到内存,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目的
    通过一个小的SAX例子,我们更清晰的理解SAX的工作原理。

    本文例子主要实现:
    1. 将每个Employee信息输出到自己的文件中,文件名是以Employee ID和Employee Name来命名的,注意,观察代码中是如何得到Employee ID和Employee Name;
    2. 将每个Employee信息存入到Map中,其中,Map中的每个Value对应一个Employee的Collection,Map中的每个Key对应该Employee的ID。


    package shuai.study.sax.demo;  import java.io.File;  import java.io.IOException;  import java.util.Collection;  import java.util.HashMap;  import java.util.LinkedList;  import java.util.Map;  import javax.xml.parsers.ParserConfigurationException;  import javax.xml.parsers.SAXParser;  import javax.xml.parsers.SAXParserFactory;  import org.apache.commons.io.FileUtils;  import org.apache.commons.lang3.StringUtils;  import org.xml.sax.Attributes;  import org.xml.sax.SAXException;  import org.xml.sax.helpers.DefaultHandler;  /** * @author shengshu *  */  public class SaxHandler extends DefaultHandler {  private final static String leafNodeText = "|firstname|;|lastname|;|sex|;|country|;|province|;|city|;|village|;|mobile|;|mail|;|qq|;|postcode|;|profession|";  private Map<String, Collection<String>> companyMap = null;  private Collection<String> employeeCollection = null;  private String currentValue = null;  private String currentCharacters = null;  private StringBuffer idAndNameStringBuffer = null;  public SaxHandler(File inputFile) {  this.parseDocument(inputFile);  }  private void parseDocument(File inputFile) {  SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();  try {  SAXParser saxParser = saxParserFactory.newSAXParser();  saxParser.parse(inputFile, this);  } catch (ParserConfigurationException pce) {  pce.printStackTrace();  } catch (SAXException saxe) {  saxe.printStackTrace();  } catch (IOException ioe) {  ioe.printStackTrace();  }  }  @Override  public void startDocument() throws SAXException {  super.startDocument();  this.companyMap = new HashMap<String, Collection<String>>();  }  @Override  public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {  if (qName.equalsIgnoreCase("Employee")) {  this.employeeCollection = new LinkedList<String>();  this.idAndNameStringBuffer = new StringBuffer();  this.currentValue = attributes.getValue("ID");  }  }  @Override  public void characters(char[] buffer, int start, int length) {  this.currentCharacters = new String(buffer, start, length);  }  @Override  public void endElement(String uri, String localName, String qName) throws SAXException {  if (StringUtils.containsIgnoreCase(leafNodeText, "|" + qName + "|")) {  this.employeeCollection.add(qName + ": " + this.currentCharacters);  if (qName.equalsIgnoreCase("FirstName")) {  this.idAndNameStringBuffer.append(this.currentCharacters);  }  if (qName.equalsIgnoreCase("LastName")) {  this.idAndNameStringBuffer.append(this.currentCharacters);  }  }  if (qName.equalsIgnoreCase("Employee")) {  this.companyMap.put(this.currentValue, this.employeeCollection);  this.idAndNameStringBuffer.append("-").append(this.currentValue);  this.writeEmployee(employeeCollection, idAndNameStringBuffer.toString());  }  }  private void writeEmployee(Collection<String> employeeCollection, String fileName) {  String outputFileDirectory = SaxHandler.class.getResource("/file/output/").getPath();  String outputFilePath = outputFileDirectory + fileName + ".xml";  File outputFile = new File(outputFilePath);  try {  FileUtils.writeLines(outputFile, employeeCollection, false);  } catch (IOException ioe) {  ioe.printStackTrace();  }  }  @Override  public void endDocument() throws SAXException {  super.endDocument();  }  public Map<String, Collection<String>> getCompanyMap() {  return this.companyMap;  }  }  

    package shuai.study.sax.demo;  import java.io.File;  import java.util.Collection;  import java.util.Iterator;  import java.util.Map;  import java.util.Map.Entry;  /** * @author shengshu *  */  public class SaxDemo {  public static void displayCompany(Map<String, Collection<String>> companyMap) {  Iterator<Entry<String, Collection<String>>> companyIterator = companyMap.entrySet().iterator();  while (companyIterator.hasNext()) {  Entry<String, Collection<String>> companyEntry = companyIterator.next();  String id = companyEntry.getKey();  System.out.println("============== Employee ID " + id + " Start ==============");  Collection<String> employeeCollection = companyEntry.getValue();  Iterator<String> employeeIterator = employeeCollection.iterator();  while (employeeIterator.hasNext()) {  String leafNodeAndValue = employeeIterator.next();  System.out.println(leafNodeAndValue);  }  System.out.println("============== Employee ID " + id + " End ==============");  }  }  public static void main(String[] args) {  String inputFilePath = SaxDemo.class.getResource("/file/input/company.xml").getPath();  File inputFile = new File(inputFilePath);  SaxHandler saxHandler = new SaxHandler(inputFile);  Map<String, Collection<String>> companyMap = saxHandler.getCompanyMap();  SaxDemo.displayCompany(companyMap);  }  }  

    <?xml version = "1.0" encoding="UTF-8"?>  <Company>  <Employee ID="37">  <Name>  <FirstName>Zhou</FirstName>  <LastName>Shengshuai</LastName>  </Name>  <Sex>Male</Sex>  <Address>  <Country>China</Country>  <Province>ShanDong</Province>  <City>LinYi</City>  <Village>FengHuangYu</Village>  <Contact>  <Mobile>18108***778</Mobile>  <Mail>zhoushengshuai2007@163.com</Mail>  <QQ>254392398</QQ>  <Postcode>276422</Postcode>  </Contact>  </Address>  <Profession>Software</Profession>  </Employee>  <Employee ID="66">  <Name>  <FirstName>Wang</FirstName>  <LastName>Eric</LastName>  </Name>  <Sex>Male</Sex>  <Address>  <Country>China</Country>  <Province>HeBei</Province>  <City>QinHuangDao</City>  <Village>hhh</Village>  <Contact>  <Mobile>150*****955</Mobile>  <Mail>eric@163.com</Mail>  <QQ>666666666</QQ>  <Postcode>111666</Postcode>  </Contact>  </Address>  <Profession>Software</Profession>  </Employee>  <Employee ID="99">  <Name>  <FirstName>Shi</FirstName>  <LastName>Stone</LastName>  </Name>  <Sex>Male</Sex>  <Address>  <Country>China</Country>  <Province>HeNan</Province>  <City>PingDingShan</City>  <Village>nnn</Village>  <Contact>  <Mobile>186*****015</Mobile>  <Mail>stone@163.com</Mail>  <QQ>999999999</QQ>  <Postcode>111999</Postcode>  </Contact>  </Address>  <Profession>Software</Profession>  </Employee>  </Company>  

这篇关于SAX 解析到文件,缓存到内存的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/868234

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

NameNode内存生产配置

Hadoop2.x 系列,配置 NameNode 内存 NameNode 内存默认 2000m ,如果服务器内存 4G , NameNode 内存可以配置 3g 。在 hadoop-env.sh 文件中配置如下。 HADOOP_NAMENODE_OPTS=-Xmx3072m Hadoop3.x 系列,配置 Nam

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

缓存雪崩问题

缓存雪崩是缓存中大量key失效后当高并发到来时导致大量请求到数据库,瞬间耗尽数据库资源,导致数据库无法使用。 解决方案: 1、使用锁进行控制 2、对同一类型信息的key设置不同的过期时间 3、缓存预热 1. 什么是缓存雪崩 缓存雪崩是指在短时间内,大量缓存数据同时失效,导致所有请求直接涌向数据库,瞬间增加数据库的负载压力,可能导致数据库性能下降甚至崩溃。这种情况往往发生在缓存中大量 k

OWASP十大安全漏洞解析

OWASP(开放式Web应用程序安全项目)发布的“十大安全漏洞”列表是Web应用程序安全领域的权威指南,它总结了Web应用程序中最常见、最危险的安全隐患。以下是对OWASP十大安全漏洞的详细解析: 1. 注入漏洞(Injection) 描述:攻击者通过在应用程序的输入数据中插入恶意代码,从而控制应用程序的行为。常见的注入类型包括SQL注入、OS命令注入、LDAP注入等。 影响:可能导致数据泄

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

Spring 源码解读:自定义实现Bean定义的注册与解析

引言 在Spring框架中,Bean的注册与解析是整个依赖注入流程的核心步骤。通过Bean定义,Spring容器知道如何创建、配置和管理每个Bean实例。本篇文章将通过实现一个简化版的Bean定义注册与解析机制,帮助你理解Spring框架背后的设计逻辑。我们还将对比Spring中的BeanDefinition和BeanDefinitionRegistry,以全面掌握Bean注册和解析的核心原理。

CSP 2023 提高级第一轮 CSP-S 2023初试题 完善程序第二题解析 未完

一、题目阅读 (最大值之和)给定整数序列 a0,⋯,an−1,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105 和 1≤ai≤108。 一个序列的非空连续子序列可以用两个下标 ll 和 rr(其中0≤l≤r<n0≤l≤r<n)表示,对应的序列为 al,al+1,⋯,ar​。两个非空连续子序列不同,当且仅当下标不同。 例如,当原序列为 [1,2,1,2] 时,要计算子序列 [

多线程解析报表

假如有这样一个需求,当我们需要解析一个Excel里多个sheet的数据时,可以考虑使用多线程,每个线程解析一个sheet里的数据,等到所有的sheet都解析完之后,程序需要提示解析完成。 Way1 join import java.time.LocalTime;public class Main {public static void main(String[] args) thro

ZooKeeper 中的 Curator 框架解析

Apache ZooKeeper 是一个为分布式应用提供一致性服务的软件。它提供了诸如配置管理、分布式同步、组服务等功能。在使用 ZooKeeper 时,Curator 是一个非常流行的客户端库,它简化了 ZooKeeper 的使用,提供了高级的抽象和丰富的工具。本文将详细介绍 Curator 框架,包括它的设计哲学、核心组件以及如何使用 Curator 来简化 ZooKeeper 的操作。 1