《疯狂java讲义》学习(39):常见文件类型随机文件读写

2024-04-17 20:48

本文主要是介绍《疯狂java讲义》学习(39):常见文件类型随机文件读写,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

常见文件类型处理

本节简要介绍如何利用Java API和一些第三方类库,来处理如下5中类型的文件:

  1. 属性文件:属性文件是常见的配置文件,用于在不改变代码的情况下改变程序的行为。
  2. CSV:CSV是Comma Separated Values 的缩写,表示逗号分隔值,是一种非常常见的文件类型。大部分日志文件都是CSV,CSV也经常用于交换表格类型的数据,待会我们会看到,CSV看上去很简单,但处理的复杂性经常被低估。
  3. Excel:在编程中,经常需要将表格的数据导出为Excel格式,以方便用户查看,也经常需要接受Excel类型的文件作为输入以批量导入数据。
  4. HTML:所有网页都是HTML格式,我们经常需要分析HTML网页,以从中提取感兴趣的信息。
  5. 压缩文件:压缩文件有多种格式,也有很多压缩工具,大部分情况下,我们可以借助工具而不需要自己写程序处理压缩文件,但某些情况下,需要自己变成压缩文件或解压缩文件。

属性文件

属性文件一般很简单,一行表示一个属性,属性就是键值对,键和值用等号(=)或冒号(:)分隔,一般用于配置程序的一些参数。在需要连接数据库的程序中,经常使用配置文件配置数据库信息。比如,没有文件config.properties,内容大概如下所示:

db.host = 192.168.10.100
db.port : 3306
db.username = zhangsan
db.password = mima1234

处理这种文件使用字符流是比较容易地,但Java中有一个专门的类java.util.Properties,它的使用也很简单,有如下主要方法:

public synchronized void load(InputStream inStream)
public String getProperty(String key)
public String getProperty(String key, String defaultValue)

load用于从流中加载属性,getProperty用于获取属性值,可以提供一个默认值,如果没有找到配合的值,则返回默认值。对于上面的配置文件,可以使用类似下面的代码进行读取:

Properties prop = new Properties();
prop.load(new FileInputStream("config.properties"));
String host = prop.getProperty("db.host");
int port = Integer.valueOf(prop.getProperty("db.port", "3306"));

使用类Properties处理属性文件的好处是:

  • 可以自动处理空格,分隔符=前后的空格会被自动忽略。
  • 可以自动忽略空行。
  • 可以添加注释,以字符#或!开头的行会被视为注释,进行忽略。

使用Properties也有限制,它不能直接处理中文,在配置文件中,所有非ASCII字符需要使用Unicode编码。比如,不能再配置文件中直接这么写:

name=老马

"老马"需要替换为Unicode编码,如下所示:

name=\u8001\u9A6C

在Java IDE(如Eclipse)中,如果使用属性文件编码器,它会自动替换中文为Unicode编码;如果使用其他编辑器,可以先写成中文,然后使用JDK提供的命令native2ascii转换为Unicode编码。用法如下例所示:

native2ascii -encoding UTF-8 native.properties ascii.properties

native.properties是输入,其中包含中文;ascii.properties是输出,中文替换为了Unicode编码;-encoding指定输入文件的编码,这里指定为UTF-8。

CSV文件

CSV是Comma-Seqarated Values的缩写,表示逗号分隔值。一般而言,一行表示一条记录,一条记录包含多个字段,字段之间用逗号分隔。不过,一般而言,分隔符不一定是逗号,可能是其他字符,如tab符’\t’、冒号’:’、分号’;'等。程序中的各种日志文件通常是CSV文件,在导入导出表格类型的数据时,CSV也是经常用的一个格式。
CSV表格看上去很简单。比如,我们再上一章保存学生列表时,使用的就是CSV格式:

张三,18,80.9
李四,17,67.5

使用之前介绍的字符流,看上去就可以很容易处理CSV文件,按行读取,对每一行,使用String.split进行分隔即可。但使其CSV有一些复杂的地方,最重要的是:

  • 字段内容中包含分隔符怎么办?
  • 字段内容中包含换行符怎么办?

对于这些问题,CSV有一个参考标准:RFC-4180,但实践中不同程序往往有其他处理方式,所幸的是,处理方式大体类似,大概有以下两种处理方式。

  1. 使用引用符号比如“,在字段内容两边加上”,如果过内容中包含“本身,则使用两个”。
  2. 使用专业字符,常用的是\,如果内容中包含\,则使用两个\。

比如,如果字段内容有两行,内容为:

hello, world \ abc
"老马"

使用第一种方式,内容会变为:

"hello, world \ abc
""老马"""

使用第二种方式,内容会变为:

hello\,world\\ abc\n"老马"

CSV还有其他一些细节,不同程序的处理方式也不一样,比如:

  • 怎么表示null值
  • 空行和字段之间的空格怎么处理
  • 怎么表示注释

对于以上这些复杂问题,使用简单的字符流就难以处理了。有一个第三方类库:Apache Commons CSV,对处理CSV提供了良好的支持,它的官网地址是。简要介绍其用法。Apache Commons CSV中有一个重要的类CSVFormat,它表示CSV格式,它有很多方法以定义具体的CSV格式,如:

//定义分隔符
public CSVFormat withDelimiter(final char delimiter)
//定义引号符
public CSVFormat withQuote(final char quoteChar)
//定义转义符
public CSVFormat withEscape(final char escape)
//定义值为null的对象对应的字符串值
public CSVFormat withNullString(final String nullString)
//定义记录之间的分隔符
public CSVFormat withRecordSeparator(final char recordSeparator)
//定义是否忽略字段之间的空白
public CSVFormat withIgnoreSurroundingSpaces(final boolean ignoreSurroundingSpaces)

比如,如果CSV格式使用分号;作为分隔符,使用“作为引号符,使用N/A表示null对象,忽略字段之间的空白,那么CSVFormat可以如下创建:

CSVFormat format = CSVFormat.newFormat('; ').withQuote('"').withNullString("N/A").withIgnoreSurroundingSpaces(true);

除了自定义CSVFormat,CSVFormat类中也定义了一些预定义的格式,如CSVFormat.DEFAULT,CSVFormat.RFC4180。
CSVFormat有一个方法,可以分析字符流:

public CSVParser parse(final Reader in) throws IOException

返回值类型为CSVParser,它有如下方法获取记录信息:

public Iterator<CSVRecord> iterator()
public List<CSVRecord> getRecords() throws IOException
public long getRecordNumber()

CSVRecord表示一条记录,它有如下方法获取每个字段的信息:

//根据字段列索引获取值,索引从0开始
public String get(final int i)
//根据列名获取值
public String get(final String name)
//字段个数
public int size()
//字段的迭代器
public Iterator<String> iterator()

分析CSV文件的基本代码如下所示:

CSVFormat format = CSVFormat.newFormat('; ').withQuote('"').withNullString("N/A").withIgnoreSurroundingSpaces(true);
Reader reader = new FileReader("student.csv");
try{for(CSVRecord record : format.parse(reader)){int fieldNum = record.size();for(int i=0; i<fieldNum; i++){System.out.print(record.get(i)+" ");}System.out.println();}
}finally{reader.close();
}

除了分析CSV文件,Apache Commons CSV也可以写CSV文件,有一个CSVPrinter,它有很多打印方法,比如:

//输出一条记录,参数可变,每个参数是一个字段值
public void printRecord(final Object... values) throws IOException
//输出一条记录
public void printRecord(final Iterable<? > values) throws IOException

代码示例:

CSVPrinter out = new CSVPrinter(new FileWriter("student.csv"),CSVFormat.DEFAULT);
out.printRecord("老马", 18, "看电影,看书,听音乐");
out.printRecord("小马", 16, "乐高;赛车;");
out.close();

输出文件student.csv中的内容为:

"老马",18, "看电影,看书,听音乐"
"小马"

这篇关于《疯狂java讲义》学习(39):常见文件类型随机文件读写的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/912809

相关文章

SpringBoot应用中出现的Full GC问题的场景与解决

《SpringBoot应用中出现的FullGC问题的场景与解决》这篇文章主要为大家详细介绍了SpringBoot应用中出现的FullGC问题的场景与解决方法,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录Full GC的原理与触发条件原理触发条件对Spring Boot应用的影响示例代码优化建议结论F

springboot项目中常用的工具类和api详解

《springboot项目中常用的工具类和api详解》在SpringBoot项目中,开发者通常会依赖一些工具类和API来简化开发、提高效率,以下是一些常用的工具类及其典型应用场景,涵盖Spring原生... 目录1. Spring Framework 自带工具类(1) StringUtils(2) Coll

前端下载文件时如何后端返回的文件流一些常见方法

《前端下载文件时如何后端返回的文件流一些常见方法》:本文主要介绍前端下载文件时如何后端返回的文件流一些常见方法,包括使用Blob和URL.createObjectURL创建下载链接,以及处理带有C... 目录1. 使用 Blob 和 URL.createObjectURL 创建下载链接例子:使用 Blob

SpringBoot条件注解核心作用与使用场景详解

《SpringBoot条件注解核心作用与使用场景详解》SpringBoot的条件注解为开发者提供了强大的动态配置能力,理解其原理和适用场景是构建灵活、可扩展应用的关键,本文将系统梳理所有常用的条件注... 目录引言一、条件注解的核心机制二、SpringBoot内置条件注解详解1、@ConditionalOn

通过Spring层面进行事务回滚的实现

《通过Spring层面进行事务回滚的实现》本文主要介绍了通过Spring层面进行事务回滚的实现,包括声明式事务和编程式事务,具有一定的参考价值,感兴趣的可以了解一下... 目录声明式事务回滚:1. 基础注解配置2. 指定回滚异常类型3. ​不回滚特殊场景编程式事务回滚:1. ​使用 TransactionT

Spring LDAP目录服务的使用示例

《SpringLDAP目录服务的使用示例》本文主要介绍了SpringLDAP目录服务的使用示例... 目录引言一、Spring LDAP基础二、LdapTemplate详解三、LDAP对象映射四、基本LDAP操作4.1 查询操作4.2 添加操作4.3 修改操作4.4 删除操作五、认证与授权六、高级特性与最佳

Spring Shell 命令行实现交互式Shell应用开发

《SpringShell命令行实现交互式Shell应用开发》本文主要介绍了SpringShell命令行实现交互式Shell应用开发,能够帮助开发者快速构建功能丰富的命令行应用程序,具有一定的参考价... 目录引言一、Spring Shell概述二、创建命令类三、命令参数处理四、命令分组与帮助系统五、自定义S

SpringSecurity JWT基于令牌的无状态认证实现

《SpringSecurityJWT基于令牌的无状态认证实现》SpringSecurity中实现基于JWT的无状态认证是一种常见的做法,本文就来介绍一下SpringSecurityJWT基于令牌的无... 目录引言一、JWT基本原理与结构二、Spring Security JWT依赖配置三、JWT令牌生成与

Java中Date、LocalDate、LocalDateTime、LocalTime、时间戳之间的相互转换代码

《Java中Date、LocalDate、LocalDateTime、LocalTime、时间戳之间的相互转换代码》:本文主要介绍Java中日期时间转换的多种方法,包括将Date转换为LocalD... 目录一、Date转LocalDateTime二、Date转LocalDate三、LocalDateTim

如何配置Spring Boot中的Jackson序列化

《如何配置SpringBoot中的Jackson序列化》在开发基于SpringBoot的应用程序时,Jackson是默认的JSON序列化和反序列化工具,本文将详细介绍如何在SpringBoot中配置... 目录配置Spring Boot中的Jackson序列化1. 为什么需要自定义Jackson配置?2.