Java中IO流-19-字节流写中文的问题

2024-06-11 11:32

本文主要是介绍Java中IO流-19-字节流写中文的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

      前面我们在介绍字节流读写文件都是用英文内容来介绍,那么如果用字节流来读取中文的文件内容会有什么问题呢?当然,我们前面文章提到过,除了字节流还有一种字符流,字符流用来用来处理纯字符的文件。这篇,我们还没有介绍字符流操作,我们尝试用字节流方式去读取文件,然后看看会发生什么问题吧.

     由于我们大部分人都是中文的操作系统,Eclipse安装之后,右键项目,属性,可以看到默认的编码方式是GBK,所以,我们不能一个一个字节去读取,这样的话肯定产生乱码。由于中文中GBK字符集,每个汉字都是采用2个字节存储,所以,我们下面利用小数组的方式来看看。(提前在当前项目下准备一个abc.txt文件,里面内容就四个汉字“你好你好”)

package io;import java.io.FileInputStream;
import java.io.IOException;public class Demo4_BufferCopy {public static void main(String[] args) throws IOException {FileInputStream fis = new FileInputStream("abc.txt");byte[] arr = new byte[3]; //数组长度为3个字节int len;while ( ( len = fis.read(arr)) != -1 ) {System.out.println(new String(arr,0,len));}fis.close();}}

      上面代码,首先是创建一个3个字节的小数组,这个就是我们自定义的,有点类似缓冲区的意思。每次读取3个字节的长度,然后while循环中的打印语句部分,使用了String类的构造方法,把字节数组转换成字符串。上面的代码一定要你Eclipse项目右键,属性面板字符集显示GBK,运行才显示乱码,如果字符集是UTF-8,运行正常输出显示中文。

    显示乱码的原因就是每次都读取3个字节,但是GBK中一个汉字占两个字节,第一次读取3个字节,读取出了“你”和“好”的一半,这一半就显示乱码或者问号。如果你把数组长度改成一次性读取4个字节,那么问题就会消失。但是,如果你abc.txt中还包含其他的符号,例如逗号,点号等等,这种4个字节读取还是可能会出现乱码。所以,字节流读取中文还是不可靠,这个就需要字符流来干这个活。

 

这篇关于Java中IO流-19-字节流写中文的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1051049

相关文章

Java实现Excel与HTML互转

《Java实现Excel与HTML互转》Excel是一种电子表格格式,而HTM则是一种用于创建网页的标记语言,虽然两者在用途上存在差异,但有时我们需要将数据从一种格式转换为另一种格式,下面我们就来看看... Excel是一种电子表格格式,广泛用于数据处理和分析,而HTM则是一种用于创建网页的标记语言。虽然两

java图像识别工具类(ImageRecognitionUtils)使用实例详解

《java图像识别工具类(ImageRecognitionUtils)使用实例详解》:本文主要介绍如何在Java中使用OpenCV进行图像识别,包括图像加载、预处理、分类、人脸检测和特征提取等步骤... 目录前言1. 图像识别的背景与作用2. 设计目标3. 项目依赖4. 设计与实现 ImageRecogni

Java中Springboot集成Kafka实现消息发送和接收功能

《Java中Springboot集成Kafka实现消息发送和接收功能》Kafka是一个高吞吐量的分布式发布-订阅消息系统,主要用于处理大规模数据流,它由生产者、消费者、主题、分区和代理等组件构成,Ka... 目录一、Kafka 简介二、Kafka 功能三、POM依赖四、配置文件五、生产者六、消费者一、Kaf

Java访问修饰符public、private、protected及默认访问权限详解

《Java访问修饰符public、private、protected及默认访问权限详解》:本文主要介绍Java访问修饰符public、private、protected及默认访问权限的相关资料,每... 目录前言1. public 访问修饰符特点:示例:适用场景:2. private 访问修饰符特点:示例:

详解Java如何向http/https接口发出请求

《详解Java如何向http/https接口发出请求》这篇文章主要为大家详细介绍了Java如何实现向http/https接口发出请求,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 用Java发送web请求所用到的包都在java.net下,在具体使用时可以用如下代码,你可以把它封装成一

关于@MapperScan和@ComponentScan的使用问题

《关于@MapperScan和@ComponentScan的使用问题》文章介绍了在使用`@MapperScan`和`@ComponentScan`时可能会遇到的包扫描冲突问题,并提供了解决方法,同时,... 目录@MapperScan和@ComponentScan的使用问题报错如下原因解决办法课外拓展总结@

MybatisGenerator文件生成不出对应文件的问题

《MybatisGenerator文件生成不出对应文件的问题》本文介绍了使用MybatisGenerator生成文件时遇到的问题及解决方法,主要步骤包括检查目标表是否存在、是否能连接到数据库、配置生成... 目录MyBATisGenerator 文件生成不出对应文件先在项目结构里引入“targetProje

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J