#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑

2024-05-08 17:58

本文主要是介绍#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

"#未知编码的字符串".startsWith("#")为什么会是false?

我都这么命名标题了,那么问题很显然,编码不统一导致

 

发现这个问题的背景:

      我在获取别人的t配置信息(txt文件)时,如果遇到以“#”开头,则说明是注释信息。但是我在用.startsWith("#")去判断时,居然出现这样的情况:

      一开始以为是“#”需要转义,尝试转义却途劳;然后一想,会不会是编码问题呢?一看txt文件的编码UTF-8-BOM,而我工程默认UTF-8编码,原来坑在这里。

举个例子:

public static void testString() throws UnsupportedEncodingException{String str1 = new String("#函购同虹款式f".getBytes(),"UTF-8");String str2 = new String("#函购同虹款式f".getBytes(),"GBK");String str3 = new String("#函购同虹款式f".getBytes(),"ISO-8859-1");String str4 = new String("#函购同虹款式f".getBytes(),"UTF-16");String str5 = new String("#函购同虹款式f".getBytes(),"GB2312");String str6 = new String("#函购同虹款式f".getBytes(),"Unicode");System.out.println(str1+"--UTF-8: " + str1.startsWith("#"));System.out.println(str2+"--GBK: " + str2.startsWith("#"));System.out.println(str3+"--ISO-8859-1: " + str3.startsWith("#"));System.out.println(str4+"--UTF-16: " + str4.startsWith("#"));System.out.println(str5+"--GB2312: " + str5.startsWith("#"));System.out.println(str6+"--Unicode: " + str6.startsWith("#"));}

输出结果为:

结论:

      从输入流中读取的字符串,需要首先判断其编码是否和自己编译文件的编码格式相同,否则很容易出现乱码或是执行一些操作得不到你想要的效果。

        我写了一点判断字符串编码格式的代码(注意:仅适用于UTF-8的编译环境下,即Java文件使用UTF-8编码)。

        请看这篇文章>>>>

这篇关于#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/971026

相关文章

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

IDEA编译报错“java: 常量字符串过长”的原因及解决方法

《IDEA编译报错“java:常量字符串过长”的原因及解决方法》今天在开发过程中,由于尝试将一个文件的Base64字符串设置为常量,结果导致IDEA编译的时候出现了如下报错java:常量字符串过长,... 目录一、问题描述二、问题原因2.1 理论角度2.2 源码角度三、解决方案解决方案①:StringBui

C#从XmlDocument提取完整字符串的方法

《C#从XmlDocument提取完整字符串的方法》文章介绍了两种生成格式化XML字符串的方法,方法一使用`XmlDocument`的`OuterXml`属性,但输出的XML字符串不带格式,可读性差,... 方法1:通过XMLDocument的OuterXml属性,见XmlDocument类该方法获得的xm

JSON字符串转成java的Map对象详细步骤

《JSON字符串转成java的Map对象详细步骤》:本文主要介绍如何将JSON字符串转换为Java对象的步骤,包括定义Element类、使用Jackson库解析JSON和添加依赖,文中通过代码介绍... 目录步骤 1: 定义 Element 类步骤 2: 使用 Jackson 库解析 jsON步骤 3: 添

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

python修改字符串值的三种方法

《python修改字符串值的三种方法》本文主要介绍了python修改字符串值的三种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学... 目录第一种方法:第二种方法:第三种方法:在python中,字符串对象是不可变类型,所以我们没办法直接

JAVA中整型数组、字符串数组、整型数和字符串 的创建与转换的方法

《JAVA中整型数组、字符串数组、整型数和字符串的创建与转换的方法》本文介绍了Java中字符串、字符数组和整型数组的创建方法,以及它们之间的转换方法,还详细讲解了字符串中的一些常用方法,如index... 目录一、字符串、字符数组和整型数组的创建1、字符串的创建方法1.1 通过引用字符数组来创建字符串1.2

C#中字符串分割的多种方式

《C#中字符串分割的多种方式》在C#编程语言中,字符串处理是日常开发中不可或缺的一部分,字符串分割是处理文本数据时常用的操作,它允许我们将一个长字符串分解成多个子字符串,本文给大家介绍了C#中字符串分... 目录1. 使用 string.Split2. 使用正则表达式 (Regex.Split)3. 使用

Java中JSON字符串反序列化(动态泛型)

《Java中JSON字符串反序列化(动态泛型)》文章讨论了在定时任务中使用反射调用目标对象时处理动态参数的问题,通过将方法参数存储为JSON字符串并进行反序列化,可以实现动态调用,然而,这种方式容易导... 需求:定时任务扫描,反射调用目标对象,但是,方法的传参不是固定的。方案一:将方法参数存成jsON字

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目: 题解: class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &