#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑

2024-05-08 17:58

本文主要是介绍#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

"#未知编码的字符串".startsWith("#")为什么会是false?

我都这么命名标题了,那么问题很显然,编码不统一导致

 

发现这个问题的背景:

      我在获取别人的t配置信息(txt文件)时,如果遇到以“#”开头,则说明是注释信息。但是我在用.startsWith("#")去判断时,居然出现这样的情况:

      一开始以为是“#”需要转义,尝试转义却途劳;然后一想,会不会是编码问题呢?一看txt文件的编码UTF-8-BOM,而我工程默认UTF-8编码,原来坑在这里。

举个例子:

public static void testString() throws UnsupportedEncodingException{String str1 = new String("#函购同虹款式f".getBytes(),"UTF-8");String str2 = new String("#函购同虹款式f".getBytes(),"GBK");String str3 = new String("#函购同虹款式f".getBytes(),"ISO-8859-1");String str4 = new String("#函购同虹款式f".getBytes(),"UTF-16");String str5 = new String("#函购同虹款式f".getBytes(),"GB2312");String str6 = new String("#函购同虹款式f".getBytes(),"Unicode");System.out.println(str1+"--UTF-8: " + str1.startsWith("#"));System.out.println(str2+"--GBK: " + str2.startsWith("#"));System.out.println(str3+"--ISO-8859-1: " + str3.startsWith("#"));System.out.println(str4+"--UTF-16: " + str4.startsWith("#"));System.out.println(str5+"--GB2312: " + str5.startsWith("#"));System.out.println(str6+"--Unicode: " + str6.startsWith("#"));}

输出结果为:

结论:

      从输入流中读取的字符串,需要首先判断其编码是否和自己编译文件的编码格式相同,否则很容易出现乱码或是执行一些操作得不到你想要的效果。

        我写了一点判断字符串编码格式的代码(注意:仅适用于UTF-8的编译环境下,即Java文件使用UTF-8编码)。

        请看这篇文章>>>>

这篇关于#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/971026

相关文章

python中字符串拼接的几种方法及优缺点对比详解

《python中字符串拼接的几种方法及优缺点对比详解》在Python中,字符串拼接是常见的操作,Python提供了多种方法来拼接字符串,每种方法有其优缺点和适用场景,以下是几种常见的字符串拼接方法,需... 目录1. 使用 + 运算符示例:优缺点:2. 使用&nbsjsp;join() 方法示例:优缺点:3

java字符串数字补齐位数详解

《java字符串数字补齐位数详解》:本文主要介绍java字符串数字补齐位数,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java字符串数字补齐位数一、使用String.format()方法二、Apache Commons Lang库方法三、Java 11+的St

C++字符串提取和分割的多种方法

《C++字符串提取和分割的多种方法》在C++编程中,字符串处理是一个常见的任务,尤其是在需要从字符串中提取特定数据时,本文将详细探讨如何使用C++标准库中的工具来提取和分割字符串,并分析不同方法的适用... 目录1. 字符串提取的基本方法1.1 使用 std::istringstream 和 >> 操作符示

Java使用多线程处理未知任务数的方案介绍

《Java使用多线程处理未知任务数的方案介绍》这篇文章主要为大家详细介绍了Java如何使用多线程实现处理未知任务数,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 知道任务个数,你可以定义好线程数规则,生成线程数去跑代码说明:1.虚拟线程池:使用 Executors.newVir

C语言字符函数和字符串函数示例详解

《C语言字符函数和字符串函数示例详解》本文详细介绍了C语言中字符分类函数、字符转换函数及字符串操作函数的使用方法,并通过示例代码展示了如何实现这些功能,通过这些内容,读者可以深入理解并掌握C语言中的字... 目录一、字符分类函数二、字符转换函数三、strlen的使用和模拟实现3.1strlen函数3.2st

VSCode中C/C++编码乱码问题的两种解决方法

《VSCode中C/C++编码乱码问题的两种解决方法》在中国地区,Windows系统中的cmd和PowerShell默认编码是GBK,但VSCode默认使用UTF-8编码,这种编码不一致会导致在VSC... 目录问题方法一:通过 Code Runner 插件调整编码配置步骤方法二:在 PowerShell

Java反转字符串的五种方法总结

《Java反转字符串的五种方法总结》:本文主要介绍五种在Java中反转字符串的方法,包括使用StringBuilder的reverse()方法、字符数组、自定义StringBuilder方法、直接... 目录前言方法一:使用StringBuilder的reverse()方法方法二:使用字符数组方法三:使用自

Golang中拼接字符串的6种方式性能对比

《Golang中拼接字符串的6种方式性能对比》golang的string类型是不可修改的,对于拼接字符串来说,本质上还是创建一个新的对象将数据放进去,主要有6种拼接方式,下面小编就来为大家详细讲讲吧... 目录拼接方式介绍性能对比测试代码测试结果源码分析golang的string类型是不可修改的,对于拼接字

Python如何实现读取csv文件时忽略文件的编码格式

《Python如何实现读取csv文件时忽略文件的编码格式》我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍我们再日常读取csv文件的时候经常

Java对象和JSON字符串之间的转换方法(全网最清晰)

《Java对象和JSON字符串之间的转换方法(全网最清晰)》:本文主要介绍如何在Java中使用Jackson库将对象转换为JSON字符串,并提供了一个简单的工具类示例,该工具类支持基本的转换功能,... 目录前言1. 引入 Jackson 依赖2. 创建 jsON 工具类3. 使用示例转换 Java 对象为