#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑

本文主要是介绍#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

"#未知编码的字符串".startsWith("#")为什么会是false?

我都这么命名标题了，那么问题很显然，编码不统一导致。

发现这个问题的背景：

我在获取别人的t配置信息（txt文件）时，如果遇到以“#”开头，则说明是注释信息。但是我在用.startsWith("#")去判断时，居然出现这样的情况：

一开始以为是“#”需要转义，尝试转义却途劳；然后一想，会不会是编码问题呢？一看txt文件的编码UTF-8-BOM，而我工程默认UTF-8编码，原来坑在这里。

举个例子：

public static void testString() throws UnsupportedEncodingException{String str1 = new String("#函购同虹款式f".getBytes(),"UTF-8");String str2 = new String("#函购同虹款式f".getBytes(),"GBK");String str3 = new String("#函购同虹款式f".getBytes(),"ISO-8859-1");String str4 = new String("#函购同虹款式f".getBytes(),"UTF-16");String str5 = new String("#函购同虹款式f".getBytes(),"GB2312");String str6 = new String("#函购同虹款式f".getBytes(),"Unicode");System.out.println(str1+"--UTF-8: " + str1.startsWith("#"));System.out.println(str2+"--GBK: " + str2.startsWith("#"));System.out.println(str3+"--ISO-8859-1: " + str3.startsWith("#"));System.out.println(str4+"--UTF-16: " + str4.startsWith("#"));System.out.println(str5+"--GB2312: " + str5.startsWith("#"));System.out.println(str6+"--Unicode: " + str6.startsWith("#"));}

输出结果为：