Unity使用LitJson解析报错：JsonException: Invalid character ‘‘ in input string

本文主要是介绍Unity使用LitJson解析报错：JsonException: Invalid character ‘‘ in input string，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Unity使用LitJson解析报错：JsonException: Invalid character '' in input string

- 报错现象
- 解决
- - 代码
- UTF-8与UTF-8 BOM
- - 一、一个汉字在不同的编码方式中占多少字节？
  - 二、UTF-8与UTF-8 BOM
  - 三、创建UTF-8（而非UTF-8 BOM）文件的方法
  - 参考文档

报错现象

我在Unity中使用LitJson.dll解析json文件，报如下错误：

JsonException: Invalid character ‘’ in input string
LitJson.Lexer.NextToken () (at :0)
LitJson.JsonReader.ReadToken () (at :0)
LitJson.JsonReader.Read () (at :0)
LitJson.JsonMapper.ReadValue (System.Type inst_type, LitJson.JsonReader reader) (at :0)
LitJson.JsonMapper.ToObject[T] (System.String json) (at :0)
ZM_Code.LitJsonDataManager`2+d__7[S,T].MoveNext () (at Assets/Scripts/ZM_Code/Data/LitJson/Base/LitJsonDataManager.cs:48)
UnityEngine.SetupCoroutine.InvokeMoveNext (System.Collections.IEnumerator enumerator, System.IntPtr returnValueAddress) (at D:/unity/Runtime/Export/Coroutines.cs:17)

如下图：

经过资料查找，是因为文件中某个字符无法解析所致。
可是，反复查看文件，还是找不到有哪里是错的。文件数据如下：

[{“member”:[16,17,18,19,20,21,22,45]},{“member”:[37,38,39,40,41,42,43,44]},{“member”:[34,35,36]},{“member”:[23,24,25,26,27,28,29,30,31,32,33]},{“member”:[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]},{“member”:[46,47,48,49,50,51,52,53]}]

而且错误中显示字符是一个非常小的“空格”，这就更加莫名奇妙了。

解决

为了使用方便快捷，我使用的json文件是使用在线的json编辑器生成的。点击文字链接可直接进入该编辑器页面。然而我决定将生成的json文件另存为或手动生成一份，这时发现，自动生成的json文件并不是普通的UTF-8编码的json文件。如下图所示，
原编码
是一种叫带有BOM的UTF-8编码格式。我便将文件另存为一般情况下的UTF-8的格式。如下图
修改编码
结果经过测试，该问题真的解决了。

代码

这是之后关于文本保存时，编码格式的设置。
一般情况下使用File.WriteAllText(m_path, json, Encoding.UTF8);保存文件，其中Encoding.UTF8表示的是带有BOM的UTF-8，这样保存的文件，在使用JsonMapper.ToObject解析时，还是会报上面的错误。
所以，在保存文件时Encoding.UTF8需要改一下：

UTF8Encoding m_utf8 = new UTF8Encoding(false);
File.WriteAllText(m_path, json, m_utf8);

这样保存下来的文件就是一般的UTF-8编码的了。

UTF-8与UTF-8 BOM

下面是我找的一些简介，简单记录一下。这方面深入不多，太复杂的也一时半会儿理解不了，有兴趣的可以去了解一下。
在我们通常使用的windows系统中，我发现了一个有趣的现象。我新建一个空的文本文档，点击文件-另存为-编码选择UTF-8，然后保存。此时这个文件明明是空的，却占了3字节大小。原因在于：此时保存的编码方式自动会变为UTF-8 BOM。

一、一个汉字在不同的编码方式中占多少字节？

在UTF-8中，一个汉字占3个字节（一个字符占一个字节）
在ASCII码中，一个汉字占2个字节（一个字符占一个字节）
在Unicode编码中，一个汉字占2个字节（一个字符同样占两个字节，所以JAVA中char a = '中';是可以的）

二、UTF-8与UTF-8 BOM

BOM即byte order mark，字节顺序标记，出现在文本文件头部，Unicode编码标准中用于标识文件是采用哪种格式的编码。具体含义可百度百科或维基百科。UTF-8文件中放置BOM主要是微软的习惯，但是放在别的系统上会出现问题。
不含BOM的UTF-8才是标准形式，UTF-8不需要BOM。
带BOM的UTF-8文件的开头会有U+FEFF，所以我新建的空文件会有3字节的大小。

三、创建UTF-8（而非UTF-8 BOM）文件的方法

在发现文件另存为UTF-8缺得到UTF-8 BOM文件后，我们怎样才能得到UTF-8呢？
有一种方法是：先另存为UTF-8保存，再使用notepad++打开，把里面的编码设置为无BOM的UTF-8然后保存。（此方法治标不治本，因为当你再次在里面写汉字时，文件会自动变成UTF-8 BOM）
方法一

参考文档

https://blog.csdn.net/LegendaryHsl/article/details/78794121
https://baike.baidu.com/item/BOM/2790364?fr=aladdin

这篇关于Unity使用LitJson解析报错：JsonException: Invalid character ‘‘ in input string的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

Unity使用LitJson解析报错：JsonException: Invalid character ‘‘ in input string

Unity使用LitJson解析报错：JsonException: Invalid character '' in input string

报错现象