本文主要是介绍Unity使用LitJson解析报错:JsonException: Invalid character ‘‘ in input string,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Unity使用LitJson解析报错:JsonException: Invalid character '' in input string
- 报错现象
- 解决
- 代码
- UTF-8与UTF-8 BOM
- 一、一个汉字在不同的编码方式中占多少字节?
- 二、UTF-8与UTF-8 BOM
- 三、创建UTF-8(而非UTF-8 BOM)文件的方法
- 参考文档
报错现象
我在Unity中使用LitJson.dll解析json文件,报如下错误:
JsonException: Invalid character ‘’ in input string
LitJson.Lexer.NextToken () (at :0)
LitJson.JsonReader.ReadToken () (at :0)
LitJson.JsonReader.Read () (at :0)
LitJson.JsonMapper.ReadValue (System.Type inst_type, LitJson.JsonReader reader) (at :0)
LitJson.JsonMapper.ToObject[T] (System.String json) (at :0)
ZM_Code.LitJsonDataManager`2+d__7[S,T].MoveNext () (at Assets/Scripts/ZM_Code/Data/LitJson/Base/LitJsonDataManager.cs:48)
UnityEngine.SetupCoroutine.InvokeMoveNext (System.Collections.IEnumerator enumerator, System.IntPtr returnValueAddress) (at D:/unity/Runtime/Export/Coroutines.cs:17)
如下图:
经过资料查找,是因为文件中某个字符无法解析所致。
可是,反复查看文件,还是找不到有哪里是错的。文件数据如下:
[{“member”:[16,17,18,19,20,21,22,45]},{“member”:[37,38,39,40,41,42,43,44]},{“member”:[34,35,36]},{“member”:[23,24,25,26,27,28,29,30,31,32,33]},{“member”:[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]},{“member”:[46,47,48,49,50,51,52,53]}]
而且错误中显示字符是一个非常小的“空格”,这就更加莫名奇妙了。
解决
为了使用方便快捷,我使用的json文件是使用在线的json编辑器生成的。点击文字链接可直接进入该编辑器页面。然而我决定将生成的json文件另存为或手动生成一份,这时发现,自动生成的json文件并不是普通的UTF-8编码的json文件。如下图所示,
是一种叫带有BOM的UTF-8编码格式。我便将文件另存为一般情况下的UTF-8的格式。如下图
结果经过测试,该问题真的解决了。
代码
这是之后关于文本保存时,编码格式的设置。
一般情况下使用File.WriteAllText(m_path, json, Encoding.UTF8);
保存文件,其中Encoding.UTF8
表示的是带有BOM的UTF-8,这样保存的文件,在使用JsonMapper.ToObject
解析时,还是会报上面的错误。
所以,在保存文件时Encoding.UTF8
需要改一下:
UTF8Encoding m_utf8 = new UTF8Encoding(false);
File.WriteAllText(m_path, json, m_utf8);
这样保存下来的文件就是一般的UTF-8编码的了。
UTF-8与UTF-8 BOM
下面是我找的一些简介,简单记录一下。这方面深入不多,太复杂的也一时半会儿理解不了,有兴趣的可以去了解一下。
在我们通常使用的windows系统中,我发现了一个有趣的现象。我新建一个空的文本文档,点击文件-另存为-编码选择UTF-8,然后保存。此时这个文件明明是空的,却占了3字节大小。原因在于:此时保存的编码方式自动会变为UTF-8 BOM。
一、一个汉字在不同的编码方式中占多少字节?
- 在UTF-8中,一个汉字占3个字节(一个字符占一个字节)
- 在ASCII码中,一个汉字占2个字节(一个字符占一个字节)
- 在Unicode编码中,一个汉字占2个字节(一个字符同样占两个字节,所以JAVA中
char a = '中';
是可以的)
二、UTF-8与UTF-8 BOM
BOM即byte order mark,字节顺序标记,出现在文本文件头部,Unicode编码标准中用于标识文件是采用哪种格式的编码。具体含义可百度百科或维基百科。UTF-8文件中放置BOM主要是微软的习惯,但是放在别的系统上会出现问题。
不含BOM的UTF-8才是标准形式,UTF-8不需要BOM。
带BOM的UTF-8文件的开头会有U+FEFF,所以我新建的空文件会有3字节的大小。
三、创建UTF-8(而非UTF-8 BOM)文件的方法
在发现文件另存为UTF-8缺得到UTF-8 BOM文件后,我们怎样才能得到UTF-8呢?
有一种方法是:先另存为UTF-8保存,再使用notepad++打开,把里面的编码设置为无BOM的UTF-8然后保存。(此方法治标不治本,因为当你再次在里面写汉字时,文件会自动变成UTF-8 BOM)
参考文档
- https://blog.csdn.net/LegendaryHsl/article/details/78794121
- https://baike.baidu.com/item/BOM/2790364?fr=aladdin
这篇关于Unity使用LitJson解析报错:JsonException: Invalid character ‘‘ in input string的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!