模板引擎:二、实现一个Json解析器

2024-09-01 19:32

本文主要是介绍模板引擎:二、实现一个Json解析器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2.Js实现Json解析器

前言

本文主要对Json解析器的实现进行探讨。
如果想深入了解其原理,可以参考上一篇文章:模板引擎:一、理解Json解析器工作原理

项目github地址:https://github.com/yang657850144/parseJson

案例说明

例如:拿一段最简单的Json字符串举例(“{ “a”: 1 }”),要将其解析为JSON对象。

我们先将其进行拆分取出字符串中的特征值(Token),我们可以得到下面七个Token:

    // 以逗号','进行分割", {, "a", :, 1, }, "

然后,通过我们之前定义的数据结构进行匹配:

  • {},以一对大括号包裹的定义为一个对象,并且对象结构是以key-value形式进行存储
  • “”, 以一对双引号包裹的定义为字符串
  • 1, 定义为数值类型

这样,我们就识别出了我们想要的数据结构

{"a": 1
}

思路

通过上面的举例,对Json解析器应该有了基本的理解。
但是,罗马不是一天建成的。接下来我们将逐步完善Json解析器

识别关键字

下面再通过一段代码进行说明,先实现一个简单的关键字解析器


// 定义关键字(Token)
const ENUM = {_TRUE: true,_FALSE: false,_NULL: null,_UNDEFINED: undefined
}let at = 0 // 当前字符所在的下标
let ch = '' // 当前字符let text = '' // 定义一个字符串对象/** * 定义一个字符扫描器 * params: char 传入的为当前扫描的字段* return: 返回当前扫描(at)的一个字符(ch)**/
const getCharAt = (char) => {if(char && char !== ch) {console.error(`当前字符读取错误: ${ch},错误位置: ${at}`)return}ch = text.charAt(at) // 读取当前字符at++ // 指针后移一位return ch
}/*** 关键字扫描器* 功能描述:*   可识别字段(true,false,null,undefined)**/
const keyword = () => {// 通过首字母进行识别switch(ch) {case 't':getCharAt('t')getCharAt('u')getCharAt('r')getCharAt('e')return ENUM._TRUEcase 'f':getCharAt('f')getCharAt('a')getCharAt('l')getCharAt('s')getCharAt('e')return ENUM._FALSEcase 'n':getCharAt('n')getCharAt('u')getCharAt('l')getCharAt('l')return ENUM._NULLcase 'u':getCharAt('u')getCharAt('n')getCharAt('d')getCharAt('e')getCharAt('f')getCharAt('i')getCharAt('n')getCharAt('e')getCharAt('d')return ENUM._UNDEFINED}
}/** * 源字符串* 测试用例: 'true','false','null','undefined'  **/
text = 'null'
// 调用关键字解析器
keyword() // 输出: null

通过上面的关键字解析器,我们可以从源字符串中识别出基本的几个关键字
但是,这个解析器有一个缺陷,它只能精确识别诸如'false'、'null'等无空格的字符串

如果字符串中包含有多个空格(’  null’, ‘      false’),那么我们的解析器就会失效了。

那么,解决的思路有两种

第一种,通过正则匹配,将字符串中的空格进行过滤(str.replace(reg,''))
特点: 高效实用
另一种,实现过滤函数,如果当前字符是空格的话,跳过该字符,指针后移一位(at++)
特点:容易理解

我们通过第二种方式进行讲解

// 接上面的代码
...// 定义一个过滤函数
const filter = () => {while(ch & ch === ' ') {getCharAt()  // 如果当前字符为空格,指针后移一位 at++ }
}/** * 源字符串* 测试用例: '   true','   false','  null','  undefined'  **/
text = '   null'
// 调用过滤函数
filter()
// 调用关键字解析器
keyword() // 输出: null

看到这里,一个简单的关键字解析器已经完成了。是不是有点小激动呢,哈哈,下面我们将慢慢考虑识别更多的数据结构了。

识别数值类型

数值类型的定义:

  • 正数
    • 整型
    • 浮点型
    • 指数型
  • 负数
    • 同上

考虑到篇幅有限,我们暂且只处理整型和浮点型的数值。

/*** 数值类型判断* **/
const number = () => {let str// 识别整型 while(ch && ch >= '0' && ch <= '9') {str += chnext()}// 识别浮点型if(ch === '.') {str += '.'next('.')while(next() && ch >= '0' && ch <= '9') {str += ch   }}return +str // 转换为数值型}/** * 源字符串* 测试用例: '   1','   1.2','  12.34','1234'  **/
text = '  1.2'
// 调用过滤函数
filter()
// 调用数值解析器
number() // 输出: 1.2

我们已经可以识别基本的数字类型了。

不过,下面有种情况,他们也属于数值类型,但是解析器无法识别

+1
+1.2
-1
-1.2

不难看出,我们少了数值符号的判断逻辑。因此,我们添加下面的符号条件判断

/*** 数值符号* return 调用匹配的数值类型,并将符号传入**/
const symbol = () => {if(ch === '+' || ch === '-') {let sym = ch // 识别以'+'、'-'起始的字符next(ch) // 指针后移if(ch && ch >= '0' && ch <= '9' ) {return number(sym) // 进入数值类型判断}}
}

然后我们再重构我们的number函数

const number = (sym = '') => {// 逻辑不变...return sym + (+str)}

通过修改,我们又可以匹配诸如下面几种有符号的数值类型了。

+1
+1.2
-1
-1.2

不过,number函数还是有一个Bug。

如果,输入 1.2abc 或者1a2b 这类不合法的数值类型,我们必须对这种情况进行异常处理。

继续重构我们的number函数

const number = () => {// 同上...// return str + (+val)if(!isFinite(val)) {console.error(`无效的数值类型:${val}`)} else {return str + (+val)}}

这样,我们的Number函数就比较完善了。

识别字符串类型

字符串定义,以一对”“包含的类型。

/***  字符串类型定义*  return 返回一个字符串**/const string = () => {let str// " 起始if(ch === '"') {// 过滤空格filter()next('"')while(next()) {// “ 结尾if(ch === '"') {next('"')return str} else {            str += ch}}}console.error(`无效字符串:${str},位置:${at}`)/** * 源字符串* 测试用例: '"1"','"1a"','"   key"','"  1a."'  **/
text = '"   key"'
// 调用过滤函数
filter()
// 调用数值解析器
string() // 输出: "key"
}

好了,到这里基本数据类型讲解完毕。我们将这三种数据类型整合到一个函数(getValue)中


const getValue = () => {filter()switch(ch) {case '"':return string()case '+':case '-':return symbol()case '[':return array()case '{':return object()default:return (ch && ch >='0' && ch <='9') ? number() : keyword()}}

然后我们开始难度升级,对复合类型的处理(对象、数组)

识别数组

定义:以一对[]包裹,并以‘,’进行分割的数据类型。


const array = () => {let arr = []// 以 [ 起始if(ch && ch === '[') {next('[')filter() // 过滤空格// 识别为空数组if(ch && ch === ']') {return arr}while(next()) {// 递归arr.push(getValue())if(ch === ']') {return arr}filter()// 以 , 将值进行分割if(ch === ',') {next(',')}}}
}

数组匹配的难度在于递归的思想,去遍历数组中的各种数据类型。这也是处理复合类型的统一方法。

识别对象

与数组的判断方式类型,关键区别在于对象的数据格式是以”key-value形式存储”。
而key则必须为一个基本数据类型,本文暂定为字符串类型。

const object = () => {let obj = {}if(ch && ch === '{') {next('{')filter()//  空对象if(ch && ch === '}') {return obj}while(next()) {// 对象的key,类型为字符串let key = string()filter()if(ch && ch === ':') {next(':')if(Object.hasOwnProperty.call(obj,key)) {console.error(`对象关键字重复:${key}`)}// 递归获取对象的valueobj[key] = value()filter()if(ch && ch ==='}') {next('}')return obj}// 以 , 将key-value进行分割if(ch && ch === ',') {next(',')}}}}}

这样,我们的基本Json对象就介绍完毕。

待改进部分

我们这个解析器对数值类型的判断还是不够准确。例如:2e10指数类型没有正确识别。
以及,\t\n 转义字符也未作处理。如果有兴趣,可以继续深入研究下去。谢谢!

可以参考下面的源码进行对比学习

本文github项目地址:https://github.com/yang657850144/parseJson

这里写图片描述

这篇关于模板引擎:二、实现一个Json解析器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1127838

相关文章

MySQL双主搭建+keepalived高可用的实现

《MySQL双主搭建+keepalived高可用的实现》本文主要介绍了MySQL双主搭建+keepalived高可用的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、测试环境准备二、主从搭建1.创建复制用户2.创建复制关系3.开启复制,确认复制是否成功4.同

Java实现文件图片的预览和下载功能

《Java实现文件图片的预览和下载功能》这篇文章主要为大家详细介绍了如何使用Java实现文件图片的预览和下载功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... Java实现文件(图片)的预览和下载 @ApiOperation("访问文件") @GetMapping("

使用Sentinel自定义返回和实现区分来源方式

《使用Sentinel自定义返回和实现区分来源方式》:本文主要介绍使用Sentinel自定义返回和实现区分来源方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Sentinel自定义返回和实现区分来源1. 自定义错误返回2. 实现区分来源总结Sentinel自定

JSON Web Token在登陆中的使用过程

《JSONWebToken在登陆中的使用过程》:本文主要介绍JSONWebToken在登陆中的使用过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录JWT 介绍微服务架构中的 JWT 使用结合微服务网关的 JWT 验证1. 用户登录,生成 JWT2. 自定义过滤

Java实现时间与字符串互相转换详解

《Java实现时间与字符串互相转换详解》这篇文章主要为大家详细介绍了Java中实现时间与字符串互相转换的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、日期格式化为字符串(一)使用预定义格式(二)自定义格式二、字符串解析为日期(一)解析ISO格式字符串(二)解析自定义

opencv图像处理之指纹验证的实现

《opencv图像处理之指纹验证的实现》本文主要介绍了opencv图像处理之指纹验证的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录一、简介二、具体案例实现1. 图像显示函数2. 指纹验证函数3. 主函数4、运行结果三、总结一、

Springboot处理跨域的实现方式(附Demo)

《Springboot处理跨域的实现方式(附Demo)》:本文主要介绍Springboot处理跨域的实现方式(附Demo),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录Springboot处理跨域的方式1. 基本知识2. @CrossOrigin3. 全局跨域设置4.

Spring Boot 3.4.3 基于 Spring WebFlux 实现 SSE 功能(代码示例)

《SpringBoot3.4.3基于SpringWebFlux实现SSE功能(代码示例)》SpringBoot3.4.3结合SpringWebFlux实现SSE功能,为实时数据推送提供... 目录1. SSE 简介1.1 什么是 SSE?1.2 SSE 的优点1.3 适用场景2. Spring WebFlu

基于SpringBoot实现文件秒传功能

《基于SpringBoot实现文件秒传功能》在开发Web应用时,文件上传是一个常见需求,然而,当用户需要上传大文件或相同文件多次时,会造成带宽浪费和服务器存储冗余,此时可以使用文件秒传技术通过识别重复... 目录前言文件秒传原理代码实现1. 创建项目基础结构2. 创建上传存储代码3. 创建Result类4.

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4