自制Monkey语言编译器:解释执行return语句和错误处理控制

本文主要是介绍自制Monkey语言编译器:解释执行return语句和错误处理控制,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在高级编程语言中,大多含有一个指令叫return,也就是程序的执行指令流遇到该语句后不再往下执行,而是返回上一层,如果return后面附带数据的话,程序会把数据夹带到调用栈上一层的代码执行路径。本节我们就给Monkey语言编译器增加解释执行return语句的功能,完成本节代码后,编译器能解释执行如下代码:

这里写图片描述

代码中存在两个if 间套,内层if执行return语句附带返回整数10,外层if 最后执行return语句附带放回数值1,根据代码逻辑,最后一条语句也就是return 1;不会被编译器所执行,编译器会把内层if里面的return语句执行后,把整形10返回给最外层,完成本节代码后,编译器对上面代码解释执行的结果如下:

这里写图片描述

从运行结果看,编译器解释执行了一系列if条件判断语句后,将内层if语句块包含的return语句执行了,并没有执行外层if语句块包含的return语句,所以在控制台输出上显示出编译器将数值10返回给最外层。接下来我们看看代码的实现。

我们现在代码中添加return 返回值对应的符号对象:


//change 1
class ReturnValues extends BaseObject {constructor(props) {super(props)this.valueObject = props.value}type () {return this.RETURN_VALUE_OBJECT}inspect() {this.msg = "return with : " + this.valueObject.inspect()return this.msg}
}

上面实现的符号对象,主要功能就是把return后面的数值或变量包裹在类ReturnValues中。接着我们在解释执行的主函数中添加对return语句的专门处理分支:

class MonkeyEvaluator {eval (node) {var props = {}switch (node.type) {...//change 2 case "ReturnStatement":var props = {}props.value = this.eval(node.expression)// change 12if (this.isError(props.value)) {return props.value}var obj =  new ReturnValues(props)console.log(obj.inspect())return obj...}...}

当语法解析器解析到return语句时,会构造一个类型为”RetturnStatement”的语法树节点,我们在解释执行函数中,如果发现该节点被传入,那么就进入对应执行分支。在return语句后面很可能是一个复杂的运算表达式,所以代码先递归调用eval解释执行return后面的语句以便获得要返回的数据对象,接着把该数据对象封装在前面设计的ReturnValues符号对象里。

在上一节,我们增加了一个函数evalStatements用来解释执行if语句块,其内容如下:

evalStatements(node) {var result = nullfor (var i = 0; i < node.statements.length; i++) {result = this.eval(node.statements[i])if (result.type() == result.RETURN_VALUE_OBJECT|| result.type() == result.ERROR_OBJ) { // change 3return result}}return result}

使用上面的函数去解释本文最开始给出的if间套语句会有问题,因为上面代码的执行方式是把if语句块里面的每条代码都解释执行一遍,然后把最后一条语句解释执行的结果返回给上一层,这样的话编译器在解释执行开头给出的代码时,它会解释执行最外层if语句块最后一条语句后才停止,于是使用上面代码解释执行if语句块就会造成错误,因为根据逻辑,语句“return 1;”是不应该被执行的。我们要修改代码处理这个问题,在MonkeyCompilerIDE.js中修改代码如下:

onLexingClick () {this.lexer = new MonkeyLexer(this.inputInstance.getContent())this.parser = new MonkeyCompilerParser(this.lexer)this.parser.parseProgram()this.program = this.parser.program/*for (var i = 0; i < this.program.statements.length; i++) {console.log(this.program.statements[i].getLiteral())this.evaluator.eval(this.program.statements[i])}*/// change 4this.evaluator.eval(this.program)}

我们把语法解析后形成的语法树根节点,也就是Program对象直接传入解释器的eval函数,在MonkeyCompilerParser.js中也做一些相应修改:

class Program {constructor () {this.statements = []// change 3this.type = "program"}getLiteral() {if (this.statements.length > 0) {return this.statements[0].tokenLiteral()} else {return ""}}
}

回到MonkeyEvaluator.js中,我们在eval函数中添加对应处理代码:

eval (node) {var props = {}switch (node.type) { //change 5case "program":return this.evalProgram(node)...}...
}
.... //change 5  // change 3 in MonkeyCompilerParser.js // change 4 in MonkeyCompilerIDE.jsevalProgram (program) {var result = nullfor (var i = 0; i < program.statements.length; i++) {result = this.eval(program.statements[i])if (result.type() == result.RETURN_VALUE_OBJECT) {return result.valueObject}if (result.type() == result.NULL_OBJ) {return result} // change 10if (result.type = result.ERROR_OBJ) {console.log(result.msg)return result}} return result}

evalProgram的逻辑跟evalStatement的逻辑其实是一样的,就是把语法树节当前点中的所有子节点进行解释执行,这么修改之后,我们就能处理前面说的if语句间套中包含return指令的问题,至于其中的详细原理,点击如下链接,查看视频讲解和代码调试演示:更详细的讲解和代码调试演示过程,请点击链接。

完成上面代码之后,编译器就能正确的解释执行return语句了,更详细的讲解和代码调试演示,请参看上头给出的视频链接。接下来我们要为编译器添加错误处理信息。所谓错误处理是指用户在编程时,使用了错误的数理逻辑,例如下面这样:

这里写图片描述

上述代码把一个整形和一个布尔型数据相加,这在逻辑上走不通,因此在编译器看来是一种逻辑错误,当出现这种错误是,编译器就得报错,并停止继续往下执行代码。接下来我们就为此添加错误处理功能,在MonkeyEvaluator.js中添加如下代码:

// change 6newError(msg) {var props = {}props.errMsg = msgreturn new Error(props)}

msg表示的是错误消息字符串,上面函数把它封装到一个名为Error的符号对象里,我们看看其定义实现:

class Error extends BaseObject {constructor(props) {super(props)this.msg = props.errMsg}type () {return this.ERROR_OBJ}inspect () {return this.msg}
}

错误符号对象原理很简单,它就是封装了一条错误信息字符串msg以便给编译器在合适的时候显示出来。接着我们在合适的地方检测类型匹配错误,首先是在解释执行中序表达式时,添加代码如下:

evalInfixExpression(operator, left, right) {//change 7if (left.type() != right.type()) {return  this.newError("type mismatch: " +left.type() + " and " + right.type())}...
//change 8return  this.newError("unknown operator: "+ operator)
}

前面例子中出错的语句”5+true”就是中序表达式,该函数在解释执行表达式前,先检测运算符两边的数据类型是否一致,如果不一致的话,调用newError函数构造一个Error对象后直接返回,不再继续往下执行。或者在中序表达式中,编译器遇到了识别不了的运算符,那么它也会构造一个错误对象返回。

如果代码在对两个整形数据进行运算时,使用了编译器无法识别的运算符,那么编译器也会构造一个错误对象返回:

evalIntegerInfixExpression(operator, left, right) {....switch (operator) {....default:// change 9return this.newError("unknown operator for Integer")}....
}

在取负操作时,如果减号后面跟着的不是整形,那么编译器也报错,例如”-true”,这种代码是错误的,因此修改如下:

evalMinusPrefixOperatorExpression(right) {if (right.type() !== right.INTEGER_OBJ) { // change 8return new this.newError("unknown operaotr:- ", right.type())}....
}

在evalProgram函数中,它会把所有子节点就像解释执行,但如果在执行中间遇到错误时,那么就必须终止执行流程,于是在该函数中也要进行相应修改:

evalProgram (program) {var result = nullfor (var i = 0; i < program.statements.length; i++) {...// change 10if (result.type = result.ERROR_OBJ) {console.log(result.msg)return result}
}

我们添加一个函数用于判断,eval函数在解释执行对应的语法树节点后,返回的是否是一个错误对象:

    // change 11isError(obj) {if (obj != null) {return obj.type() == obj.ERROR_OBJ}return false}

在不少地方,例如return后面的表达式,if括号里面的条件判断表达式,他们在解释执行时都可能产生错误,因此我们需要在相应的位置进行监控:

eval(node){....switch (node.type) {....case "PrefixExpression":...// change 13if (this.isError(right)) {return right}...case "InfixExpression":var left = this.eval(node.left)// change 14if (this.isError(left)) {return left}var right = this.eval(node.right)//change 15if (this.isError(right)) {return right}case "ReturnStatement":....// change 12if (this.isError(props.value)) {return props.value}....    
}

上面代码在处理return语句时,检测return后面跟着的表达式被编译器解释执行后是否出错,如果出错则把错误对象返回。在解释执行前置表达式时,编译器检测运算符后面的表达式在解释执行时是否正常,如果出错则直接将错误返回。

接下来则是在if语句的解释执行部分进行错误检测:

evalIfExpression(ifNode) {console.log("begin to eval if statment")var condition = this.eval(ifNode.condition)// change 16if (this.isError(condition)) {return condition}....
}

代码在执行if语句块前,先判断if括号里的条件表达式在解释执行时是否正常,如果有错就不再往下执行,完成上面代码后,编译器就基本建立了语法上的错误检测机制。

更详细的讲解和代码调试演示过程,请点击链接

更多技术信息,包括操作系统,编译器,面试算法,机器学习,人工智能,请关照我的公众号:
这里写图片描述

这篇关于自制Monkey语言编译器:解释执行return语句和错误处理控制的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/950068

相关文章

C语言中联合体union的使用

本文编辑整理自: http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=179471 一、前言 “联合体”(union)与“结构体”(struct)有一些相似之处。但两者有本质上的不同。在结构体中,各成员有各自的内存空间, 一个结构变量的总长度是各成员长度之和。而在“联合”中,各成员共享一段内存空间, 一个联合变量

大语言模型(LLMs)能够进行推理和规划吗?

大语言模型(LLMs),基本上是经过强化训练的 n-gram 模型,它们在网络规模的语言语料库(实际上,可以说是我们文明的知识库)上进行了训练,展现出了一种超乎预期的语言行为,引发了我们的广泛关注。从训练和操作的角度来看,LLMs 可以被认为是一种巨大的、非真实的记忆库,相当于为我们所有人提供了一个外部的系统 1(见图 1)。然而,它们表面上的多功能性让许多研究者好奇,这些模型是否也能在通常需要系

自制的浏览器主页,可以是最简单的桌面应用,可以把它当成备忘录桌面应用

自制的浏览器主页,可以是最简单的桌面应用,可以把它当成备忘录桌面应用。如果你看不懂,请留言。 完整代码: <!DOCTYPE html><html lang="zh-CN"><head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><ti

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

C语言 将“China”译成密码

将“China”译成密码,密码规律是:用原来的字母后面的第4个字母代替原来的字母。例如,字母“A”后面的第4个字母是“E”,用“E”代替“A”。因此,“China”应译为“Glmre”。编译程序用付赋初值的方法使c1,c2,c3,c4,c5这五个变量的值分别为“C”,“h”,“i”,“n”,“a”,经过运算,使c1,c2,c3,c4,c5分别变成“G”,“l”,“m”,“r”,“e”。分别用put

Java研学-RBAC权限控制(八)

九 登录登出 1 登录作用   判断员工是否有权限访问,首先得知道现在操作的人是谁,所以必须先实现登录功能 2 登录流程   ① 提供登录页面,可输入用户名与密码信息,并添加执行登录的按钮。(登录页面不能被拦截)   ② 给按钮绑定点击事件(异步操作,POST请求)   ③ 事件中发送登录请求,使用 AJAX 方式提交。(使用 AJAX 原因:用户体验更好,既可保留用户刚输入的用户名和密码

C语言入门系列:探秘二级指针与多级指针的奇妙世界

文章目录 一,指针的回忆杀1,指针的概念2,指针的声明和赋值3,指针的使用3.1 直接给指针变量赋值3.2 通过*运算符读写指针指向的内存3.2.1 读3.2.2 写 二,二级指针详解1,定义2,示例说明3,二级指针与一级指针、普通变量的关系3.1,与一级指针的关系3.2,与普通变量的关系,示例说明 4,二级指针的常见用途5,二级指针扩展到多级指针 小结 C语言的学习之旅中,二级

Redis-在springboot环境下执行lua脚本

文章目录 1、什么lua2、创建SpringBoot工程3、引入相关依赖4、创建LUA脚本5、创建配置类6、创建启动类7、创建测试类 1、什么lua “Lua”的英文全称是“Lightweight Userdata Abstraction Layer”,意思是“轻量级用户数据抽象层”。 2、创建SpringBoot工程 3、引入相关依赖 <?xml version

【LinuxC语言】select轮询

文章目录 前言select函数详解selectfd_set类型一个小问题select函数使用步骤改进服务器代码select服务器示例代码 总结 前言 在Linux C语言编程中,我们经常需要处理多个I/O操作。然而,如果我们为每个I/O操作创建一个线程,那么当I/O操作数量增加时,线程管理将变得复杂且效率低下。这就是我们需要select轮询的地方。select是一种高效的I/

js小题:通过字符串执行同名变量怎么做

在JavaScript中,你不能直接使用一个字符串来直接引用一个变量,因为JavaScript是一种静态类型语言(尽管它的类型在运行时可以变化),变量的名字在编译时就被确定了。但是,有几种方法可以实现类似的功能: 使用对象(或Map)来存储变量: 你可以使用一个对象来存储你的变量,然后使用字符串作为键来访问这些变量。 let myVars = { 'var1': 'Hello', 'var