尝试用GO写python编译器:创建互动式命令号窗口REPL

2024-04-30 21:48

本文主要是介绍尝试用GO写python编译器:创建互动式命令号窗口REPL,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

上一节完成的词法解析器存在一些明显问题,例如在识别数字时,面对字符串“123abc",它会识别为两者情况,分别为NUMBER:123,然后是IDENTIFIER:anc,实际上这样的字符串应该被认为是语法错误。另外我们还有一些”连号“操作符没有处理,例如“==, !=, – ,++"等。

本节我们将在上一节的基础上对词法解析器做进一步完善。首先在token.go里面添加新的操作符定义:
···
const (
ILLEGAL = “ILLEGAL”
EOF = “EOF”
IDENTIFIER = “IDENTIFIER” //变量类型对应的归类
NUMBER = “NUMBER” //数值类型对应的归类
ASSIGN = “=” //赋值操作符
PLUS = “+” //加号操作符
LPAR = “(”
RPAR = “)”
LBRACE = “{”
RBRACE = “}”
COMMA = “,”
COLON = “:”
DEF = “def” //关键字
INT = “int”
RETURN = “return”
ASSERT = “assert”
AND = “and”

//第三节添加
TRUE = "True"
FALSE = "False"
IF = "if"
ELSE = "else"
EQUAL = "=="
NOTEQUAL = "!="
GREATEREQUAL = ">="
LESSEQUAL = "<="
MINUS = "-"
BANG = "!"
ASTERISK = "*"
SLASH = "/"
LT = "<"
GT = ">"
//第三节添加

)

var keywords = map[string]TokenType {
“def” : DEF,
“int” : INT,
“return” : RETURN,
“assert” : ASSERT,
“and” : AND,
//第三节添加
“if” : IF ,
“else” : ELSE,
“True” : TRUE,
“False” : FALSE,
//第三节添加
}
···
现在有关问题在于,有些操作符必须读取双字符才能认定,在lexer.go中的NextToken函数,它的switch只能接收单个字符,因此要识别">=", "!="等这些符号时,我们需要在读取到第一个字符时,还需要再读取下一个字符,这样获取到两个字符后才能做出判断,于是我们在lexer.go里面再添加一个函数:

func (l *Lexer) peekChar() byte {if l.readPosition >= len(l.input) {return 0 } else {return l.input[l.readPosition]}
}

当解析器读取到符号"=", “!”, “<”, ">"时,它还需要借助上面的函数获取下一个字符,这样才能决定当前遇到的操作符是哪一种,代码如下:

func (l *Lexer) NextToken() token.Token{//读取一个字符,判断是否属于特定分类var tok token.Token//忽略空格,回车,换行等特定字符l.skipSpecialChar()switch l.ch {。。。。//第三节添加case '-':tok = newToken(token.MINUS, l.ch)case '*':tok = newToken(token.ASTERISK, l.ch)case '/':tok = newToken(token.SLASH, l.ch)case '=' :if l.peekChar() == '=' {//遇到==操作符ch := l.ch l.readChar()tok = token.Token{Type: token.EQUAL, Literal: string(ch) + string(l.ch}} else {tok = newToken(token.ASSIGN, l.ch)}case '!':if l.peekChar() == '=' {//操作符!=ch := l.ch l.readChar()tok = token.Token{Type: token.NOEQUAL, Literal: string(ch) + string(l.ch)}} else {tok = newToken(token.BANG, l.ch)}case '<':if l.peekChar() == '=' {//操作符!=ch := l.ch l.readChar()tok = token.Token{Type: token.LESSEQUAL, Literal: string(ch) + string(l.ch)}} else {tok = newToken(token.LT, l.ch)}case '>':if l.peekChar() == '=' {//操作符!=ch := l.ch l.readChar()tok = token.Token{Type: token.GREATEREQUAL, Literal: string(ch) + string(l.ch)}} else {tok = newToken(token.GT, l.ch)}。。。。}。。。。     
}

现在我们可以再次完善用于测试的python代码,在lexer_test.go里面进行修改如下:


func TestNextToken2(t *testing.T) {input := `def add(x, y):assert 0 <= x <= yz = x + yreturn z`tests := []struct {expectedType token.TokenType expectedLiteral string } {{token.DEF, "def"},{token.IDENTIFIER, "add"},{token.LPAR, "("},{token.IDENTIFIER, "x"},{token.COMMA, ","},{token.IDENTIFIER, "y"},{token.RPAR, ")"},{token.COLON, ":"},//第三节添加{token.ASSERT, "assert"},{token.NUMBER, "0"},{token.LESSEQUAL, "<="},{token.IDENTIFIER, "x"},{token.LESSEQUAL, "<="},{token.IDENTIFIER, "y"},//第三节添加{token.IDENTIFIER, "z"},{token.ASSIGN, "="},{token.IDENTIFIER, "x"},{token.PLUS, "+"},{token.IDENTIFIER, "z"},{token.RETURN, "return"},{token.IDENTIFIER, "z"},}l := New(input)for i, tt := range tests {tok := l.NextToken()if tok.Type != tt.expectedType {t.Fatalf("test[%d] - tokenType wrong. expected=%q, got=%q",i, tt.expectedType, tok.Type)if tok.Literal != tt.expectedLiteral {t.Fatalf("tests[%d] - literal wrong. expected=%q, got=%q",i, tt.expectedLiteral, tok.Literal)}}}
}

执行go test后,可以发现上面用例可以通过,这意味着我们的词法解析请求已经能够识别比较复杂的python代码了。

有过Python开发经验的同学都知道,在命令号行窗口输入命令python后,我们可以进入一个互动环境,在里面可以直接输入代码,点击回车就能直接运行,现在我们也来实现这个功能。在根目录创建文件夹repl,然后在里面创建文件repl.go,然后输入代码如下:

package repl import ("bufio""fmt""io""lexer""token"
)const PROMPT = ">>"func Start(in io.Reader, out io.Writer) {scanner := bufio.NewScanner(in) //从控制台获取输入for {fmt.Printf(PROMPT)scanned := scanner.Scan() //点击回车后返回输入内容if !scanned {return //没有输入内容}lien := scanner.Text() //当前输入的内容l := lexer.New(line) for tok := l.NextToken(); tok.Type != token.EOF; tok = l.NextToken() {fmt.Printf("%+v\n", tok) //输出解析的结果}}
}

接下来我们把main.go的内容输入如下:

package repl import ("bufio""fmt""io""lexer""token"
)const PROMPT = ">>"func Start(in io.Reader, out io.Writer) {scanner := bufio.NewScanner(in) //从控制台获取输入for {fmt.Printf(PROMPT)scanned := scanner.Scan() //点击回车后返回输入内容if !scanned {return //没有输入内容}line := scanner.Text() //当前输入的内容l := lexer.New(line) for tok := l.NextToken(); tok.Type != token.EOF; tok = l.NextToken() {fmt.Printf("%+v\n", tok) //输出解析的结果}}
}

上面代码运行后结果如下:
请添加图片描述
可以看到,我们当前完成的工作还真有一点Python编译环境的味道。完整代码请点击这里{https://github.com/wycl16514/-GO-python-REPL.git}

这篇关于尝试用GO写python编译器:创建互动式命令号窗口REPL的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/950007

相关文章

Python基础文件操作方法超详细讲解(详解版)

《Python基础文件操作方法超详细讲解(详解版)》文件就是操作系统为用户或应用程序提供的一个读写硬盘的虚拟单位,文件的核心操作就是读和写,:本文主要介绍Python基础文件操作方法超详细讲解的相... 目录一、文件操作1. 文件打开与关闭1.1 打开文件1.2 关闭文件2. 访问模式及说明二、文件读写1.

Python将博客内容html导出为Markdown格式

《Python将博客内容html导出为Markdown格式》Python将博客内容html导出为Markdown格式,通过博客url地址抓取文章,分析并提取出文章标题和内容,将内容构建成html,再转... 目录一、为什么要搞?二、准备如何搞?三、说搞咱就搞!抓取文章提取内容构建html转存markdown

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

Go标准库常见错误分析和解决办法

《Go标准库常见错误分析和解决办法》Go语言的标准库为开发者提供了丰富且高效的工具,涵盖了从网络编程到文件操作等各个方面,然而,标准库虽好,使用不当却可能适得其反,正所谓工欲善其事,必先利其器,本文将... 目录1. 使用了错误的time.Duration2. time.After导致的内存泄漏3. jsO

Python FastAPI+Celery+RabbitMQ实现分布式图片水印处理系统

《PythonFastAPI+Celery+RabbitMQ实现分布式图片水印处理系统》这篇文章主要为大家详细介绍了PythonFastAPI如何结合Celery以及RabbitMQ实现简单的分布式... 实现思路FastAPI 服务器Celery 任务队列RabbitMQ 作为消息代理定时任务处理完整

Python Websockets库的使用指南

《PythonWebsockets库的使用指南》pythonwebsockets库是一个用于创建WebSocket服务器和客户端的Python库,它提供了一种简单的方式来实现实时通信,支持异步和同步... 目录一、WebSocket 简介二、python 的 websockets 库安装三、完整代码示例1.

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

使用Python实现快速搭建本地HTTP服务器

《使用Python实现快速搭建本地HTTP服务器》:本文主要介绍如何使用Python快速搭建本地HTTP服务器,轻松实现一键HTTP文件共享,同时结合二维码技术,让访问更简单,感兴趣的小伙伴可以了... 目录1. 概述2. 快速搭建 HTTP 文件共享服务2.1 核心思路2.2 代码实现2.3 代码解读3.

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

Python基于wxPython和FFmpeg开发一个视频标签工具

《Python基于wxPython和FFmpeg开发一个视频标签工具》在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行... 目录引言1. 应用概述2. 技术栈分析2.1 核心库和模块2.2 wxpython作为GUI选择的优