制作一个简单的C语言词法分析程序

2023-11-01 03:01

本文主要是介绍制作一个简单的C语言词法分析程序,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.分析组成

C语言的程序中,有很单词多符号和保留字。一些单词符号还有对应的左线性文法。所以我们需要先做出一个单词字符表,给出对应的识别码,然后跟据对应的表格来写出程序

 

2.程序设计

程序主要有循环判断构成。不需推理即可产生的符号我们可以把它包装在函数中,返回值为对应的识别码即可。但是有线性文法的则需要单独的一遍推倒才可以得出词法分析结果。对于测试样例我们可以存储到txt文件中,使用循环读写可以更高效的测试和输出词法分析结果。最终的结果我们用二元式的形式来表示,存储在txt文件中

3.完整程序

#include <stdio.h>
#include <stdlib.h>
#include <string.h>int english(char ch) {if((ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <= 'Z')) return 1;else return 0;
}
int number(char ch) {if(ch >= '0' && ch <= '9') return 1;else return 0;
}
int reserved(char str[]) {if(strcmp(str, "void") == 0) return 3;else if(strcmp(str, "int") == 0) return 4;else if(strcmp(str, "float") == 0) return 5;else if(strcmp(str, "double") == 0) return 6;else if(strcmp(str, "if") == 0) return 7;else if(strcmp(str, "else") == 0) return 8;else if(strcmp(str, "for") == 0) return 9;else if(strcmp(str, "do") == 0) return 10;else if(strcmp(str, "while") == 0) return 11;else if(strcmp(str, "break") == 0) return 12;else if(strcmp(str, "return") == 0) return 13;else return 1;
}
int symbol(char ch) {if(ch == ';') return 14;else if(ch == ',') return 15;else if(ch == '(') return 16;else if(ch == ')') return 17;else if(ch == '{') return 18;else if(ch == '}') return 19;else if(ch == '[') return 20;else if(ch == ']') return 21;else if(ch == '%') return 22;else if(ch == '?') return 23;else if(ch == ':') return 24;else if(ch == '\'') return 25;else if(ch == '\"') return 26;else if(ch == '.') return 27;else return 0;
}int main(){for(int i = 1; i <= 4; i++){char txt1[] = "test";char num[6];sprintf(num, "%d.txt", i);strcat(txt1, num);char txt2[] = "analyze";sprintf(num, "%d.txt", i);strcat(txt2, num);FILE *fp = fopen(txt1, "r");FILE *fw = fopen(txt2, "wt+");int flag = 0;char ch = fgetc(fp);	while(!feof(fp)) {char str[32];int j = 0;if(ch == ' ' || ch == '\t') {ch = fgetc(fp);continue;}else if(ch == '\n'){fprintf(fw, "\n");ch = fgetc(fp);continue;}else if(english(ch)) {str[j++] = ch;do{ch = fgetc(fp);str[j++] = ch;}while(english(ch)||number(ch));str[j-1] = '\0';int id = reserved(str);fprintf(fw, "(%d, %s) ", id, str);}else if(number(ch)) {str[j++] = ch;do{ch = fgetc(fp);str[j++] = ch;}while(number(ch));str[j-1] = '\0';fprintf(fw, "(2, %s) ", str);}else if(symbol(ch) != 0) {fprintf(fw, "(%d, %c) ", symbol(ch), ch);ch = fgetc(fp);}else if(ch == '>') {ch = fgetc(fp);if(ch == '=') {fprintf(fw, "(29, >=) ");ch = fgetc(fp);}else if(ch == '>') {fprintf(fw, "(30, >>) ");ch = fgetc(fp);}else fprintf(fw, "(28, >) ");}else if(ch == '<') {ch = fgetc(fp);if(ch == '=') {fprintf(fw, "(32, <=) ");ch = fgetc(fp);}else if(ch == '<') {fprintf(fw, "(33, <<) ");ch = fgetc(fp);}else fprintf(fw, "(31, <) ");}else if(ch == '!') {ch = fgetc(fp);if(ch == '=') {fprintf(fw, "(35, !=) ");ch = fgetc(fp);}else fprintf(fw, "(34, !) ");}else if(ch == '=') {ch = fgetc(fp);if(ch == '=') {fprintf(fw, "(37, ==) ");ch = fgetc(fp);}else fprintf(fw, "(36, =) ");}else if(ch == '/') {ch = fgetc(fp);if(ch == '*') {fprintf(fw, "(Start annotate, /*) ");do {ch = fgetc(fp);if(ch == '*') {ch = fgetc(fp);if(ch == '/') {fprintf(fw, "(End annotate, */) ");ch = fgetc(fp);break;}}}while(1);}else if(ch == '/') {fprintf(fw, "(annotate, //) ");do {ch = fgetc(fp);}while(ch != '\n');fprintf(fw, "\n");ch = fgetc(fp);}else if(ch == '=') {fprintf(fw, "(39, /=) ");ch = fgetc(fp);}else fprintf(fw, "(38, /) ");}else if(ch == '&') {ch = fgetc(fp);if(ch == '&') {fprintf(fw, "(41, &&) ");ch = fgetc(fp);}else fprintf(fw, "(40, &) ");}else if(ch == '|') {ch = fgetc(fp);if(ch == '|') {fprintf(fw, "(43, ||) ");ch = fgetc(fp);}else fprintf(fw, "(42, |) ");}else if(ch == '+') {ch = fgetc(fp);if(ch == '=') {fprintf(fw, "(46, +=) ");ch = fgetc(fp);}else if(ch == '+') {fprintf(fw, "(45 ++) ");ch = fgetc(fp);}else fprintf(fw, "(44, +) ");}else if(ch == '-') {ch = fgetc(fp);if(ch == '=') {fprintf(fw, "(49, -=) ");ch = fgetc(fp);}else if(ch == '-') {fprintf(fw, "(48, --) ");ch = fgetc(fp);}else fprintf(fw, "(47, -) ");}else if(ch == '*') {ch = fgetc(fp);if(ch == '=') {fprintf(fw, "(51, *=) ");ch = fgetc(fp);}else fprintf(fw, "(50, *) ");}else if(ch == '\\') {ch = fgetc(fp);if(ch == 'n') {ch = fgetc(fp);}}else {fprintf(fw, "Undefined symbol!");printf("test%d: Undefined symbol!\n", i); flag = 1;break;}}fclose(fp);fclose(fw);if(flag) continue;printf("test%d: Finish analyzing.\n", i);}
} 

 4.测试运行

其中一个测试样例:(剩余的大家可以自主编写) 

void test1() {int a = 5, b = 10;if (a > b) {printf("a is greater than b");} else if (a < b) {printf("b is greater than a");} else {printf("a and b are equal");}for (int i = 0; i < 5; i++) {printf("%d ", i);}printf("\n");int arr[5] = {1, 2, 3, 4, 5};int sum = 0;for (int i = 0; i < 5; i++) {sum += arr[i];}printf("The sum of the array is: %d\n", sum);return 0;
}

 运行结果:

(3, void) (1, test1) (16, () (17, )) (18, {) 
(4, int) (1, a) (36, =) (2, 5) (15, ,) (1, b) (36, =) (2, 10) (14, ;) 
(7, if) (16, () (1, a) (28, >) (1, b) (17, )) (18, {) 
(1, printf) (16, () (26, ") (1, a) (1, is) (1, greater) (1, than) (1, b) (26, ") (17, )) (14, ;) 
(19, }) (8, else) (7, if) (16, () (1, a) (31, <) (1, b) (17, )) (18, {) 
(1, printf) (16, () (26, ") (1, b) (1, is) (1, greater) (1, than) (1, a) (26, ") (17, )) (14, ;) 
(19, }) (8, else) (18, {) 
(1, printf) (16, () (26, ") (1, a) (1, and) (1, b) (1, are) (1, equal) (26, ") (17, )) (14, ;) 
(19, }) (9, for) (16, () (4, int) (1, i) (36, =) (2, 0) (14, ;) (1, i) (31, <) (2, 5) (14, ;) (1, i) (45 ++) (17, )) (18, {) 
(1, printf) (16, () (26, ") (22, %) (1, d) (26, ") (15, ,) (1, i) (17, )) (14, ;) 
(19, }) 
(1, printf) (16, () (26, ") (26, ") (17, )) (14, ;) (4, int) (1, arr) (20, [) (2, 5) (21, ]) (36, =) (18, {) (2, 1) (15, ,) (2, 2) (15, ,) (2, 3) (15, ,) (2, 4) (15, ,) (2, 5) (19, }) (14, ;) 
(4, int) (1, sum) (36, =) (2, 0) (14, ;) 
(9, for) (16, () (4, int) (1, i) (36, =) (2, 0) (14, ;) (1, i) (31, <) (2, 5) (14, ;) (1, i) (45 ++) (17, )) (18, {) 
(1, sum) (46, +=) (1, arr) (20, [) (1, i) (21, ]) (14, ;) 
(19, }) 
(1, printf) (16, () (26, ") (1, The) (1, sum) (1, of) (1, the) (1, array) (1, is) (24, :) (22, %) (1, d) (26, ") (15, ,) (1, sum) (17, )) (14, ;) (13, return) (2, 0) (14, ;) 
(19, }) 

这篇关于制作一个简单的C语言词法分析程序的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/320013

相关文章

利用Python编写一个简单的聊天机器人

《利用Python编写一个简单的聊天机器人》这篇文章主要为大家详细介绍了如何利用Python编写一个简单的聊天机器人,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 使用 python 编写一个简单的聊天机器人可以从最基础的逻辑开始,然后逐步加入更复杂的功能。这里我们将先实现一个简单的

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

Go语言实现将中文转化为拼音功能

《Go语言实现将中文转化为拼音功能》这篇文章主要为大家详细介绍了Go语言中如何实现将中文转化为拼音功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 有这么一个需求:新用户入职 创建一系列账号比较麻烦,打算通过接口传入姓名进行初始化。想把姓名转化成拼音。因为有些账号即需要中文也需要英

Go语言使用Buffer实现高性能处理字节和字符

《Go语言使用Buffer实现高性能处理字节和字符》在Go中,bytes.Buffer是一个非常高效的类型,用于处理字节数据的读写操作,本文将详细介绍一下如何使用Buffer实现高性能处理字节和... 目录1. bytes.Buffer 的基本用法1.1. 创建和初始化 Buffer1.2. 使用 Writ

深入理解C语言的void*

《深入理解C语言的void*》本文主要介绍了C语言的void*,包括它的任意性、编译器对void*的类型检查以及需要显式类型转换的规则,具有一定的参考价值,感兴趣的可以了解一下... 目录一、void* 的类型任意性二、编译器对 void* 的类型检查三、需要显式类型转换占用的字节四、总结一、void* 的

使用IntelliJ IDEA创建简单的Java Web项目完整步骤

《使用IntelliJIDEA创建简单的JavaWeb项目完整步骤》:本文主要介绍如何使用IntelliJIDEA创建一个简单的JavaWeb项目,实现登录、注册和查看用户列表功能,使用Se... 目录前置准备项目功能实现步骤1. 创建项目2. 配置 Tomcat3. 项目文件结构4. 创建数据库和表5.

使用PyQt5编写一个简单的取色器

《使用PyQt5编写一个简单的取色器》:本文主要介绍PyQt5搭建的一个取色器,一共写了两款应用,一款使用快捷键捕获鼠标附近图像的RGB和16进制颜色编码,一款跟随鼠标刷新图像的RGB和16... 目录取色器1取色器2PyQt5搭建的一个取色器,一共写了两款应用,一款使用快捷键捕获鼠标附近图像的RGB和16

四种简单方法 轻松进入电脑主板 BIOS 或 UEFI 固件设置

《四种简单方法轻松进入电脑主板BIOS或UEFI固件设置》设置BIOS/UEFI是计算机维护和管理中的一项重要任务,它允许用户配置计算机的启动选项、硬件设置和其他关键参数,该怎么进入呢?下面... 随着计算机技术的发展,大多数主流 PC 和笔记本已经从传统 BIOS 转向了 UEFI 固件。很多时候,我们也

基于Qt开发一个简单的OFD阅读器

《基于Qt开发一个简单的OFD阅读器》这篇文章主要为大家详细介绍了如何使用Qt框架开发一个功能强大且性能优异的OFD阅读器,文中的示例代码讲解详细,有需要的小伙伴可以参考一下... 目录摘要引言一、OFD文件格式解析二、文档结构解析三、页面渲染四、用户交互五、性能优化六、示例代码七、未来发展方向八、结论摘要

C语言线程池的常见实现方式详解

《C语言线程池的常见实现方式详解》本文介绍了如何使用C语言实现一个基本的线程池,线程池的实现包括工作线程、任务队列、任务调度、线程池的初始化、任务添加、销毁等步骤,感兴趣的朋友跟随小编一起看看吧... 目录1. 线程池的基本结构2. 线程池的实现步骤3. 线程池的核心数据结构4. 线程池的详细实现4.1 初