C语言源程序词法分析器(Java实现)

2023-12-28 13:48

本文主要是介绍C语言源程序词法分析器(Java实现),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一. 介绍

词法分析器,又称扫描器,输入源程序,进行词法分析,输出单词符号。词法分析仅仅是编译程序工作中的一部分,编译程序一般可以划分为5个阶段:词法分析,语法分析,语义分析与中间代码产生,优化,目标代码生成。我们这里编写一个简单的C语言源程序词法分析器。

二. 目的

设计并实现一个包含预处理功能的词法分析程序,加深对编译中词法分析过程的理解。

四. 要求

1、实现预处理功能

源程序中可能包含有对程序执行无意义的符号,要求将其剔除。
首先编制一个源程序的输入过程,从键盘、文件或文本框输入若干行语句,依次存入输入缓冲区(字符型数据);然后编制一个预处理子程序,去掉输入串中的回车符、换行符和跳格符等编辑性文字;把多个空白符合并为一个;去掉注释。

2、实现词法分析功能

输入:所给文法的源程序字符串。
输出:二元组(syn,token或sum)构成的序列。其中,
syn为单词种别码。
Token为存放的单词自身字符串。
Sum为整型常量。
具体实现时,可以将单词的二元组用结构进行处理。

3、待分析的C语言子集的词法

1)关键字
main if then while do static int double struct break else long switch case typedef char return const float short continue for void default sizeof do
所有的关键字都是小写。
2)运算符和界符
+ - * / : := < <> <= > >= = ; ( ) #
3)其他标记ID和NUM
通过以下正规式定义其他标记:
ID→letter(letter|digit)*
NUM→digit digit*
letter→a|…|z|A|…|Z
digit→0|…|9…
4)空格由空白、制表符和换行符组成
空格一般用来分隔ID、NUM、专用符号和关键字,词法分析阶段通常被忽略。

4、各种单词符号对应的种别码
单词符号    种别码        单词符号    种别码       
main        1            void       23     
if          2            sizeof     24     
then        3            ID         25  
while       4            NUM        26
do          5             +         27   
static      6             -         28     
int         7             *         29  
double      8             /         30     
struct      9            **         31   
break       10           ==         32  
else        11           <          33   
long        12           <>         34  
switch      13           <=         35 
case        14           >          36
typedef     15           >=         37
char        16           =          38
return      17           [          39
const       18           ]          40 
float       19           ;          41 
short       20           (          42 
continue   21            )          43 
for         22           #          0  

五. 源代码

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;public class LexicalAnalyzer {static String[] rwtab=new String[]{"main","if","then","while","do","static","int","double","struct","break","else","long","switch","case","typedef","char","return","const","float","short","continue","for","void","sizeof"};   //已经定义的24个关键字,种别码从1开始static String storage="";   //存储源程序字符串static StringBuilder token=new StringBuilder("");     //存储单词自身组成的字符串static char ch;static int index;static int syn, sum=0, row;//分析器static void analyzer(){token.delete(0, token.length());                //置空token对象,清除ch=storage.charAt(index++);while(ch==' '){ch=storage.charAt(index++);      //去除空格符号}if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z')){         //可能是关键字或者自定义的标识符while((ch>='0'&&ch<='9')||(ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z')){token.append(ch);ch=storage.charAt(index++);}index--;      //此次识别的最后一个字符未识别入,需要将标记退原处 syn=25;       //默认为识别出的字符串为自定义的标识符,种别码为25String s=token.toString();for(int i=0; i<rwtab.length; i++){if(s.equals(rwtab[i])){     syn=i+1;break;        //识别出是关键字}}}else if((ch>='0'&&ch<='9')){sum=0;while((ch>='0'&&ch<='9')){sum=sum*10+ch-'0';ch=storage.charAt(index++);}index--;syn=26;}else switch(ch){case '<':token.append(ch);ch=storage.charAt(index++);if(ch=='='){token.append(ch);syn=35;}else if(ch=='>'){token.append(ch);syn=34;}else{syn=33;index--;}break;case '>':token.append(ch);ch=storage.charAt(index++);if(ch=='='){token.append(ch);syn=37;}else{syn=36;index--;}break;case '*':token.append(ch);ch=storage.charAt(index++);if(ch=='*'){token.append(ch);syn=31;}else{syn=13;index--;}break;case '=':token.append(ch);ch=storage.charAt(index++);if(ch=='='){syn=32;token.append(ch);}else{syn=38;index--;}break;case '/':token.append(ch);ch=storage.charAt(index++);if(ch=='/'){while(ch!=' '){ch=storage.charAt(index++);  //忽略掉注释,以空格为界定}syn=-2;break;}else{syn=30;index--;}break;case '+':syn=27;token.append(ch);break;case '-':syn=28;token.append(ch);break;case ';':syn=41;token.append(ch);break;case '(':syn=42;token.append(ch);break;case ')':syn=43;token.append(ch);break;case '#':syn=0;token.append(ch);break;case '\n':syn=-2;token.append(ch);break;default:syn=-1;}}public static void main(String[] args) {// TODO Auto-generated method stubBufferedReader stdin=new BufferedReader(new InputStreamReader(System.in));index=0;row=1;String tempString;System.out.println("请输入C语言源程序字符串(以#结尾):");//输入过程try{do{tempString=stdin.readLine();storage+=tempString;ch=tempString.charAt(tempString.length()-1);  //得到一行中最后一个字符}while(ch!='#');        //输入以#字符结尾}catch(IOException e){e.printStackTrace();}index=0; //输出过程do{analyzer();switch(syn){case 26:System.out.println("("+syn+","+sum+")");break;case -1:System.out.println("Error in row"+row+"!");break;case -2:break;default:System.out.println("("+syn+","+token+")");}}while(syn!=0);}}

六. 运行结果

这里写图片描述

这篇关于C语言源程序词法分析器(Java实现)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/546148

相关文章

C语言中联合体union的使用

本文编辑整理自: http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=179471 一、前言 “联合体”(union)与“结构体”(struct)有一些相似之处。但两者有本质上的不同。在结构体中,各成员有各自的内存空间, 一个结构变量的总长度是各成员长度之和。而在“联合”中,各成员共享一段内存空间, 一个联合变量

C++对象布局及多态实现探索之内存布局(整理的很多链接)

本文通过观察对象的内存布局,跟踪函数调用的汇编代码。分析了C++对象内存的布局情况,虚函数的执行方式,以及虚继承,等等 文章链接:http://dev.yesky.com/254/2191254.shtml      论C/C++函数间动态内存的传递 (2005-07-30)   当你涉及到C/C++的核心编程的时候,你会无止境地与内存管理打交道。 文章链接:http://dev.yesky

Java五子棋之坐标校正

上篇针对了Java项目中的解构思维,在这篇内容中我们不妨从整体项目中拆解拿出一个非常重要的五子棋逻辑实现:坐标校正,我们如何使漫无目的鼠标点击变得有序化和可控化呢? 目录 一、从鼠标监听到获取坐标 1.MouseListener和MouseAdapter 2.mousePressed方法 二、坐标校正的具体实现方法 1.关于fillOval方法 2.坐标获取 3.坐标转换 4.坐

Spring Cloud:构建分布式系统的利器

引言 在当今的云计算和微服务架构时代,构建高效、可靠的分布式系统成为软件开发的重要任务。Spring Cloud 提供了一套完整的解决方案,帮助开发者快速构建分布式系统中的一些常见模式(例如配置管理、服务发现、断路器等)。本文将探讨 Spring Cloud 的定义、核心组件、应用场景以及未来的发展趋势。 什么是 Spring Cloud Spring Cloud 是一个基于 Spring

Javascript高级程序设计(第四版)--学习记录之变量、内存

原始值与引用值 原始值:简单的数据即基础数据类型,按值访问。 引用值:由多个值构成的对象即复杂数据类型,按引用访问。 动态属性 对于引用值而言,可以随时添加、修改和删除其属性和方法。 let person = new Object();person.name = 'Jason';person.age = 42;console.log(person.name,person.age);//'J

java8的新特性之一(Java Lambda表达式)

1:Java8的新特性 Lambda 表达式: 允许以更简洁的方式表示匿名函数(或称为闭包)。可以将Lambda表达式作为参数传递给方法或赋值给函数式接口类型的变量。 Stream API: 提供了一种处理集合数据的流式处理方式,支持函数式编程风格。 允许以声明性方式处理数据集合(如List、Set等)。提供了一系列操作,如map、filter、reduce等,以支持复杂的查询和转

Java面试八股之怎么通过Java程序判断JVM是32位还是64位

怎么通过Java程序判断JVM是32位还是64位 可以通过Java程序内部检查系统属性来判断当前运行的JVM是32位还是64位。以下是一个简单的方法: public class JvmBitCheck {public static void main(String[] args) {String arch = System.getProperty("os.arch");String dataM

详细分析Springmvc中的@ModelAttribute基本知识(附Demo)

目录 前言1. 注解用法1.1 方法参数1.2 方法1.3 类 2. 注解场景2.1 表单参数2.2 AJAX请求2.3 文件上传 3. 实战4. 总结 前言 将请求参数绑定到模型对象上,或者在请求处理之前添加模型属性 可以在方法参数、方法或者类上使用 一般适用这几种场景: 表单处理:通过 @ModelAttribute 将表单数据绑定到模型对象上预处理逻辑:在请求处理之前

eclipse运行springboot项目,找不到主类

解决办法尝试了很多种,下载sts压缩包行不通。最后解决办法如图: help--->Eclipse Marketplace--->Popular--->找到Spring Tools 3---->Installed。

JAVA读取MongoDB中的二进制图片并显示在页面上

1:Jsp页面: <td><img src="${ctx}/mongoImg/show"></td> 2:xml配置: <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans"xmlns:xsi="http://www.w3.org/2001