C语言源程序词法分析器(Java实现)

2023-12-28 13:48

本文主要是介绍C语言源程序词法分析器(Java实现),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一. 介绍

词法分析器,又称扫描器,输入源程序,进行词法分析,输出单词符号。词法分析仅仅是编译程序工作中的一部分,编译程序一般可以划分为5个阶段:词法分析,语法分析,语义分析与中间代码产生,优化,目标代码生成。我们这里编写一个简单的C语言源程序词法分析器。

二. 目的

设计并实现一个包含预处理功能的词法分析程序,加深对编译中词法分析过程的理解。

四. 要求

1、实现预处理功能

源程序中可能包含有对程序执行无意义的符号,要求将其剔除。
首先编制一个源程序的输入过程,从键盘、文件或文本框输入若干行语句,依次存入输入缓冲区(字符型数据);然后编制一个预处理子程序,去掉输入串中的回车符、换行符和跳格符等编辑性文字;把多个空白符合并为一个;去掉注释。

2、实现词法分析功能

输入:所给文法的源程序字符串。
输出:二元组(syn,token或sum)构成的序列。其中,
syn为单词种别码。
Token为存放的单词自身字符串。
Sum为整型常量。
具体实现时,可以将单词的二元组用结构进行处理。

3、待分析的C语言子集的词法

1)关键字
main if then while do static int double struct break else long switch case typedef char return const float short continue for void default sizeof do
所有的关键字都是小写。
2)运算符和界符
+ - * / : := < <> <= > >= = ; ( ) #
3)其他标记ID和NUM
通过以下正规式定义其他标记:
ID→letter(letter|digit)*
NUM→digit digit*
letter→a|…|z|A|…|Z
digit→0|…|9…
4)空格由空白、制表符和换行符组成
空格一般用来分隔ID、NUM、专用符号和关键字,词法分析阶段通常被忽略。

4、各种单词符号对应的种别码
单词符号    种别码        单词符号    种别码       
main        1            void       23     
if          2            sizeof     24     
then        3            ID         25  
while       4            NUM        26
do          5             +         27   
static      6             -         28     
int         7             *         29  
double      8             /         30     
struct      9            **         31   
break       10           ==         32  
else        11           <          33   
long        12           <>         34  
switch      13           <=         35 
case        14           >          36
typedef     15           >=         37
char        16           =          38
return      17           [          39
const       18           ]          40 
float       19           ;          41 
short       20           (          42 
continue   21            )          43 
for         22           #          0  

五. 源代码

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;public class LexicalAnalyzer {static String[] rwtab=new String[]{"main","if","then","while","do","static","int","double","struct","break","else","long","switch","case","typedef","char","return","const","float","short","continue","for","void","sizeof"};   //已经定义的24个关键字,种别码从1开始static String storage="";   //存储源程序字符串static StringBuilder token=new StringBuilder("");     //存储单词自身组成的字符串static char ch;static int index;static int syn, sum=0, row;//分析器static void analyzer(){token.delete(0, token.length());                //置空token对象,清除ch=storage.charAt(index++);while(ch==' '){ch=storage.charAt(index++);      //去除空格符号}if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z')){         //可能是关键字或者自定义的标识符while((ch>='0'&&ch<='9')||(ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z')){token.append(ch);ch=storage.charAt(index++);}index--;      //此次识别的最后一个字符未识别入,需要将标记退原处 syn=25;       //默认为识别出的字符串为自定义的标识符,种别码为25String s=token.toString();for(int i=0; i<rwtab.length; i++){if(s.equals(rwtab[i])){     syn=i+1;break;        //识别出是关键字}}}else if((ch>='0'&&ch<='9')){sum=0;while((ch>='0'&&ch<='9')){sum=sum*10+ch-'0';ch=storage.charAt(index++);}index--;syn=26;}else switch(ch){case '<':token.append(ch);ch=storage.charAt(index++);if(ch=='='){token.append(ch);syn=35;}else if(ch=='>'){token.append(ch);syn=34;}else{syn=33;index--;}break;case '>':token.append(ch);ch=storage.charAt(index++);if(ch=='='){token.append(ch);syn=37;}else{syn=36;index--;}break;case '*':token.append(ch);ch=storage.charAt(index++);if(ch=='*'){token.append(ch);syn=31;}else{syn=13;index--;}break;case '=':token.append(ch);ch=storage.charAt(index++);if(ch=='='){syn=32;token.append(ch);}else{syn=38;index--;}break;case '/':token.append(ch);ch=storage.charAt(index++);if(ch=='/'){while(ch!=' '){ch=storage.charAt(index++);  //忽略掉注释,以空格为界定}syn=-2;break;}else{syn=30;index--;}break;case '+':syn=27;token.append(ch);break;case '-':syn=28;token.append(ch);break;case ';':syn=41;token.append(ch);break;case '(':syn=42;token.append(ch);break;case ')':syn=43;token.append(ch);break;case '#':syn=0;token.append(ch);break;case '\n':syn=-2;token.append(ch);break;default:syn=-1;}}public static void main(String[] args) {// TODO Auto-generated method stubBufferedReader stdin=new BufferedReader(new InputStreamReader(System.in));index=0;row=1;String tempString;System.out.println("请输入C语言源程序字符串(以#结尾):");//输入过程try{do{tempString=stdin.readLine();storage+=tempString;ch=tempString.charAt(tempString.length()-1);  //得到一行中最后一个字符}while(ch!='#');        //输入以#字符结尾}catch(IOException e){e.printStackTrace();}index=0; //输出过程do{analyzer();switch(syn){case 26:System.out.println("("+syn+","+sum+")");break;case -1:System.out.println("Error in row"+row+"!");break;case -2:break;default:System.out.println("("+syn+","+token+")");}}while(syn!=0);}}

六. 运行结果

这里写图片描述

这篇关于C语言源程序词法分析器(Java实现)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/546148

相关文章

Java设计模式---迭代器模式(Iterator)解读

《Java设计模式---迭代器模式(Iterator)解读》:本文主要介绍Java设计模式---迭代器模式(Iterator),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录1、迭代器(Iterator)1.1、结构1.2、常用方法1.3、本质1、解耦集合与遍历逻辑2、统一

Java内存分配与JVM参数详解(推荐)

《Java内存分配与JVM参数详解(推荐)》本文详解JVM内存结构与参数调整,涵盖堆分代、元空间、GC选择及优化策略,帮助开发者提升性能、避免内存泄漏,本文给大家介绍Java内存分配与JVM参数详解,... 目录引言JVM内存结构JVM参数概述堆内存分配年轻代与老年代调整堆内存大小调整年轻代与老年代比例元空

深度解析Java DTO(最新推荐)

《深度解析JavaDTO(最新推荐)》DTO(DataTransferObject)是一种用于在不同层(如Controller层、Service层)之间传输数据的对象设计模式,其核心目的是封装数据,... 目录一、什么是DTO?DTO的核心特点:二、为什么需要DTO?(对比Entity)三、实际应用场景解析

Java 线程安全与 volatile与单例模式问题及解决方案

《Java线程安全与volatile与单例模式问题及解决方案》文章主要讲解线程安全问题的五个成因(调度随机、变量修改、非原子操作、内存可见性、指令重排序)及解决方案,强调使用volatile关键字... 目录什么是线程安全线程安全问题的产生与解决方案线程的调度是随机的多个线程对同一个变量进行修改线程的修改操

关于集合与数组转换实现方法

《关于集合与数组转换实现方法》:本文主要介绍关于集合与数组转换实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、Arrays.asList()1.1、方法作用1.2、内部实现1.3、修改元素的影响1.4、注意事项2、list.toArray()2.1、方

从原理到实战深入理解Java 断言assert

《从原理到实战深入理解Java断言assert》本文深入解析Java断言机制,涵盖语法、工作原理、启用方式及与异常的区别,推荐用于开发阶段的条件检查与状态验证,并强调生产环境应使用参数验证工具类替代... 目录深入理解 Java 断言(assert):从原理到实战引言:为什么需要断言?一、断言基础1.1 语

深度解析Java项目中包和包之间的联系

《深度解析Java项目中包和包之间的联系》文章浏览阅读850次,点赞13次,收藏8次。本文详细介绍了Java分层架构中的几个关键包:DTO、Controller、Service和Mapper。_jav... 目录前言一、各大包1.DTO1.1、DTO的核心用途1.2. DTO与实体类(Entity)的区别1

Java中的雪花算法Snowflake解析与实践技巧

《Java中的雪花算法Snowflake解析与实践技巧》本文解析了雪花算法的原理、Java实现及生产实践,涵盖ID结构、位运算技巧、时钟回拨处理、WorkerId分配等关键点,并探讨了百度UidGen... 目录一、雪花算法核心原理1.1 算法起源1.2 ID结构详解1.3 核心特性二、Java实现解析2.

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

SpringBoot整合liteflow的详细过程

《SpringBoot整合liteflow的详细过程》:本文主要介绍SpringBoot整合liteflow的详细过程,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋...  liteflow 是什么? 能做什么?总之一句话:能帮你规范写代码逻辑 ,编排并解耦业务逻辑,代码