编译原理项目——C++实现C语言编译器输出为8086级汇编(代码/报告材料)

本文主要是介绍编译原理项目——C++实现C语言编译器输出为8086级汇编(代码/报告材料),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

完整的材料 代码见文章末尾 以下为核心内容和部分结果

项目介绍

一个小型的c语言编译器,实现的功能如下:

  1. 可以定义多个变量,并且能初始化。
  2. 可以支持基本的加减乘除运算。
  3. 可以支持带括号的多个变量的四则混合运算。
  4. 可以支持单行注释和多行注释。
  5. 可以输出%d格式的整数。
  6. 可以定义int 类型。
  7. 可以输出字符串。
  8. 可以输出2位整数
  9. 可以支持简单的if{}else{}语句。(大于和小于比较条件)
  10. 以上支持的语法可以混合在同一个源程序中。
  11. 部分错误语法可以报错。

环境

  • 汇编器、MASM
  • 汇编语言:8086汇编
  • 源代码:C++,用VS2019

用masm打开生成的asm文件直接运行

设计流程

扫源代码 --> 词法分析 --> 语法分析 -->目标代码 --> 汇编代码

词法分析器的实现:使用正则表达式或有限状态机(Finite State Machine, FSM)来识别和生成词法单元。

语法分析器的实现:使用递归下降分析或者其他方法(如LR分析)构建语法分析器,生成抽象语法树。

语义分析:检查类型、作用域等语义信息,确保生成的代码符合语言规范。

中间代码生成:根据抽象语法树生成中间表示形式,如三地址码或四元式。

目标代码生成:将中间代码翻译为8086汇编代码,考虑寄存器分配、指令选择等。

汇编代码生成:将生成的汇编代码输出为文件,或直接进行后续的汇编和链接操作。

部分核心代码展示(asm文件)

#include"asm.h"
#include"define.h"
extern vector<Target>  target_code;
extern vector<Variable>   var_table;
extern char lab;
string  asmfile(string source)
{if (source.size() == 0){cout << "源文件名不能为空" << endl;exit(-1);}string temp = "";int i, j;j = source.size();for (i = j - 1; i >= 0; i--){//		if(source[i] == '\\' || source[i]== '/')//			break;if (source[i] == '.'){j = i;break;}}temp = source.substr(0, j) + ".asm";return temp;
}
void add_target_code(string dsf, string op, string dst, string dsc, string mark, string step)
{Target  tmp;tmp.dsf = dsf;tmp.op = op;tmp.dst = dst;tmp.dsc = dsc;tmp.mark = mark;tmp.step = step;target_code.push_back(tmp);
}
void addsub_asm(ofstream& out, string dsf, string op, string dst, string dsc)
{out << "    mov BL," << dst << endl;if (op == "+")out << "    add BL," << dsc << endl;elseout << "    sub BL," << dsc << endl;out << "    mov " << dsf << ",BL" << endl;
}
void mul_asm(ofstream& out, string dsf, string dst, string dsc)
{out << "    mov AL," << dst << endl;out << "    mov BH," << dsc << endl;out << "    mul BH" << endl;out << "    mov BL,1" << endl;out << "    div BL" << endl;out << "    mov " << dsf << ",AL" << endl;
}
void div_asm(ofstream& out, string dsf, string dst, string dsc)
{out << "    mov AL," << dst << endl;out << "    CBW" << endl;out << "    mov BL," << dsc << endl;out << "    div BL" << endl;out << "    mov " << dsf << ",AL" << endl;
}
void sign_asm(ofstream& out, string dsf, string dst)
{out << "    mov BL," << dst << endl;out << "    mov " << dsf << ",BL" << endl;
}
void print_asm(ofstream& out, string dsf, string mark)
{//以字符格式输出if (mark == "%c"){out << "    mov DL," << dsf << endl;out << "    mov AH,02H" << endl;out << "    int 21H" << endl;}//以整数格式输出else if (mark == "%d"){out << "    mov AL," << dsf << endl;out << "    CBW" << endl;out << "    mov BL,10" << endl;out << "    DIV BL" << endl;out << "    mov BH,AH" << endl;out << "    add BH,30H" << endl;out << "    add AL,30H" << endl;out << "    CMP AL,48" << endl;//确定十位是否是0lab = lab + 2;string step2 = "step" + char_to_str(lab);out << "    JE " << step2 << endl;string step1 = "step" + char_to_str(lab - 1);out << "  " << step1 << ":" << endl;out << "    mov DL,AL" << endl;out << "    mov AH,2" << endl;out << "    int 21H" << endl;//输出个位out << "  " << step2 << ":" << endl;out << "    mov DL,BH" << endl;out << "    mov AH,2" << endl;out << "    int 21H" << endl;}//字符串输出else{out << "    LEA DX," << mark << endl;out << "    mov AH,09" << endl;out << "    int 21H" << endl;}
}
void if_asm(ofstream& out, string dst, string dsc, string mark, string step)
{out << "    mov AL," << dst << endl;out << "    CMP AL," << dsc << endl;if (mark == ">")out << "    JG " << step << endl;else if (mark == "<")out << "    JL " << step << endl;else{cout << "暂不支持其他条件判断" << endl;exit(-1);}
}
void create_asm(string file)
{//变量声明ofstream   wfile(file.c_str());if (!wfile.is_open())cout << "无法创建汇编文件" << endl;vector<Variable>::iterator  it_var;wfile << "ASSUME CS:codesg,DS:datasg" << endl;//数据段wfile << "datasg segment" << endl;for (it_var = var_table.begin(); it_var != var_table.end(); it_var++){wfile << "    " << it_var->var << " DB ";if (it_var->value != "")wfile << it_var->value << endl;elsewfile << "\'?\'" << endl;}wfile << "datasg ends" << endl;//代码段wfile << "codesg segment" << endl;wfile << "  start:" << endl;wfile << "    mov AX,datasg" << endl;wfile << "    mov DS,AX" << endl;vector<Target>::iterator     it;Target        tmp;for (it = target_code.begin(); it != target_code.end(); it++){//加减法转化if (it->op == "+" || it->op == "-")addsub_asm(wfile, it->dsf, it->op, it->dst, it->dsc);//乘法转换else if (it->op == "*")mul_asm(wfile, it->dsf, it->dst, it->dsc);//除法转换else if (it->op == "/")div_asm(wfile, it->dsf, it->dst, it->dsc);//赋值运算else if (it->op == "=")sign_asm(wfile, it->dsf, it->dst);//输出操作else if (it->op == "p")print_asm(wfile, it->dsf, it->mark);//if语法分析else if (it->op == "if"){if_asm(wfile, it->dst, it->dsc, it->mark, it->step);}else if (it->op == "else"){cout << "else 没有找到匹配的 if" << endl;exit(-1);}//跳转语句else if (it->op == "jmp"){wfile << "    JMP " << it->step << endl;}//跳转语句段标识else if (it->op == "pstep"){wfile << "  " << it->step << ":" << endl;}//其他else{cout << "编译器暂不支持该语法操作" << endl;exit(-1);}}//代码段结束wfile << "    mov ax,4C00H" << endl;wfile << "    int 21H" << endl;wfile << "codesg ends" << endl;wfile << "  end start" << endl;wfile.close();
}

asmfile,生成汇编文件的名称。

执行逻辑:

  • 检查源文件名是否为空,如果为空则报错退出。
  • 从源文件名中去掉扩展名,并添加.asm作为新文件名的扩展名。
  • 返回生成的汇编文件名。

add_target_code,将目标代码添加到目标代码向量中。

执行逻辑:

  • 创建一个临时的Target结构体,赋值各个字段。
  • 将该结构体添加到目标代码向量中。

addsub_asm,生成加法和减法的汇编代码。

执行逻辑:

  • 将目的操作数加载到寄存器BL。
  • 根据操作符执行加法或减法运算。
  • 将结果存储到目标操作数中。

mul_asm,生成乘法的汇编代码。

执行逻辑:

  • 将目的操作数加载到寄存器AL。
  • 将源操作数加载到寄存器BH。
  • 执行乘法运算,并将结果存储在AL中。
  • 将结果存储到目标操作数中。

div_asm,生成除法的汇编代码。

执行逻辑:

  • 将目的操作数加载到寄存器AL。
  • 执行符号扩展(CBW)。
  • 将源操作数加载到寄存器BL。
  • 执行除法运算,并将结果存储在AL中。
  • 将结果存储到目标操作数中。

sign_asm,生成赋值运算的汇编代码。

执行逻辑:

  • 将源操作数加载到寄存器BL。
  • 将结果存储到目标操作数中。

print_asm,生成输出操作的汇编代码。

执行逻辑:

  • 根据标记符(%c或%d)判断输出格式。
  • 如果是字符输出,加载字符到寄存器DL并调用中断21H。
  • 如果是整数输出,执行整数的转换和输出。
  • 如果是字符串输出,加载字符串地址到寄存器DX并调用中断21H。

if_asm,生成if语句的汇编代码。

执行逻辑:

  • 将目的操作数加载到寄存器AL。
  • 比较目的操作数和源操作数。
  • 根据条件标记符(>或<)生成相应的条件跳转指令。

create_asm,生成汇编文件。

执行逻辑:

  • 打开汇编文件进行写操作。
  • 写入数据段和代码段的开始部分。
  • 遍历目标代码向量,生成相应的汇编代码(加法、减法、乘法、除法、赋值、输出、if语句、跳转等)。
  • 写入代码段的结束部分,并关闭文件。

结果展示

测试文件如下:

main()
{int a,b;a = 4;b = 2;if(a>b){a = a+1;}if(b<1){b = b-1;}else{b = b+1;}printf("a=%d b=%d",a,b);
}

8086汇编如下:

ASSUME CS:codesg,DS:datasg
datasg segmenta DB '?'b DB '?'tmpB DB '?'tmpC DB '?'tmpD DB '?'tmpE DB 'a=$'tmpF DB ' b=$'
datasg ends
codesg segmentstart:mov AX,datasgmov DS,AXmov BL,4mov a,BLmov BL,2mov b,BLmov AL,aCMP AL,bJG stepBJMP stepCstepB:mov BL,aadd BL,1mov tmpB,BLmov BL,tmpBmov a,BLJMP stepCstepC:mov AL,bCMP AL,1JL stepDmov BL,badd BL,1mov tmpC,BLmov BL,tmpCmov b,BLJMP stepEstepD:mov BL,bsub BL,1mov tmpD,BLmov BL,tmpDmov b,BLJMP stepEstepE:LEA DX,tmpEmov AH,09int 21Hmov AL,aCBWmov BL,10DIV BLmov BH,AHadd BH,30Hadd AL,30HCMP AL,48JE stepGstepF:mov DL,ALmov AH,2int 21HstepG:mov DL,BHmov AH,2int 21HLEA DX,tmpFmov AH,09int 21Hmov AL,bCBWmov BL,10DIV BLmov BH,AHadd BH,30Hadd AL,30HCMP AL,48JE stepIstepH:mov DL,ALmov AH,2int 21HstepI:mov DL,BHmov AH,2int 21Hmov ax,4C00Hint 21H
codesg endsend start

获取方式

点这里 只需要一点点辛苦费,不需要你写材料 报告。

在这里插入图片描述

这篇关于编译原理项目——C++实现C语言编译器输出为8086级汇编(代码/报告材料)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1136937

相关文章

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

【C++ Primer Plus习题】13.4

大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: main.cpp #include <iostream>#include "port.h"int main() {Port p1;Port p2("Abc", "Bcc", 30);std::cout <<

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

C++包装器

包装器 在 C++ 中,“包装器”通常指的是一种设计模式或编程技巧,用于封装其他代码或对象,使其更易于使用、管理或扩展。包装器的概念在编程中非常普遍,可以用于函数、类、库等多个方面。下面是几个常见的 “包装器” 类型: 1. 函数包装器 函数包装器用于封装一个或多个函数,使其接口更统一或更便于调用。例如,std::function 是一个通用的函数包装器,它可以存储任意可调用对象(函数、函数

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi