(2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记

2023-10-21 20:40

本文主要是介绍(2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第3章: 语法分析

  • 语法(syntax): 组合单词以形成词组、从句或句子的方法。
  • Lex 用一个符号代替某个正则表达式的缩写机制
  • 词法分析器Lex实现缩写形式的正则表达式:在将正则表达式翻译成有限自动机前,用digits右部的式子替代正则表达式出现的所有digits
  • 但这种方法不适用于sum-expr语言
  • 我们需要递归的续写形式
  • 提出上下文无关文法

3.1: 上下文无关文法

  1. 语言由文法描述,文法有产生式结合(production),产生式右部有0至多个符号
  2. 终结符:来自该语言字符串字母表中的单词
  3. 非终结符
  4. 开始符号(start symbol):区别对待的非终结符
3.1.1:推导
  1. 最左推导(leftmost derivation):总是扩展最左边非终结符的推导
  2. 最右推导(rightmost derivation)
3.1.2:语法分析树(parse tree)
  1. 与推导相结合
3.1.3:二义性文法(ambiguous)
  1. 二义性:一个文法能够推导出具有两棵不同语法树的句子
  2. 编译器利用语法分析树来推导语义
  3. 二义性会给编译带来问题,所以文法需要是无二义性的
  4. 表达式(expression),项(term),因子(factor)
  5. 所以语言需要找到无二义性的文法表示,否则此语言不能作为程序设计语言
3.1.4:文件结束符
  1. 用$符号来表示文件结束
  2. 设S是一文法的开始符号
  3. 为了指明 >S

3.2:预测分析

  1. 用递归下降(recursive descent)算法对文法进行分析
  2. 算法实质:将每一个文法产生式转变成递归函数的一个字句
  3. 递归下降分析也称为预测(predictive)分析
  4. 预测分析只适合于每个子表达式的第一个终结符号能够为产生式的选择提供足够信息的那种文法 
3.2.1:FIRST集合和FOLLOW集合
  1. 给定一个由终结符和非终结符组成的字符串y,FIRST(y)是从y可以推导出的任意字符串中的开头终结符组成的集合
  2. 如果两个不同的产生式X->y1和X->y2具有相同的左部符号,并且它们的右部有重叠的FIRST集合,则这个文法不能用预测分析法分析
  3. 因为如果存在某个终结符I,它既在FIRST(y1)中,又在FIRST(y2)中,则当输入单词为I时,递归下降分析器中与X对应的函数将不知道该怎么做
  4. 如果X-> ,Y-> ;那FIRST(XYZ)一定包含FIRST(Z)
  5. 所以,在计算FIRST集合时,我们必须跟踪能产生空串的符号,这种符号称为可为空的nullable符号,同时还必须跟踪有可能跟随在可为空符号之后的其他符号
  6. FOLLOW(X)可直接跟随于X之后的终结符集合
  7. nullable概念
  8. 算法:FIRST、FOLLOW和nullable的迭代计算
  9. 基于文法3-6使用算法,通过每一步迭代来理解运用算法
    • 文法:
    • 这里写图片描述
    • 初始:
    • 这里写图片描述
    • 第一次迭代:
    • 这里写图片描述 
    • 第二次迭代:
    • 这里写图片描述 
    • 第三次迭代没有发现新的信息,于是算法终止
3.2.2:构造一个预测分析器
  1. 考虑一个递归下降器。非终结符X的分析函数对X的每个产生式都有一个子句,因此该函数必须根据下一个输入单词T来选择其中的一个子句。如果能够为每一个(X,T)选择出正确的产生式,我们就能够写出这个递归下降分析器。我们需要的所有信息可以用一张关于产生式的二维表来表示,此表以文法的非终结符X和终结符T作为索引,这张表称为预测分析表
  2. 预测分析表多重定义项的出现可能会导致二义性,我们需要一个无二义性的文法
  3. 若一个文法的预测分析表不含多重定义的项,则称为LL(1)文法
  4. LL(1)代表从左至右分析、最左推导和超前查看一个符号(Left-to-right parse, Leftmost-derivation,1-symbol lookahead)
  5. LL(k)分析表:表的行是非终结符,列是k个终结符的每一种序列
  6. 递归下降分析器完成起工作只需查看下一个输入单词,从不需要超前查看多于一个以上的单词
3.2.3:消除左递归
  1. 左递归:E作为E的产生式的第一个左部符号出现
    这里写图片描述
  2. 右递归(引入非终结符E’)
    这里写图片描述
    1. 为了消除左递归,利用右递归来重写产生式
3.2.4:提取左因子
  1. 当一个非终结符的两个产生式以相同的符号开始时也会发生类似的问题
    这里写图片描述
  2. 对文法提取左因子,即取出非公共的尾部
    这里写图片描述
3.2.5:错误恢复
  1. 有了预测分析表,便很容易写出递归下降分析器
  2. 错误恢复就是通过删除、替代或插入单词,来寻找一个与那个单词串相似的句子
未完待续

这篇关于(2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/256851

相关文章

Java编译生成多个.class文件的原理和作用

《Java编译生成多个.class文件的原理和作用》作为一名经验丰富的开发者,在Java项目中执行编译后,可能会发现一个.java源文件有时会产生多个.class文件,从技术实现层面详细剖析这一现象... 目录一、内部类机制与.class文件生成成员内部类(常规内部类)局部内部类(方法内部类)匿名内部类二、

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

C语言中的数据类型强制转换

《C语言中的数据类型强制转换》:本文主要介绍C语言中的数据类型强制转换方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C语言数据类型强制转换自动转换强制转换类型总结C语言数据类型强制转换强制类型转换:是通过类型转换运算来实现的,主要的数据类型转换分为自动转换

利用Go语言开发文件操作工具轻松处理所有文件

《利用Go语言开发文件操作工具轻松处理所有文件》在后端开发中,文件操作是一个非常常见但又容易出错的场景,本文小编要向大家介绍一个强大的Go语言文件操作工具库,它能帮你轻松处理各种文件操作场景... 目录为什么需要这个工具?核心功能详解1. 文件/目录存javascript在性检查2. 批量创建目录3. 文件

C语言实现两个变量值交换的三种方式

《C语言实现两个变量值交换的三种方式》两个变量值的交换是编程中最常见的问题之一,以下将介绍三种变量的交换方式,其中第一种方式是最常用也是最实用的,后两种方式一般只在特殊限制下使用,需要的朋友可以参考下... 目录1.使用临时变量(推荐)2.相加和相减的方式(值较大时可能丢失数据)3.按位异或运算1.使用临时

使用C语言实现交换整数的奇数位和偶数位

《使用C语言实现交换整数的奇数位和偶数位》在C语言中,要交换一个整数的二进制位中的奇数位和偶数位,重点需要理解位操作,当我们谈论二进制位的奇数位和偶数位时,我们是指从右到左数的位置,本文给大家介绍了使... 目录一、问题描述二、解决思路三、函数实现四、宏实现五、总结一、问题描述使用C语言代码实现:将一个整

C语言字符函数和字符串函数示例详解

《C语言字符函数和字符串函数示例详解》本文详细介绍了C语言中字符分类函数、字符转换函数及字符串操作函数的使用方法,并通过示例代码展示了如何实现这些功能,通过这些内容,读者可以深入理解并掌握C语言中的字... 目录一、字符分类函数二、字符转换函数三、strlen的使用和模拟实现3.1strlen函数3.2st

Go语言中最便捷的http请求包resty的使用详解

《Go语言中最便捷的http请求包resty的使用详解》go语言虽然自身就有net/http包,但是说实话用起来没那么好用,resty包是go语言中一个非常受欢迎的http请求处理包,下面我们一起来学... 目录安装一、一个简单的get二、带查询参数三、设置请求头、body四、设置表单数据五、处理响应六、超

JAVA封装多线程实现的方式及原理

《JAVA封装多线程实现的方式及原理》:本文主要介绍Java中封装多线程的原理和常见方式,通过封装可以简化多线程的使用,提高安全性,并增强代码的可维护性和可扩展性,需要的朋友可以参考下... 目录前言一、封装的目标二、常见的封装方式及原理总结前言在 Java 中,封装多线程的原理主要围绕着将多线程相关的操