(2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记

2023-10-21 20:40

本文主要是介绍(2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第3章: 语法分析

  • 语法(syntax): 组合单词以形成词组、从句或句子的方法。
  • Lex 用一个符号代替某个正则表达式的缩写机制
  • 词法分析器Lex实现缩写形式的正则表达式:在将正则表达式翻译成有限自动机前,用digits右部的式子替代正则表达式出现的所有digits
  • 但这种方法不适用于sum-expr语言
  • 我们需要递归的续写形式
  • 提出上下文无关文法

3.1: 上下文无关文法

  1. 语言由文法描述,文法有产生式结合(production),产生式右部有0至多个符号
  2. 终结符:来自该语言字符串字母表中的单词
  3. 非终结符
  4. 开始符号(start symbol):区别对待的非终结符
3.1.1:推导
  1. 最左推导(leftmost derivation):总是扩展最左边非终结符的推导
  2. 最右推导(rightmost derivation)
3.1.2:语法分析树(parse tree)
  1. 与推导相结合
3.1.3:二义性文法(ambiguous)
  1. 二义性:一个文法能够推导出具有两棵不同语法树的句子
  2. 编译器利用语法分析树来推导语义
  3. 二义性会给编译带来问题,所以文法需要是无二义性的
  4. 表达式(expression),项(term),因子(factor)
  5. 所以语言需要找到无二义性的文法表示,否则此语言不能作为程序设计语言
3.1.4:文件结束符
  1. 用$符号来表示文件结束
  2. 设S是一文法的开始符号
  3. 为了指明 >S

3.2:预测分析

  1. 用递归下降(recursive descent)算法对文法进行分析
  2. 算法实质:将每一个文法产生式转变成递归函数的一个字句
  3. 递归下降分析也称为预测(predictive)分析
  4. 预测分析只适合于每个子表达式的第一个终结符号能够为产生式的选择提供足够信息的那种文法 
3.2.1:FIRST集合和FOLLOW集合
  1. 给定一个由终结符和非终结符组成的字符串y,FIRST(y)是从y可以推导出的任意字符串中的开头终结符组成的集合
  2. 如果两个不同的产生式X->y1和X->y2具有相同的左部符号,并且它们的右部有重叠的FIRST集合,则这个文法不能用预测分析法分析
  3. 因为如果存在某个终结符I,它既在FIRST(y1)中,又在FIRST(y2)中,则当输入单词为I时,递归下降分析器中与X对应的函数将不知道该怎么做
  4. 如果X-> ,Y-> ;那FIRST(XYZ)一定包含FIRST(Z)
  5. 所以,在计算FIRST集合时,我们必须跟踪能产生空串的符号,这种符号称为可为空的nullable符号,同时还必须跟踪有可能跟随在可为空符号之后的其他符号
  6. FOLLOW(X)可直接跟随于X之后的终结符集合
  7. nullable概念
  8. 算法:FIRST、FOLLOW和nullable的迭代计算
  9. 基于文法3-6使用算法,通过每一步迭代来理解运用算法
    • 文法:
    • 这里写图片描述
    • 初始:
    • 这里写图片描述
    • 第一次迭代:
    • 这里写图片描述 
    • 第二次迭代:
    • 这里写图片描述 
    • 第三次迭代没有发现新的信息,于是算法终止
3.2.2:构造一个预测分析器
  1. 考虑一个递归下降器。非终结符X的分析函数对X的每个产生式都有一个子句,因此该函数必须根据下一个输入单词T来选择其中的一个子句。如果能够为每一个(X,T)选择出正确的产生式,我们就能够写出这个递归下降分析器。我们需要的所有信息可以用一张关于产生式的二维表来表示,此表以文法的非终结符X和终结符T作为索引,这张表称为预测分析表
  2. 预测分析表多重定义项的出现可能会导致二义性,我们需要一个无二义性的文法
  3. 若一个文法的预测分析表不含多重定义的项,则称为LL(1)文法
  4. LL(1)代表从左至右分析、最左推导和超前查看一个符号(Left-to-right parse, Leftmost-derivation,1-symbol lookahead)
  5. LL(k)分析表:表的行是非终结符,列是k个终结符的每一种序列
  6. 递归下降分析器完成起工作只需查看下一个输入单词,从不需要超前查看多于一个以上的单词
3.2.3:消除左递归
  1. 左递归:E作为E的产生式的第一个左部符号出现
    这里写图片描述
  2. 右递归(引入非终结符E’)
    这里写图片描述
    1. 为了消除左递归,利用右递归来重写产生式
3.2.4:提取左因子
  1. 当一个非终结符的两个产生式以相同的符号开始时也会发生类似的问题
    这里写图片描述
  2. 对文法提取左因子,即取出非公共的尾部
    这里写图片描述
3.2.5:错误恢复
  1. 有了预测分析表,便很容易写出递归下降分析器
  2. 错误恢复就是通过删除、替代或插入单词,来寻找一个与那个单词串相似的句子
未完待续

这篇关于(2017/3/19)现代编译原理C语言描述(虎书)chapter 3学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/256851

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

hdu4407(容斥原理)

题意:给一串数字1,2,......n,两个操作:1、修改第k个数字,2、查询区间[l,r]中与n互质的数之和。 解题思路:咱一看,像线段树,但是如果用线段树做,那么每个区间一定要记录所有的素因子,这样会超内存。然后我就做不来了。后来看了题解,原来是用容斥原理来做的。还记得这道题目吗?求区间[1,r]中与p互质的数的个数,如果不会的话就先去做那题吧。现在这题是求区间[l,r]中与n互质的数的和

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验