第3章 文法和语言(二)

2024-05-06 03:08
文章标签 语言 文法

本文主要是介绍第3章 文法和语言(二),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

四、文法和语言的形式定义


1、文法的形式定义
1)规则(重写规则、产生式或生成式):是一个有序对(α,β)。记为α→β或
    α∷=β,其中α∈V+,β∈V* 。
    α称为规则的左部(或生成式的左部)。
    β称为规则的右部(或生成式的右部)。

2)文法G[S]:文法为四元组(VN,VT,P,S)
     VN :非终结符集
     VT :终结符集
     P:产生式(规则)集合
     S:开始符号(识别符号)
     VN、VT 和 P 是非空有穷集。S 至少在一条规则中作为左部出现。
     VN∩VT=φ, S∈VN
     V=VN∪VT,称为文法G的字母表(字汇表)

例: 文法G=(VN,VT,P,S)
VN = { S },  VT ={ 0, 1 }
P={ S→0S1,  S→01 }
S为开始符号


例:   文法G=(VN,VT,P,S)
VN ={标识符,字母,数字}
VT ={a,b,c,…x,y,z,0,1,…,9}
P={<标识符>→<字母>
    <标识符>→<标识符><字母>
<标识符>→<标识符><数字>
    <字母>→a,…, <字母>→z
    <数字>→0,…, <数字>→9}
S=<标识符>


习惯上只将产生式写出。并有如下约定:

  • 第一条产生式的左部是开始符号
  • 用尖括号括起的是非终结符,否则为终结符。或者大写字母表示非终结符,小写字母表示终结符
  • G可写成G[S],其中S是开始符号
例:文法G=(VN,VT,P,S)
VN = { S },  VT ={ 0, 1 }
P={ S→0S1,  S→01 }
S为开始符号

  • 可写成:
   G:S→0S1
 S→01
  • 或写成:
   G[S]:S→0S1
             S→01

3、推导的定义
1)直接推导“=>”
  α→β是文法G的产生式,γ,δ∈V*,若将α→β作用于  v=γαδ得到 w=γβδ,则记作 vw,读作v(应用规则α→β)直接产生w(w是v的直接推导或w直接归约到v)

例:G:S→0S1,S→01
直接推导:
0S1=>0011(v=0S1,w=0011,使用规则S→01,γ=0,δ=1)
S=>0S1(v=S,w=0S1,使用规则S→0S1,γ=ε,δ=ε)
0S1=>00S11(v=0S1,w=00S11,使用规则S→0S1,γ=0,δ=1)

例   文法G=(VN,VT,P,S)
VN ={标识符,字母,数字}
VT ={a,b,c,…x,y,z,0,1,…,9}
P={<标识符>→<字母>
    <标识符>→<标识符><字母>
<标识符>→<标识符><数字>
        <字母>→a,…, <字母>→z
            <数字>→0,…,<数字>→9}
S=<标识符>

指出下面直接推导所使用的规则:
<标识符> =><标识符><字母>
<标识符><字母><数字> => <字母><字母><数字>
abc<数字> =>abc5

2)长度为n的推导(有限次推导)
   若存在v =w0 =>w1 =>... =>wn=w, (n>0),
   则称v推导出w(或w归约到v).  记作 v=+>w。
3)若有v =+>w,或v=w,则记为v=*>w


例:G: S→0S1, S→01
0S1 =>00S11=>000S111 =>00001111  即 0S1=+>00001111
也记作 0S1=*>00001111


4、文法的句型、句子的定义

1)句型
设G[S]是一文法,如果符号串x是从识别符号推导出来的,即S=*>x,则称x是文法G[S]的句型。


2)句子
x仅由终结符号组成(即S=*>x,且x∈VT*),则称x是G[S]的句子。


例:G: S→0S1, S→01
 S =>0S1 =>00S11=>000S111 =>00001111


3)语言

 由文法G产生的所有句子组成的集合叫做文法G所成描述的语言,记为L(G)。


L(G)={x|S=*>x,其中S为文法的开始符号,且x ∈VT*}


例:G: S→0S1, S→01
                L(G)={0n1n|n≥1}
   注:产生式中含有递归式,产生的句子是无穷的


例:文法G[S]:
(1)S→dAB
(2)A→aA
(3)A→a
(4)B→Bb
(5)B→ε


  1. L(G)=?
  2. G生成的每个串都在L(G)中
  3. L(G)中的每个串确实能被G生成

例:构造生成语言L={a^n b^n e^i | n>=1,i>=0}的文法。


分析:n≧1,所以必须用递归规则。a和b的个数 一样多,但c的个数不同,所以将生成含 a,b的部分与生成含e的部分分开,A生成ab,B生成e.
          G[Z]:Z→AB
               A→aAb|ab
               B→eB|ε


4)文法的等价


若L(G1)=L(G2),则称文法G1和G2是等价的。


如文法G1[A]:A→0R 与 G2[S]:S→0S1 等价
             A→01           S→01
             R→A1






这篇关于第3章 文法和语言(二)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/963314

相关文章

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

C语言:柔性数组

数组定义 柔性数组 err int arr[0] = {0}; // ERROR 柔性数组 // 常见struct Test{int len;char arr[1024];} // 柔性数组struct Test{int len;char arr[0];}struct Test *t;t = malloc(sizeof(Test) + 11);strcpy(t->arr,

C语言指针入门 《C语言非常道》

C语言指针入门 《C语言非常道》 作为一个程序员,我接触 C 语言有十年了。有的朋友让我推荐 C 语言的参考书,我不敢乱推荐,尤其是国内作者写的书,往往七拼八凑,漏洞百出。 但是,李忠老师的《C语言非常道》值得一读。对了,李老师有个官网,网址是: 李忠老师官网 最棒的是,有配套的教学视频,可以试看。 试看点这里 接下来言归正传,讲解指针。以下内容很多都参考了李忠老师的《C语言非

C 语言基础之数组

文章目录 什么是数组数组变量的声明多维数组 什么是数组 数组,顾名思义,就是一组数。 假如班上有 30 个同学,让你编程统计每个人的分数,求最高分、最低分、平均分等。如果不知道数组,你只能这样写代码: int ZhangSan_score = 95;int LiSi_score = 90;......int LiuDong_score = 100;int Zhou

C 语言的基本数据类型

C 语言的基本数据类型 注:本文面向 C 语言初学者,如果你是熟手,那就不用看了。 有人问我,char、short、int、long、float、double 等这些关键字到底是什么意思,如果说他们是数据类型的话,那么为啥有这么多数据类型呢? 如果写了一句: int a; 那么执行的时候在内存中会有什么变化呢? 橡皮泥大家都玩过吧,一般你买橡皮泥的时候,店家会赠送一些模板。 上

linux中使用rust语言在不同进程之间通信

第一种:使用mmap映射相同文件 fn main() {let pid = std::process::id();println!(