通用句法生成器和线图分析法

2023-12-10 14:18

本文主要是介绍通用句法生成器和线图分析法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

自然语言处理的形式模型笔记


通用句法生成器:(General Syntactic Processer,GSP)基本数据结构是线图(chart)。因为树形图只能表示支配关系,而不能很好的表示前于关系。后来有被扩展成活性线图,以后线图是指活性线图。如下图所示:





活性线图中的两个规则,

1、在线图中容许从某个点出发,中间不经过其它结点,又重新返回到该结点的圈出现,但不允许经过其它结点后再会到该结点的出现。

2、点规则:线图的边上的标记,不仅可以是简单的范畴,也可以是语法规则。这样的规则的右部的符号串中可以加圆点,圆点后面的部分表示没有证实的假设。圆点后面为空表示非活性边,否则为活性边。

活性线图的一条边可以用五元组来表示:
(<start>,<finish>,<label>--><found>.<tofind>)
其中:<start>表示起点index,是个整数。
<finish>表示重点index,是个整数。
<label>表示标记,是一个范畴。
<found>表示分析中已经证实的部分,是一个范畴系列。
<tofind>表示分析中尚未证实的部分,是一个范畴系列。

例如:(0,2,S-->NP . VP)表示活性线图的一条边,起点是结点0,终点是结点2,标记S在分析中已经被证实的部分是NP,尚未证实的部分是VP。

活性线图分析的基本原则:
如果一条活性边遇到一条非活性边,而且,这条非活性边的标记上 的范畴满足活性边的要求,那么,就可以在线图中添加一条边,横跨在活性边和非活性边上。如上图的(1)+(2)-->(3)。

活性线图的启动条件:
有一条非活性边和一条与它相关的活性边能按基本规则运行即可启动。通常我们通过查词典的办法,把单词在词典中有关的范畴信息记录到线图的边上,从而形成非活性边。如:(0,1,Det-->[the].)(1,2,N-->[boy].)(2,3,V-->[hit].)(3,4,Det-->[the].)(4,5,N-->[dog].),假如又有规则NP-->Det N,则可造出活性边(0,0,NP-->.Det N),则可以按照上图中的(1)+(2)--->(3)启动一步一步的分析了。


这篇关于通用句法生成器和线图分析法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/477345

相关文章

Mybatis官方生成器的使用方式

《Mybatis官方生成器的使用方式》本文详细介绍了MyBatisGenerator(MBG)的使用方法,通过实际代码示例展示了如何配置Maven插件来自动化生成MyBatis项目所需的实体类、Map... 目录1. MyBATis Generator 简介2. MyBatis Generator 的功能3

详解Python中通用工具类与异常处理

《详解Python中通用工具类与异常处理》在Python开发中,编写可重用的工具类和通用的异常处理机制是提高代码质量和开发效率的关键,本文将介绍如何将特定的异常类改写为更通用的ValidationEx... 目录1. 通用异常类:ValidationException2. 通用工具类:Utils3. 示例文

j2EE通用jar包的作用

原文:http://blog.sina.com.cn/s/blog_610901710101kx37.html IKIKAnalyzer3.2.8.jar // 分词器 ant-junit4.jar // ant junit antlr-2.7.6.jar // 没有此包,hibernate不会执行hql语句。并且会报NoClassDefFoundError: antlr

通用内存快照裁剪压缩库Tailor介绍及源码分析(一)

背景 我们知道内存快照是治理 OOM 问题及其他类型的内存问题的重要数据源,内存快照中保存了进程虚拟机的完整的堆内存数据,很多时候也是调查其他类型异常的重要参考。但是dump出来的堆转储文件.hprof往往很大,以 LargeHeap 应用为例,其 OOM 时的内存快照大小通常在512M左右,要有效的存储和获取都是一个问题。 线下拿到hprof文件相对容易,也可以预防OOM,但覆盖的场景十分有

纸牌函数生成器

此模板用来生成纸牌类的测试数据,本人手打,不合理或缀余的地方希望大神指出。 T=10000(测试数据组数), t (两摞相等的牌,每摞牌的数量); 每张牌用A,2~9,T,J,Q,K;表示牌面大小; 用S,H,C,D;表示花色。 共52张牌。 #include<stdio.h>#include<time.h>#include<stdlib.h>#include<string.

SpringBoot中利用EasyExcel+aop实现一个通用Excel导出功能

一、结果展示 主要功能:可以根据前端传递的参数,导出指定列、指定行 1.1 案例一 前端页面 传递参数 {"excelName": "导出用户信息1725738666946","sheetName": "导出用户信息","fieldList": [{"fieldName": "userId","fieldDesc": "用户id"},{"fieldName": "age","fieldDe

【生日视频制作】酒吧一群美女车展模特大屏幕视频改字AE模板修改文字软件生成器教程特效素材【AE模板】

生日视频制作教程酒吧一群美女车展模特大屏幕视频改字AE模板修改文字特效广软件告生成神器素材祝福玩法AE模板工程 怎么如何做的【生日视频制作】酒吧一群美女车展模特大屏幕视频改字AE模板修改文字软件生成器教程特效素材【AE模板】 生日视频制作步骤: 安装AE软件 下载AE模板 把AE模板导入AE软件 修改图片或文字 渲染出视频

数据结构(邓俊辉)学习笔记】排序 5——选取:通用算法

文章目录 1. 尝试2. quickSelect3.linearSelect:算法4. linearSelect:性能分析5. linearSelect:性能分析B6. linearSelect:性能分析C 1. 尝试 在讨论过众数以及特殊情况下中位数的计算方法以后,接下来针对一般性的选取问题,介绍优化的通用算法。 既然选取问题的查找目标就是在整个数据集中按大小次序秩为 k

[Python]生成器和yield关键字

生成器和yield关键字 1.生成器介绍: 概述: ​ 它指的是 generator, 类似于以前学过的: 列表推导式, 集合推导式, 字典推导式… 作用: ​ 降低资源消耗, 快速(批量)生成数据. 实现方式: ​ 1.推导式写法. my_generator = (i for i in range(5)) ​ 2.yield写法. def get_generator():for i