中文词法分析的简单程序

2024-04-14 14:08

本文主要是介绍中文词法分析的简单程序,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

VC 6.0 下编译通过  disc 为辞典   expression 为输入的短语

 

// Code.cpp : Defines the entry point for the console application.
//

#include "stdafx.h"
#include "iostream.h"
#include "string.h"
#include "windows.h"

int CountWord(char* words);  //计 算有多少个字符

struct dict
{
 char syn[8],word[6];
 int scode,wcode;
} dic[19];

int main(int argc, char* argv[])
{
 strcpy(dic[0].syn,"祈使动词");
    dic[0].scode=0;
 strcpy(dic[0].word,"请");
    dic[0].wcode=0;
    strcpy(dic[1].syn,"祈使动词");
    dic[1].scode=0;
 strcpy(dic[1].word,"把");
    dic[1].wcode=1;
    strcpy(dic[2].syn,"代词");
 dic[2].scode=1;
 strcpy(dic[2].word,"你");
 dic[2].wcode=0;
 strcpy(dic[3].syn,"动词");
 dic[3].scode=2;
 strcpy(dic[3].word,"走");
 dic[3].wcode=0;
 strcpy(dic[4].syn,"动词");
 dic[4].scode=2;
 strcpy(dic[4].word,"跑");
 dic[4].wcode=1;
 strcpy(dic[5].syn,"动词");
 dic[5].scode=2;
 strcpy(dic[5].word,"跳");
 dic[5].wcode=2;
 strcpy(dic[6].syn,"动词");
 dic[6].scode=2;
 strcpy(dic[6].word,"转");
 dic[6].wcode=3;
 strcpy(dic[7].syn,"动词");
 dic[7].scode=2;
 strcpy(dic[7].word,"抬");
 dic[7].wcode=4;
 strcpy(dic[8].syn,"方向词");
 dic[8].scode=3;
 strcpy(dic[8].word,"向左");
 dic[8].wcode=0;
 strcpy(dic[9].syn,"方向词");
 dic[9].scode=3;
 strcpy(dic[9].word,"向右");
 dic[9].wcode=1;
 strcpy(dic[10].syn,"方位词");
 dic[10].scode=4;
 strcpy(dic[10].word,"向前");
 dic[10].wcode=0;
 strcpy(dic[11].syn,"方位词");
 dic[11].scode=4;
 strcpy(dic[11].word,"侧");
 dic[11].wcode=1;
 strcpy(dic[12].syn,"名词");
 dic[12].scode=5;
 strcpy(dic[12].word,"左手");
 dic[12].wcode=0;
 strcpy(dic[13].syn,"名词");
 dic[13].scode=5;
 strcpy(dic[13].word,"右手");
 dic[13].wcode=1;
 strcpy(dic[14].syn,"名词");
 dic[14].scode=5;
 strcpy(dic[14].word,"左腿");
 dic[14].wcode=2;
 strcpy(dic[15].syn,"名词");
 dic[15].scode=5;
 strcpy(dic[15].word,"右腿");
 dic[15].wcode=3;
 strcpy(dic[16].syn,"副词");
 dic[16].scode=6;
 strcpy(dic[16].word,"快");
 dic[16].wcode=0;
 strcpy(dic[17].syn,"副词");
 dic[17].scode=6;
 strcpy(dic[17].word,"慢");
 dic[17].wcode=1;
 strcpy(dic[18].syn,"其他词");
 dic[18].scode=7;
 strcpy(dic[18].word,"起来");
 dic[18].wcode=0;
//--Init Data End
///

 char expression[30],phrase[40];  //输 入句子的分词程序
 char *p1,*p2;      //*
 PWORD pw_exp1,pw_exp2,pw_old;   //temp   pw_old Can RollBack
 int  n_WordNub = 0,n_InputNub = 0;   //*
 
 strcpy(expression,"请你向前走快抬左手侧左腿");
 
 for(int i=0; i<40; i++)
  phrase[i] = ' ' ;
 phrase[39] = '/0';

 p2 = expression;
 p1 = phrase;
  pw_old = pw_exp1 = (PWORD)p2;  //Init

//计 算输入的字数以确定查询的次数
 n_InputNub = CountWord(p2);
 
    printf("分析结果: /n");

    for(int nub=0; nub<n_InputNub; nub++) //按 照输入的字数来找
 {
  for(int i=0; i<19; i++)  // 查询词表
  {
   pw_exp2 = (PWORD)dic[i].word;
   for(int j=0; j<CountWord(dic[i].word); j++) //比 较单词
   {
    if (*pw_exp1 == *pw_exp2)
    {
     pw_exp1++;
     pw_exp2++;
    }
    else
    {
     pw_exp1 = pw_old;  //RollBack
    }
   }

   if ((char*)pw_exp1 != p2)  //词 表找到单词
   {
    for(int x=0; x<((char*)pw_exp1 - p2); x++)  //存 储识别单词
    {
     *p1 = *(p2+x);
     p1++;
    }
    *p1 = '/';  //填 入分隔符
    p1++;
    p2 =(char*) pw_exp1;   //查 询下一个
    pw_old = pw_exp1;      //Can RollBack
   }

   if (*p2 == '/0') //查 完了!
   {
    break;
   }

  }
 }

//查 询完辞典!
 if( ((char*)pw_exp1 == p2) && (*p2 != '/0') ) //词 表里没有找到
 {
  cout<<"不可识别的短语!";
 }
 else{
  cout<<"识别完毕! :" ;
  cout<<phrase;}
 
 return 0;
}

int CountWord(char* words)
{
 int n = 0;
 while(*words != '/0')
 {
  words++;
  n++;
 }
 return int(n/2);
}

这篇关于中文词法分析的简单程序的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/903190

相关文章

python获取指定名字的程序的文件路径的两种方法

《python获取指定名字的程序的文件路径的两种方法》本文主要介绍了python获取指定名字的程序的文件路径的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要... 最近在做项目,需要用到给定一个程序名字就可以自动获取到这个程序在Windows系统下的绝对路径,以下

Python 基于http.server模块实现简单http服务的代码举例

《Python基于http.server模块实现简单http服务的代码举例》Pythonhttp.server模块通过继承BaseHTTPRequestHandler处理HTTP请求,使用Threa... 目录测试环境代码实现相关介绍模块简介类及相关函数简介参考链接测试环境win11专业版python

基于Python编写自动化邮件发送程序(进阶版)

《基于Python编写自动化邮件发送程序(进阶版)》在数字化时代,自动化邮件发送功能已成为企业和个人提升工作效率的重要工具,本文将使用Python编写一个简单的自动化邮件发送程序,希望对大家有所帮助... 目录理解SMTP协议基础配置开发环境构建邮件发送函数核心逻辑实现完整发送流程添加附件支持功能实现htm

C#控制台程序同步调用WebApi实现方式

《C#控制台程序同步调用WebApi实现方式》控制台程序作为Job时,需同步调用WebApi以确保获取返回结果后执行后续操作,否则会引发TaskCanceledException异常,同步处理可避免异... 目录同步调用WebApi方法Cls001类里面的写法总结控制台程序一般当作Job使用,有时候需要控制

python连接sqlite3简单用法完整例子

《python连接sqlite3简单用法完整例子》SQLite3是一个内置的Python模块,可以通过Python的标准库轻松地使用,无需进行额外安装和配置,:本文主要介绍python连接sqli... 目录1. 连接到数据库2. 创建游标对象3. 创建表4. 插入数据5. 查询数据6. 更新数据7. 删除

Jenkins的安装与简单配置过程

《Jenkins的安装与简单配置过程》本文简述Jenkins在CentOS7.3上安装流程,包括Java环境配置、RPM包安装、修改JENKINS_HOME路径及权限、启动服务、插件安装与系统管理设置... 目录www.chinasem.cnJenkins安装访问并配置JenkinsJenkins配置邮件通知

Android 缓存日志Logcat导出与分析最佳实践

《Android缓存日志Logcat导出与分析最佳实践》本文全面介绍AndroidLogcat缓存日志的导出与分析方法,涵盖按进程、缓冲区类型及日志级别过滤,自动化工具使用,常见问题解决方案和最佳实... 目录android 缓存日志(Logcat)导出与分析全攻略为什么要导出缓存日志?按需过滤导出1. 按

Linux中的HTTPS协议原理分析

《Linux中的HTTPS协议原理分析》文章解释了HTTPS的必要性:HTTP明文传输易被篡改和劫持,HTTPS通过非对称加密协商对称密钥、CA证书认证和混合加密机制,有效防范中间人攻击,保障通信安全... 目录一、什么是加密和解密?二、为什么需要加密?三、常见的加密方式3.1 对称加密3.2非对称加密四、

MySQL中读写分离方案对比分析与选型建议

《MySQL中读写分离方案对比分析与选型建议》MySQL读写分离是提升数据库可用性和性能的常见手段,本文将围绕现实生产环境中常见的几种读写分离模式进行系统对比,希望对大家有所帮助... 目录一、问题背景介绍二、多种解决方案对比2.1 原生mysql主从复制2.2 Proxy层中间件:ProxySQL2.3

Python yield与yield from的简单使用方式

《Pythonyield与yieldfrom的简单使用方式》生成器通过yield定义,可在处理I/O时暂停执行并返回部分结果,待其他任务完成后继续,yieldfrom用于将一个生成器的值传递给另一... 目录python yield与yield from的使用代码结构总结Python yield与yield