使用Java调用中科院分词NLPIR/ICTCLAS

2024-08-30 02:32

本文主要是介绍使用Java调用中科院分词NLPIR/ICTCLAS,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

官方地址:http://ictclas.nlpir.org/

1.       下载NLPIR/ICTCLAS2015分词(最新版本)地址:http://ictclas.nlpir.org/newsdownloads?DocId=389

2.       下载NLPIR-ICTCLAS2013-Win-32-JNIu0416)地址:http://ictclas.nlpir.org/newsdownloads?DocId=354(我电脑是64win7,用的是32JDK32Eclipse,如果是64JDK要下载64位的)

3.       下载后将两个压缩包解压

4.       创建Java工程

5.       20141230101836_ICTCLAS2015\ICTCLAS2015\bin\ICTCLAS2015中的NLPIR.dll文件复制到Java工程的跟目录

6.       20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib\中的NLPIR_JNI.dll文件复制到Java工程的跟目录

7.       再将20141230101836_ICTCLAS2015\ICTCLAS2015Data文件夹复制到Java工程的跟目录

8.       20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib中的kevin文件夹TestNLPIR.java复制到Java工程src目录下

9.       工程搭建完成,如图

运行TestNLPIR.java,如果按上面的步骤配置可能会报错了,查看日志发现Configure.xml文件没有找到(日志文件在工程的跟目录 yyyyMMdd.log,第一次执行需要按F5才能看见) 

修改TestNLPIR.java代码31行,改成String argu = “”;即可,如果工程是UFT-8编码,需要把所有的GB2312改成UFT-8,否者会乱码 

 

修改后的代码

 

修改后执行程序控制台输出:分词结果为:张华平/nr推出/v的/ude1 NLPIR/x分词/v系统/n,/wd又/d名/qICTCLAS2013/x,/wd新增/v新词/n识别/vn、/wn关键词/n提取/v、/wn微/ag博/ag分词/v功能/n。/wj _

 

但最后一个字符还是乱码了,不知道为什么

 

错误及解决

1.Cannot Open Configure file

../../\Data\Configure.xml

找不到Configure.xml文件,修改TestNLPIR.java31

 

2. Not valid license or your license expired! Please feelfree to contact pipy_zhang@msn.com!

    下载最新的NLPIR/ICTCLAS,用新的Data文件夹覆盖旧的

如下载 20150805111452_20150702124141_ICTCLAS2015 (1).zip 这个,并用里面的Data文件夹替换你原来的。

配置好的工程:http://download.csdn.net/detail/itjavaer/8406103

参考:http://blog.csdn.net/itjavaer/article/details/43267623

http://blog.csdn.net/heyu158/article/details/12680183

这篇关于使用Java调用中科院分词NLPIR/ICTCLAS的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1119546

相关文章

Java中Map的五种遍历方式实现与对比

《Java中Map的五种遍历方式实现与对比》其实Map遍历藏着多种玩法,有的优雅简洁,有的性能拉满,今天咱们盘一盘这些进阶偏基础的遍历方式,告别重复又臃肿的代码,感兴趣的小伙伴可以了解下... 目录一、先搞懂:Map遍历的核心目标二、几种遍历方式的对比1. 传统EntrySet遍历(最通用)2. Lambd

Django调用外部Python程序的完整项目实战

《Django调用外部Python程序的完整项目实战》Django是一个强大的PythonWeb框架,它的设计理念简洁优雅,:本文主要介绍Django调用外部Python程序的完整项目实战,文中通... 目录一、为什么 Django 需要调用外部 python 程序二、三种常见的调用方式方式 1:直接 im

Spring Boot 中 RestTemplate 的核心用法指南

《SpringBoot中RestTemplate的核心用法指南》本文详细介绍了RestTemplate的使用,包括基础用法、进阶配置技巧、实战案例以及最佳实践建议,通过一个腾讯地图路线规划的案... 目录一、环境准备二、基础用法全解析1. GET 请求的三种姿势2. POST 请求深度实践三、进阶配置技巧1

springboot+redis实现订单过期(超时取消)功能的方法详解

《springboot+redis实现订单过期(超时取消)功能的方法详解》在SpringBoot中使用Redis实现订单过期(超时取消)功能,有多种成熟方案,本文为大家整理了几个详细方法,文中的示例代... 目录一、Redis键过期回调方案(推荐)1. 配置Redis监听器2. 监听键过期事件3. Redi

Spring Boot 处理带文件表单的方式汇总

《SpringBoot处理带文件表单的方式汇总》本文详细介绍了六种处理文件上传的方式,包括@RequestParam、@RequestPart、@ModelAttribute、@ModelAttr... 目录方式 1:@RequestParam接收文件后端代码前端代码特点方式 2:@RequestPart接

C#中checked关键字的使用小结

《C#中checked关键字的使用小结》本文主要介绍了C#中checked关键字的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学... 目录✅ 为什么需要checked? 问题:整数溢出是“静默China编程”的(默认)checked的三种用

SpringBoot整合Zuul全过程

《SpringBoot整合Zuul全过程》Zuul网关是微服务架构中的重要组件,具备统一入口、鉴权校验、动态路由等功能,它通过配置文件进行灵活的路由和过滤器设置,支持Hystrix进行容错处理,还提供... 目录Zuul网关的作用Zuul网关的应用1、网关访问方式2、网关依赖注入3、网关启动器4、网关全局变

SpringBoot全局异常拦截与自定义错误页面实现过程解读

《SpringBoot全局异常拦截与自定义错误页面实现过程解读》本文介绍了SpringBoot中全局异常拦截与自定义错误页面的实现方法,包括异常的分类、SpringBoot默认异常处理机制、全局异常拦... 目录一、引言二、Spring Boot异常处理基础2.1 异常的分类2.2 Spring Boot默

C#中预处理器指令的使用小结

《C#中预处理器指令的使用小结》本文主要介绍了C#中预处理器指令的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录 第 1 名:#if/#else/#elif/#endif✅用途:条件编译(绝对最常用!) 典型场景: 示例

基于SpringBoot实现分布式锁的三种方法

《基于SpringBoot实现分布式锁的三种方法》这篇文章主要为大家详细介绍了基于SpringBoot实现分布式锁的三种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、基于Redis原生命令实现分布式锁1. 基础版Redis分布式锁2. 可重入锁实现二、使用Redisso