我用纯C语言开发的中英文混合分词服务器3.0正式发布,词库190多万词,每秒切分5万+,同时提供 c、java、C#、delphi、js调用范例

本文主要是介绍我用纯C语言开发的中英文混合分词服务器3.0正式发布,词库190多万词,每秒切分5万+,同时提供 c、java、C#、delphi、js调用范例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

我用纯C语言开发的中英文混合分词服务器3.0正式发布,词库190多万词,每秒切分5万+,同时提供 c、java、C#、delphi、js调用范例


百万商业圈中英文混合分词服务器3.0正式发布, 绝对稳定高效,分词库扩大到了190多万词汇,

开发语言:C语言
编译器:GCC
测试环境:xp、win2000、win2003、win7、win2008、win8
质量测试:用例共 3000份10K+的随机文章
平均性能:5万字以内的文章单线程切分1秒内可以切分完毕


3.0版算法做了全面修正,分词准确性、服务稳定性、健壮性、速度都有了质的飞跃!
同时提供c、java、C#、delphi、js调用范例


  支持大规模并发,线程安全、5万字以内的文章单线程切分1秒内可以切分完毕!

软件名称:百万商业圈中文分词服务器 作者:QQ 99923309  
具体使用时可将 词库文件(190多万词汇) bwsyq.com.dat放在分词服务器相同的目录即可
使用前请先启动分词服务器
 
分词服务器程序既是 一个windows 服务程序, 服务名称是:bwsyq fenci service and serve 0.1 (百万商业圈中文分词服务器)
同时又是 一个简单的webserver安装启动后,你可以直接在浏览器中输入 http://127.0.0.1:888 进行使用
同时又还是 一个Scoket server 通信端口是 888.
 
分词服务器安装方式有两种(假设你保存在D盘,如果不是请自行更改):
一、也可以直接通过双击 安装分词服务器.bat 来进行安装  
二、 d:\fenciserver.exe install 回车即可!(安装后就会自动启动服务)
 
分词服务器卸载方式是(假设你保存在D盘,如果不是请自行更改):  
一、也可以直接通过双击 卸载分词服务器.bat 来进行卸载
二、d:\ fenciserver.exe uninstall 回车即可!(卸载后就会自动关闭服务)
 
另外:为了便于大家的开发使用,
我提供了 Delphi、C#、Java、Html、javascript这几中不同语言的使用代码。
 
词库文件 bwsyq.com.dat 请与分词服务器保存在同一目录下,并且不能改名!
 
使用步骤:
一、下载分词服务器和词库文件,词库文件与分词服务器保存在同一目录下。
二、分词服务器安装,请参考上面的说明。
三、可以开始使用了!
 
相关工具说明: ImportCiHuiToCiKuFromFile.exe 词库批量导入工具 具体说明:
用法比如: c:\ImportCiHuiToCiKuFromFile.exe "c:\词汇文档.txt" 回车即可  
"c:\词汇文档.txt" 中请按照一个词一行的格式 保存,文件编码请采用ANSI格式
 

3.0下载地址:http://www.everbox.com/f/SqsPamaSN9lxv1SB4OCbHGI7X9

3.1下载地址:http://www.everbox.com/f/q9CJbCBVmvpizndCnNNQlBIBUv

可免费使用,版权归属: http://www.bwsyq.com

有任何疑问请与我沟通:QQ 99923309

这篇关于我用纯C语言开发的中英文混合分词服务器3.0正式发布,词库190多万词,每秒切分5万+,同时提供 c、java、C#、delphi、js调用范例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/842417

相关文章

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

NFS实现多服务器文件的共享的方法步骤

《NFS实现多服务器文件的共享的方法步骤》NFS允许网络中的计算机之间共享资源,客户端可以透明地读写远端NFS服务器上的文件,本文就来介绍一下NFS实现多服务器文件的共享的方法步骤,感兴趣的可以了解一... 目录一、简介二、部署1、准备1、服务端和客户端:安装nfs-utils2、服务端:创建共享目录3、服

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

JAVA系统中Spring Boot应用程序的配置文件application.yml使用详解

《JAVA系统中SpringBoot应用程序的配置文件application.yml使用详解》:本文主要介绍JAVA系统中SpringBoot应用程序的配置文件application.yml的... 目录文件路径文件内容解释1. Server 配置2. Spring 配置3. Logging 配置4. Ma

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

基于Python开发电脑定时关机工具

《基于Python开发电脑定时关机工具》这篇文章主要为大家详细介绍了如何基于Python开发一个电脑定时关机工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 简介2. 运行效果3. 相关源码1. 简介这个程序就像一个“忠实的管家”,帮你按时关掉电脑,而且全程不需要你多做

C#使用yield关键字实现提升迭代性能与效率

《C#使用yield关键字实现提升迭代性能与效率》yield关键字在C#中简化了数据迭代的方式,实现了按需生成数据,自动维护迭代状态,本文主要来聊聊如何使用yield关键字实现提升迭代性能与效率,感兴... 目录前言传统迭代和yield迭代方式对比yield延迟加载按需获取数据yield break显式示迭

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

java脚本使用不同版本jdk的说明介绍

《java脚本使用不同版本jdk的说明介绍》本文介绍了在Java中执行JavaScript脚本的几种方式,包括使用ScriptEngine、Nashorn和GraalVM,ScriptEngine适用... 目录Java脚本使用不同版本jdk的说明1.使用ScriptEngine执行javascript2.