本文主要是介绍分歧器 friso 的编译和安装测试,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Friso 是使用 c 语言开发的一款中文分词器,使用流行的 mmseg 算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP 等。源码无需修改就能在各种平台下编译使用,加载完 20 万的词条,内存占用较小,一般稳定为 14.5M 左右。
github 开源地址:https://github.com/lionsoul2014/friso
以下为在Linux上编译和测试分词的示例:
先下载最新的 friso 代码包 friso-master.zip
,上传到 Linux 服务器并解压缩,然后按照如下步骤编译、运行测试。
运行 autogen.sh
脚本初始化,如果出现缺依赖包错误对应安装依赖包,如果正常初始化完成,则从 ./configure
步骤继续进行。
[root@middleware1 friso-master]# ./autogen.sh
./autogen.sh: line 3: libtoolize: command not found
./autogen.sh: line 4: aclocal: command not found
./autogen.sh: line 5: autoheader: command not found
./autogen.sh: line 6: automake: command not found
./autogen.sh: line 7: autoconf: command not found[root@middleware1 friso-master]# sudo yum install -y automake autoconf libtool
(略)
以下命令过程,是不缺少依赖包的正常操作步骤:
[root@middleware1 friso-master]# ./autogen.sh
(略)
[root@middleware1 friso-master]# ./configure
(略)
[root@middleware1 friso-master]# make
(略)
[root@middleware1 friso-master]# make install
(略)
[root@middleware1 friso-master]# ./src/friso -init ./friso.ini
Initialized in 0.250000sec
Mode: Complex
+-Version: 1.6.4 (UTF-8)
+---------------------------------------------------------------+
| Friso - a Chinese word segmentation written by c. |
| bug report email - chenxin619315@gmail.com. |
| or: visit https://github.com/lionsoul2014/friso. |
| java version for https://github.com/lionsoul2014/jcseg |
| type 'quit' to exit the program. |
+---------------------------------------------------------------+
friso>> 一个相扑摔跤手和一个必须在Baloon追捕法医心理学家的猎人的难以置信的插曲
分词结果:
一个 相扑 摔跤 手 和 一个 必须 在 baloon 追捕 法医 心理学 家的 猎人 的 难以置信 的 插曲
Done, cost < 0.010000sec
friso>> 单红宇
分词结果:
单 红 宇
Done, cost < 0.000000sec
friso>> 张查找
分词结果:
张 查找
Done, cost < 0.000000sec
friso>> 中华人民共和国
分词结果:
中华 人民共和国
Done, cost < 0.000000sec
friso>>
至此,完成基本的编译和测试,对于自定义词库等更多配置,参考官网文档说明。
(END)
这篇关于分歧器 friso 的编译和安装测试的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!