本文主要是介绍Solr6+中文分词(mmseg4j),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
在搭建Solr服务器的基础上(http://blog.csdn.net/u010379996/article/details/51790743)
1. 下载mmseg4j包和字典(.dic)
2. 搭建mmseg4j中文分词
在Solr_Home创建dic文件夹,并把mmseg4j的.dic文件复制到此
下载mmseg4j-solr-2.3.0.jar, mmseg4j-core-1.10.0.jar,并复制到Solr项目的lib中
修改managed-schema(config目录)文件
添加: <fieldType name="textComplex" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic文件夹的绝对路径"/>
</analyzer>
</fieldType>
<fieldType name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic文件夹的绝对路径"/>
</analyzer>
</fieldType>
<fieldType name="textSimple" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic文件夹的绝对路径"/>
</analyzer>
</fieldType>
这篇关于Solr6+中文分词(mmseg4j)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!