本文主要是介绍HanLP学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
设置分词结果词性显示
HanLP.Config.ShowTermNature = false; // 分词结果不显示词性
通过构造函数传入多个词典
String dict1 = "data/dictionary/CoreNatureDictionary.mini.txt";
String dict2 = "data/dictionary/custom/上海地名.txt ns";
segment = new DoubleArrayTrieSegment(dict1, dict2);
开启POS-tagging
后, 就可以激活数词和英文识别
segment.enablePartOfSpeechTagging(true); // 激活数词和英文识别
词性定义 com.hankcs.hanlp.corpus.tag.Nature
通过修改自定义词典第一行实现自定义词性
敏感词替换
public interface IHit<V>
{void hit(int begin, int end, V value);
}
重载接口实现回调函数传递
final StringBuilder sbOut = new StringBuilder(text.length());
final int[] offset = new int[]{0};// 开始重载
new AhoCorasickDoubleArrayTrie.IHit<String>()
{@Overridepublic void hit(int begin, int end, String value){if (begin > offset[0])sbOut.append(text.substring(offset[0], begin));sbOut.append(replacement);offset[0] = end;}
}if (offset[0] < text.length())</
这篇关于HanLP学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!