doublearraytrie专题

双数组Trie树(DoubleArrayTrie)Java实现

原文地址: http://www.hankcs.com/program/java/%E5%8F%8C%E6%95%B0%E7%BB%84trie%E6%A0%91doublearraytriejava%E5%AE%9E%E7%8E%B0.html 双数组Trie树(DoubleArrayTrie)是一种空间复杂度低的Trie树,应用于字符区间大的语言(如中文、日文等)分词领域。

双数组字典树DoubleArrayTrie

双数组Tire树是Tire树的存储结构上升级版。        在查询方面,双数组Tire树拥有Tire树的所有优点,而且刻服了Tire树浪费空间的不足。在插入和删除的时,往往需要对双数组结构进行全局调整,灵活性能较差。如果核心词典已经预先建立好并且有序的,并且不会添加或删除新词,那么这个缺点是可以忽略的。 标准Trie      向一棵树中插入“清华”、“清华大学”、“