本文主要是介绍[算法入土之路]前缀树,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
前缀树:
用处:
查询一个字符串是否被添加在一个序列中
查询序列中是否有一个以...字符为前缀的字符串
以上时间复杂度为常数级
数据结构
class TreeNode:''':param self.pass: 序列经过标识 如果一个序列经过了该节点 则此值+1如果该节点为根节点 则 pass 代表了 该树有多少个序列:param self.end: 序列结束标识 如果一个序列的最后一个元素是此节点 则此值+1如果该节点为根节点 则 end 代表了 该树有多少个空序列:param self.next: 子节点集'''def __init__(self, pass_=0, end=0):self.pass_ = pass_self.end = endself.next = {} # 子节点集
实现
class PrefixTree:def __init__(self, root=None):'''接收传入的根节点 如果没有传则创建一个新的单一节点作为根节点:param root: 根节点'''self.root = root if root else TreeNode(pass_=0)def insert(self, seq=None):'''插入一个序列:param seq: 元素序列:return:'''if not seq:self.root.pass_ += 1self.root.end += 1returnnode = self.root # 从根节点开始for elem in seq: # 遍历序列中的每一个元素node.pass_ += 1 # 碰到的节点 pass+1 代表一个元素经过了该节点if elem not in node.next: # 如果本元素未在此节点的后代中, 则新建一个节点cur_node = TreeNode()node.next[elem] = cur_node # 将新建的节点加入到当层节点的后代中node = node.next[elem] # 进入下一层节点node.pass_ += 1node.end += 1 # 最后一个元素的节点的序列结束标识 + 1def search(self, seq=None):'''查询序列被添加过几次:param seq: 序列:return: 添加次数'''if not seq: # 如果为空序列return self.root.endnode = self.root# 遍历序列, 找到seq[-1]指向的节点for elem in seq:if elem in node.next:node = node.next[elem]else: # 如果没有找到 则说明没有 seq 序列return 0return node.enddef start_with_seq_index(self, seq=None):'''以序列 seq 为开头的的序列有多少个:param seq::return: 满足条件的序列个数'''if not seq: # 如果为空 则返回树中的序列个数return self.root.pass_node = self.rootfor elem in seq: # 遍历 seq 序列if elem in node.next: # 如果 elem 在当前节点的子集中node = node.next[elem] # 向下传递else: # 如果没找到 则表示没有以seq为开头的序列return 0# 找到seq[-1]对应的节点 返回node.pass_ 即为所求return node.pass_def remove(self, seq=None):if not seq: # 如果是空序列if self.root.pass_ > len(self.root.next): # 如果树中含有空序列# 删除空序列self.root.pass_ -= 1self.root.end -= 1return # 返回if self.search(seq): # 先查看下树中是否存在该序列self.root.pass_ -= 1 # 树中序列个数 -1node = self.rootfor elem in seq: # 遍历序列元素node.next[elem].pass_ -= 1 # 途径节点的经过标识 -1if not node.next.get(elem).pass_: # 如果下个节点的 经过标识为0# 则表示要删除的序列为1 直接从根节点的子集中删除该序列即可del node.next[elem]returnelse:node = node.next[elem] # 向下传递node.end -= 1 # node 为 seq[-1] 所指向的节点 此操作代表以 seq[-1] 为结尾的序列数目-1
打印前缀树
def print_dic(dic, inner_index=0):'''打印前缀树:param dic: 根节点的子节点集:param inner_index: # 第几层:return:'''for key, value in dic.items():print(key, value.pass_, value.end, inner_index, end=" | ")if not (inner_index + 1) % 8:print()print("".rjust(79, "-"))if value:print_dic(value.next, inner_index + 1)else:print()
测试主函数
if __name__ == '__main__':t = PrefixTree()t.insert("zhangsan")t.insert("zhangsaa")# t.insert("zhangs")# t.remove("zhangsan")t.insert()print_dic(t.root.next)# res = t.search("zhangs")res = t.start_with_seq_index("z")print(f"res: {res}")
这篇关于[算法入土之路]前缀树的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!