Bloom Filter有以下参数: m m bit数组的宽度(bit数)nn 加入其中的key的数量 k k 使用的hash函数的个数ff False Positive的比率 (1−(1−1m)kn)k≈(1−e−knm)k (1-(1-{{1}\over{m}})^{kn})^k\approx(1-e^{-{{kn}\over{m}}})^k 给
今日看了两个基于概率的数据结构(Probabilistic data structures) Bloom Filters 和 Count-Min Sketch,基本思想相类似。 其实是两个实现简单的算法,但是需要用到一定的数学原理。 但本文仅介绍方法,不介绍数学原理。 Bloom Filters 问给出的数是否在集合 S S S 中,集合可增可删,且集合中数的取值范围 w w w 较大