本文主要是介绍springboot集成guava布隆过滤器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1.创建springboot项目,引入maven依赖
<dependency><groupId>com.google.guava</groupId><artifactId>guava</artifactId><version>23.0</version></dependency>
2.创建guava布隆过滤器
@Component
public class GuavaFilter {//初始化一个常量public static final int _1W = 10000;//初始化guava过滤器的容器容量public static final int SIZE = 100 * _1W;//误报率public static double fpp = 0.03; //误报率//创建一个guava过滤器public static BloomFilter bloomFilter = BloomFilter.create(Funnels.integerFunnel(),SIZE,fpp);//向guava过滤器中添加100万个数据//验证不在这100万数据之外的10万个数据的误判率@PostConstructpublic void guavaFilter(){for(int i=1;i<=SIZE;i++){bloomFilter.put(i);}List<Integer> list = new ArrayList<>();for(int i = SIZE+1;i<SIZE+10*_1W;i++){if(bloomFilter.mightContain(i)){System.out.println(i + "被误识别了");list.add(i);}}System.out.println("误识别个数为:" + list.size());}
}
3.启动程序,观察结果
误识别的个数为3033个,误识别率3033/1000000≈0.03
4.对于误判率的思考
代码里配置的误判率为0.03,这里就会有小伙伴问,误判率(hash冲突概率)不应该越低越好吗,那我配置成0.01或者0.00000000001可以吗?
我们debug一下guava布隆过滤器的源码,点进去这个creat方法,断点打到如下图所示的位置
我们先看误报率配置0.03的情况
想要误报率控制在0.03,比特数组的位数需要达到7298440并且使用5种hash算法
再看误报率配置0.01的情况
想要误报率控制在0.01,比特数组的位数需要达到9585058并且使用7种hash算法再看误报率配置0.00000000001的情况
想要误报率控制在0.00000000001,比特数组的位数需要达到52717821并且使用37种hash算法
当我们把误报率配置成0.00000000001,重新启动下程序
5.布隆过滤器的数据流向
这篇关于springboot集成guava布隆过滤器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!