C++从零开始(day54)——位图,布隆过滤器

2024-03-19 21:28

本文主要是介绍C++从零开始(day54)——位图,布隆过滤器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这是关于一个普通双非本科大一学生的C++的学习记录贴

在此前,我学了一点点C语言还有简单的数据结构,如果有小伙伴想和我一起学习的,可以私信我交流分享学习资料

那么开启正题

今天分享的是关于位图, 布隆过滤器相关的知识点

1.位图

1.1位图的概念

我们先来看一道面试题:

给40亿个不重复的无符号整数,无序,给一个无符号整数,如何迅速判断一个数是否存在这40亿个数当中?

在学习哈希之前我们可能会用sort排序后二分查找,学了哈希之后可以用set或者unordered_set解决,但是这个题目用这两种方法都不行,因为空间不够,那么如何解决呢?我们来看位图的概念

位图的概念:用每一位存放某种状态,适用于海量数据,处理无重复的场景,通常来判断某个数据是否存在

位图用到了哈希的思想

1.2位图的实现

位图的实现并不难,熟练掌握位操作运算符即可轻松写出,这里直接给出

namespace wkl
{class my_set{public:my_set(size_t N){_a.resize(N / 32 + 1, 0);_num = 0;}void set(size_t x){size_t index = x / 32;size_t pos = x % 32;_a[index] |= (1 << pos);}void reset(size_t x){size_t index = x / 32;size_t pos = x % 32;_a[index] &= ~(1 << pos);}bool test(size_t x){size_t index = x / 32;size_t pos = x % 32;return _a[index] & (1 << pos);}private:vector<int> _a;size_t _num;};void Test_my_set(){my_set ms(100);ms.set(2);ms.set(4);ms.set(96);ms.set(97);ms.set(98);//ms.reset(2);for (size_t i = 0; i < 100; ++i){printf("[%d]:%d\n", i, ms.test(i));}}
}

1.3位图的应用

1.快速查找某个数据是否在一个集合当中

2.排序 + 去重

3.求两个集合的交集,并集

4.操作系统中的磁盘块标记

1.4位图的优缺点

优点:节约空间,效率高

缺点:只能处理整形数据

2.布隆过滤器

2.1布隆过滤器概念

在我们刷短视频时,是如何保证推送给我们的内容没有重复推送的呢?客户端会从用户历史记录里进行筛选,过滤掉已经存在的记录,那么何如快速查找呢?

1.使用哈希表存储用户记录,缺点:浪费空间

2.用位图存储用户记录,无法记录(位图只能处理整形数据

那么这里就要引出布隆过滤器

布隆过滤器:1970由布隆提出的一种紧凑的,巧妙地概率性数据结构,特点是高效地插入和查找,用来告诉用户某数据不存在或者可能存在它是由多个哈希函数,将一个数据映射到位图结构中,这种方法提高了查找效率,也极大地节省了内存

2.2布隆过滤器的实现

这里不给出代码只讲其原理

a.插入

用多个哈希函数找到数据映射位置,借助于set标记存储

b.查询

找到多个哈希函数映射的值,如果全被标记则可能存在,布隆过滤器如果说某个元素不存在时,该元素一定不存在,如果该元素存在时,该元素可能存在,因为有些哈希函数存在一定的误判

c.删除

布隆过滤器不能直接支持删除操作,因为在删除一个元素时,可能会影响到其他元素

2.3布隆过滤器的优缺点

优点:查找效率高,节省空间

缺点:不能删除元素,有误判率,不能获取元素本身

新手写博客,有不对的位置希望大佬们能够指出,也谢谢大家能看到这里,让我们一起学习进步吧!

这篇关于C++从零开始(day54)——位图,布隆过滤器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/827290

相关文章

从入门到精通C++11 <chrono> 库特性

《从入门到精通C++11<chrono>库特性》chrono库是C++11中一个非常强大和实用的库,它为时间处理提供了丰富的功能和类型安全的接口,通过本文的介绍,我们了解了chrono库的基本概念... 目录一、引言1.1 为什么需要<chrono>库1.2<chrono>库的基本概念二、时间段(Durat

C++20管道运算符的实现示例

《C++20管道运算符的实现示例》本文简要介绍C++20管道运算符的使用与实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录标准库的管道运算符使用自己实现类似的管道运算符我们不打算介绍太多,因为它实际属于c++20最为重要的

Visual Studio 2022 编译C++20代码的图文步骤

《VisualStudio2022编译C++20代码的图文步骤》在VisualStudio中启用C++20import功能,需设置语言标准为ISOC++20,开启扫描源查找模块依赖及实验性标... 默认创建Visual Studio桌面控制台项目代码包含C++20的import方法。右键项目的属性:

c++中的set容器介绍及操作大全

《c++中的set容器介绍及操作大全》:本文主要介绍c++中的set容器介绍及操作大全,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录​​一、核心特性​​️ ​​二、基本操作​​​​1. 初始化与赋值​​​​2. 增删查操作​​​​3. 遍历方

解析C++11 static_assert及与Boost库的关联从入门到精通

《解析C++11static_assert及与Boost库的关联从入门到精通》static_assert是C++中强大的编译时验证工具,它能够在编译阶段拦截不符合预期的类型或值,增强代码的健壮性,通... 目录一、背景知识:传统断言方法的局限性1.1 assert宏1.2 #error指令1.3 第三方解决

深度解析Spring Boot拦截器Interceptor与过滤器Filter的区别与实战指南

《深度解析SpringBoot拦截器Interceptor与过滤器Filter的区别与实战指南》本文深度解析SpringBoot中拦截器与过滤器的区别,涵盖执行顺序、依赖关系、异常处理等核心差异,并... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现

C++11委托构造函数和继承构造函数的实现

《C++11委托构造函数和继承构造函数的实现》C++引入了委托构造函数和继承构造函数这两个重要的特性,本文主要介绍了C++11委托构造函数和继承构造函数的实现,具有一定的参考价值,感兴趣的可以了解一下... 目录引言一、委托构造函数1.1 委托构造函数的定义与作用1.2 委托构造函数的语法1.3 委托构造函

C++11作用域枚举(Scoped Enums)的实现示例

《C++11作用域枚举(ScopedEnums)的实现示例》枚举类型是一种非常实用的工具,C++11标准引入了作用域枚举,也称为强类型枚举,本文主要介绍了C++11作用域枚举(ScopedEnums... 目录一、引言二、传统枚举类型的局限性2.1 命名空间污染2.2 整型提升问题2.3 类型转换问题三、C

C++链表的虚拟头节点实现细节及注意事项

《C++链表的虚拟头节点实现细节及注意事项》虚拟头节点是链表操作中极为实用的设计技巧,它通过在链表真实头部前添加一个特殊节点,有效简化边界条件处理,:本文主要介绍C++链表的虚拟头节点实现细节及注... 目录C++链表虚拟头节点(Dummy Head)一、虚拟头节点的本质与核心作用1. 定义2. 核心价值二

C++ 检测文件大小和文件传输的方法示例详解

《C++检测文件大小和文件传输的方法示例详解》文章介绍了在C/C++中获取文件大小的三种方法,推荐使用stat()函数,并详细说明了如何设计一次性发送压缩包的结构体及传输流程,包含CRC校验和自动解... 目录检测文件的大小✅ 方法一:使用 stat() 函数(推荐)✅ 用法示例:✅ 方法二:使用 fsee