从零开始实现一个可靠、健壮的内存池

本文主要是介绍从零开始实现一个可靠、健壮的内存池，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

文章目录

- 概要
  - 这个项目是干什么的
  - 项目所需储备知识
- 什么是内存池
  - 池化技术
  - 内存池
  - 内存池主要解决的问题
- 框架设计
- 开发计划
- 系统测试情况
- 遇到的主要问题和解决方法
- 分工和协作
- 提交仓库目录和文件描述
- 比赛收获

概要

这个项目是干什么的

当前项目是实现一个高并发的内存池，他的原型是google的一个开源项目tcmalloc，tcmalloc全称 Thread-Caching Malloc，即线程缓存的malloc，实现了高效的多线程内存管理，用于替代系统的内存分配相关的函数（malloc、free）。这个项目是把tcmalloc最核心的框架简化后拿出来，模拟实现出一个自己的高并发内存池，目的就是学习tcamlloc的精华，这种方式有点类似我们之前学习STL容器的方式。

项目所需储备知识

这个项目会用到C/C++、数据结构（链表、哈希桶）、操作系统内存管理、单例模式、多线程、互斥锁等等方面的知识。

什么是内存池

池化技术

所谓“池化技术”，就是程序先向系统申请过量的资源，然后自己管理，以备不时之需。之所以要申请过量的资源，是因为每次申请该资源都有较大的开销，不如提前申请好了，这样使用时就会变得非常快捷，大大提高程序运行效率。在计算机中，有很多使用“池”这种技术的地方，除了内存池，还有连接池、线程池、对象池等。以服务器上的线程池为例，它的主要思想是：先启动若干数量的线程，让它们处于睡眠状态，当接收到客户端的请求时，唤醒池中某个睡眠的线程，让它来处理客户端的请求，当处理完这个请求，线程又进入睡眠状态。

内存池

内存池是指程序预先从操作系统申请一块足够大内存，此后，当程序中需要申请内存的时候，不是直接向操作系统申请，而是直接从内存池中获取；同理，当程序释放内存的时候，并不真正将内存返回给操作系统，而是返回内存池。当程序退出(或者特定时间)时，内存池才将之前申请的内存真正释放。

内存池主要解决的问题

内存池解决的主要是效率及内存碎片问题。内存碎片分为内碎片/外碎片。

外部碎片是一些空闲的连续内存区域太小，这些内存空间不连续，以至于合计的内存足够，但是不能满足一些的内存分配申请需求。内部碎片是由于一些对齐的需求，导致分配出去的空间中一些内存无法被利用。

架构设计

现代很多的开发环境都是多核多线程，在申请内存的场景下，必然存在激烈的锁竞争问题。malloc本身其实已经很优秀，那么我们项目的原型tcmalloc就是在多线程高并发的场景下更胜一筹，所以这次我们实现的内存池需要考虑以下几方面的问题。

1. 性能问题。

2. 多线程环境下，锁竞争问题。

3. 内存碎片问题。

concurrent memory pool主要由以下3个部分构成：

1. thread cache：线程缓存是每个线程独有的，用于小于256KB的内存的分配，线程从这里申请内存不需要加锁，每个线程独享一个cache，这也就是这个并发线程池高效的地方。

2. central cache：中心缓存是所有线程所共享，thread cache是按需从central cache中获取的对象。central cache合适的时机回收thread cache中的对象，避免一个线程占用了太多的内存，而其他线程的内存吃紧，达到内存分配在多个线程中更均衡的按需调度的目的。central cache是存在竞争的，所以从这里取内存对象是需要加锁，首先这里用的是桶锁，其次只有thread cache的没有内存对象时才会找central cache，所以这里竞争不会很激烈。

3. page cache：页缓存是在central cache缓存上面的一层缓存，存储的内存是以页为单位存储及分配的，central cache没有内存对象时，从page cache分配出一定数量的page，并切割成定长大小的小块内存，分配给central cache。当一个span的几个跨度页的对象都回收以后，page cache 会回收central cache满足条件的span对象，并且合并相邻的页，组成更大的页，缓解内存碎片的问题。

开发计划

开发计划为

1、先实现由ThreadCache至PageCache的内存申请过程。再进行简单的调试，对申请内存进行联调

2、再实现由ThreadCache至PageCache的内存释放过程，进行简单的调试，对释放内存进行联调

3、进行性能测试

4、思考优化，如利用定长内存池代替其中的new，delete操作，释放内存时不用带对象大小等

系统测试情况

以下为多线程并发环境下，对比malloc和ConcurrentAlloc申请和释放内存效率对比

void BenchmarkMalloc(size_t ntimes, size_t nworks, size_t rounds)
{std::vector<std::thread> vthread(nworks);std::atomic<size_t> malloc_costtime = 0;std::atomic<size_t> free_costtime = 0;for (size_t k = 0; k < nworks; ++k){vthread[k] = std::thread([&, k]() {std::vector<void*> v;v.reserve(ntimes);for (size_t j = 0; j < rounds; ++j){size_t begin1 = clock();for (size_t i = 0; i < ntimes; i++){v.push_back(malloc(16));//v.push_back(malloc((16 + i) % 8192 + 1));}size_t end1 = clock();size_t begin2 = clock();for (size_t i = 0; i < ntimes; i++){free(v[i]);}size_t end2 = clock();v.clear();malloc_costtime += (end1 - begin1);free_costtime += (end2 - begin2);}});}for (auto& t : vthread){t.join();}printf("%u个线程并发执行%u轮次，每轮次malloc %u次: 花费：%u ms\n",nworks, rounds, ntimes, malloc_costtime);printf("%u个线程并发执行%u轮次，每轮次free %u次: 花费：%u ms\n",nworks, rounds, ntimes, free_costtime);printf("%u个线程并发malloc&free %u次，总计花费：%u ms\n",nworks, nworks*rounds*ntimes, malloc_costtime + free_costtime);
}

遇到的主要问题和解决方法

问题

多线程环境下的锁竞争问题：多个线程同时访问内存池时，如何减少锁竞争以提高性能。
平台及兼容性在不同操作系统和架构下，内存分配和管理的差异可能导致兼容性问题。
内存池自身数据结构的管理：内存池自身数据结构（如SpanList中的span等）的管理也可能使用到malloc，没有完全脱离malloc。

解决办法

减少锁竞争：
通过为每个线程分配独立的threadCache，减少多线程环境下的锁竞争。
在centralCache中使用桶锁（bucket lock）等技术，进一步减少锁竞争。
平台及兼容性处理：
根据不同平台和架构的特性，选择合适的内存分配和管理策略。
在Linux等系统下，将某些特定的内存分配函数（如VirtualAlloc）替换为brk等。
内存池自身数据结构的管理：
对于内存池自身数据结构的管理，尽量减少使用malloc和new，可以考虑使用其他方式（如virtual alloc、brk、mmap等）来申请大块内存，并使用对象池等技术来管理小块内存。
在64位系统下，对于某些数据结构（如map<id, Span*>）可能存在的性能和内存问题，可以考虑使用基数树等更高效的数据结构进行替换。

分工和协作

项目规划与定义

项目经理：
定义项目目标、范围和里程碑。
制定项目计划和时间表。
分配资源和任务给团队成员。
架构师：
设计项目的整体架构，包括内存池的设计、线程缓存（ThreadCache）、中心缓存（CentralCache）和页缓存（PageCache）的交互方式。
评估技术选型，确保所选技术栈能够支持高并发场景。

2. 编码实现

核心开发团队：
负责实现内存池的核心功能，如内存的申请、分配、释放和合并。
编写单元测试，确保每个模块的正确性。
协作进行代码审查，提高代码质量。
分工示例：
开发者A：负责ThreadCache的实现，优化线程间的内存访问性能。
开发者B：负责CentralCache的实现，确保多个线程能够高效共享内存资源。
开发者C：负责PageCache的实现，处理大内存块的分配和回收。
性能测试团队：
设计并执行性能测试，评估内存池的性能和并发能力。
根据测试结果提供优化建议。

3. 并发与锁优化

并发控制专家：
负责优化多线程环境下的锁竞争问题，提高内存池的并发性能。
研究并使用先进的并发控制算法，如无锁编程技术。

提交仓库目录和文件描述

文件描述

三层缓存结构

        ThreadCache层:ThreadCache.h,ThreadCache.cpp

        CentralCache层:CentralCache.h,CentralCache.cpp

        PageCache层:PageCache.h,PageCache,cpp

用于所有文件公用的类/变量

        common.h

用于替代new/delete的定长内存池

        ObjectPool.h

用于进行性能测试的文件

        Benchmark.cpp

核心接口

        ConcurrentAlloc.cpp

比赛收获

1. 深入理解高并发与内存管理

通过设计高并发内存池，我深入理解了在高并发环境下，如何有效地管理内存资源，包括内存的分配、回收和复用，以及如何在多线程环境中确保内存操作的安全性和高效性。
我学会了如何分析并解决内存碎片化问题，这对于提高系统的性能和稳定性至关重要。

2. 掌握了先进的并发控制技术

在设计过程中，我接触并掌握了多种先进的并发控制技术，如无锁编程、锁分离、读写锁等，这些技术对于提高内存池的并发性能至关重要。
我学会了如何根据具体的业务场景和需求，选择合适的并发控制技术，以达到最佳的性能和效率。

3. 提升了系统设计和架构能力

设计高并发内存池需要综合考虑多个方面，包括系统的整体架构、模块划分、接口设计、线程模型等。通过这次经历，我提升了系统设计和架构能力，学会了如何构建一个高性能、可扩展、易维护的系统。
我学会了如何平衡系统的复杂性和性能之间的关系，以及如何在设计过程中考虑系统的可测试性和可维护性。

4. 加强了团队协作和沟通能力

在设计高并发内存池的过程中，我与团队成员进行了密切的协作和沟通，共同解决了许多技术难题。这次经历加强了我的团队协作和沟通能力，使我更加擅长与团队成员合作，共同完成任务。
我学会了如何有效地表达自己的观点和想法，以及如何倾听他人的意见和建议，这对于提高团队的凝聚力和工作效率至关重要。

5. 增强了解决问题的能力

在设计过程中，我遇到了许多复杂的问题和挑战，如内存泄漏、死锁、性能瓶颈等。通过不断地尝试和探索，我逐渐学会了如何分析问题、定位问题并解决问题。
这次经历增强了我的解决问题的能力，使我更加自信和从容地面对未来的技术挑战。

6. 拓展了技术视野和知识面

在设计高并发内存池的过程中，我接触了许多新的技术和工具，如高性能数据结构、并发编程库、性能测试工具等。这些新的技术和工具拓展了我的技术视野和知识面，使我对计算机系统的底层原理和性能优化有了更深入的理解。

总之，参加这次比赛是一次非常有价值的经历。通过这次经历，我不仅提升了自己的技术能力和团队协作能力，还拓展了自己的技术视野和知识面。我相信这些收获将对我未来的职业发展产生积极的影响。

这篇关于从零开始实现一个可靠、健壮的内存池的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

从零开始实现一个可靠、健壮的内存池

文章目录

概要

什么是内存池

架构设计

开发计划

系统测试情况

遇到的主要问题和解决方法

分工和协作

项目规划与定义

2. 编码实现

3. 并发与锁优化

提交仓库目录和文件描述

比赛收获

1. 深入理解高并发与内存管理

2. 掌握了先进的并发控制技术

3. 提升了系统设计和架构能力

4. 加强了团队协作和沟通能力

5. 增强了解决问题的能力

6. 拓展了技术视野和知识面

相关文章

MySQL更新某个字段拼接固定字符串的实现

java实现延迟/超时/定时问题

Java Optional避免空指针异常的实现

在Android平台上实现消息推送功能

Spring Boot项目中结合MyBatis实现MySQL的自动主从切换功能

Redis实现延迟任务的三种方法详解

基于Python和MoviePy实现照片管理和视频合成工具

springboot filter实现请求响应全链路拦截

SpringBoot利用@Validated注解优雅实现参数校验

Python实现AVIF图片与其他图片格式间的批量转换