图文详解ThreadLocal:原理、结构与内存泄漏解析

2024-08-21 18:52

本文主要是介绍图文详解ThreadLocal:原理、结构与内存泄漏解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


目录

一.什么是ThreadLocal

二.ThreadLocal的内部结构

三.ThreadLocal带来的内存泄露问题

▐ key强引用

▐ key弱引用

总结


一.什么是ThreadLocal

在Java中,ThreadLocal 类提供了一种方式,使得每个线程可以独立地持有自己的变量副本,而不是共享变量。这可以避免线程间的同步问题,因为每个线程只能访问自己的ThreadLocal变量。通过ThreadLocal为线程添加的值只能由这个线程访问到,其他的线程无法访问,因此就避免了多线程之间的同步问题

使用ThreadLocal时,通常需要实现以下步骤:

  • 初始化:创建ThreadLocal变量。
    private static ThreadLocal<T> threadLocal = new ThreadLocal<>();
    
  • 设置值:使用set(T value)方法为当前线程设置值。
    threadLocal.set(value);
    
  • 获取值:使用get()方法获取当前线程的值。
    T value = threadLocal.get();
    
  • 移除值:使用remove()方法在线程结束时清除ThreadLocal变量,以避免内存泄漏。
    threadLocal.remove();
    

在下面这个示例中,在主线程中存储了一个整形的10,新建一个线程后去取这个值是取不到的,因为该值只属于主线程,故输出为null

public class ThreadLocalExample {private static ThreadLocal<Integer> threadLocal = new ThreadLocal<>();public static void main(String[] args) {// 设置线程局部变量的值threadLocal.set(10);// 这个值在其他线程中是取不到获取的new Thread(() -> {Integer value = threadLocal.get();//nullSystem.out.println("Thread value: " + value);}).start();}
}

二.ThreadLocal的内部结构

在JDK8之后每一个线程都会维护一个ThreadLoaclMap,这个Map是一个哈希散列结构,如下图所示,每一个元素(Entry)都是一个键值对,key为ThreadLocal,Value为存储的数据,也就是set()方法存储的内容。

但是在早期并不是这样的,早期的JDK中都是由ThreadLocal来维护这样的一个Map,里面的key则是Thread,就像下图这样

Thread线程数一般往往是大于ThreadLocal的,那么当线程销毁的时候对比俩个方案,JDK8的方案则可以节省更多的内存空间(只需要将对应的ThreadLocalMap删除),JDK8之前的方案由于Thread只是Map的一个节点的key,将其释放掉就会导致这块Map的空间利用率很低。

我们也可以打开ThreadLocalMap的核心源码,会发现正是JDK8方案所示的结构

以下是添加了中文注释的版本

static class ThreadLocalMap {/*** 存储的每个元素--Entry*/static class Entry extends WeakReference<ThreadLocal<?>> {Object value;Entry(ThreadLocal<?> k, Object v) {super(k);value = v;}}/*** 初始容量--必须是2的整数幂*/private static final int INITIAL_CAPACITY = 16;/*** 存放数据的Table,长度也必须是2的整数幂*/private Entry[] table;/*** 数组内已使用的长度,即Entrys的个数*/private int size = 0;/*** 进行扩容的阈值*/private int threshold; // Default to 0
}

三.ThreadLocal带来的内存泄露问题

首先是内存泄漏的概念:

  • 内存溢出:没有足够的内存供申请者使用
  • 内存泄漏:程序中已经动态分配的内存由于某种原因未释放或无法释放,造成系统内存的浪费,导致程序运行速度减慢甚至崩溃。此外内存泄漏的堆积最终也会导致内存溢出。

下图是ThreadLocal相关的内存结构图,在栈区中有threadLocal对象和当前线程对象,分别指向堆区真正存储的类对象,这俩个指向都是强引用。在堆区中当前线程肯定是只有自己的Map的信息的,而Map中又存储着一个个的Entry节点;在Entry节点中每一个Key都是ThreadLocal的实例,同时Value又指向了真正的存储的数据位置,以上便是下图的引用关系。

那么所谓的内存泄漏,其实就是指的Entry这块内存不能正确释放

有人可能会猜测出现内存泄漏是因为Entry中使用了弱引用的key(如下所示继承关系中的WeakReference),但这种理解其实是不对的

    static class Entry extends WeakReference<ThreadLocal<?>> {Object value;Entry(ThreadLocal<?> k, Object v) {super(k);value = v;}}

强弱引用的概念:

  • 强引用(StrongReference):就是我们最常见的普通对象引用,只要还有强引用指向一个对象,就能表明对象还“活着”,垃圾回收器就不会回收这种对象。
  • 弱引用(WeakReference):垃圾回收器一旦发现了只具有弱引用的对象,不管当前内存空间足够与否,都会回收它的内存。 

▐ key强引用

我们可以按照强弱引用来分别推算一下,首先是强引用的情况

当我们在业务代码中使用完ThreadLocal,在栈区指向堆区的这个指向关系就会被回收掉了,但是由于Key是强引用指向ThreadLocal,故而堆区中的ThreadLocal无法被回收,此时的Key指向ThreadLocal,另外由于当前线程还没有结束,则下面那条强引用指向关系任然存在。故为下图的关系状态

在这样的情况下,由于栈上的指向已经消失了,我们无法访问到堆上的ThreadLocal,故而无法访问到Entry,但是Entry又有Map指向它,故而无法进行回收。那么此时的Entry即无法访问也无法回收,这就造成了Entry的内存溢出。

▐ key弱引用

其次是弱引用的情况,当我们在业务代码中使用完ThreadLocal就通过垃圾回收(GC)进行了回收,那么由于Key是弱引用,Key此时就指向null,但是由于当前线程还没有结束,则下面那条强引用指向关系任然存在

在这样的情况下,Entry由于仍然有Map指向它所以不会被GC回收掉,但是此时的Key又为null,所以我们无法访问到这个Value。这就导致了这个Value我们即不能访问到也不能进行回收,此时就造成了Value的内存泄漏。

总结

通过以上分析,我们得知了不管Entry中的Key是否为弱引用,都会造成内存泄漏的情况,只不过强引用下是Entry的内存泄漏,弱引用下是Value的内存泄漏。造成这样内存泄漏的情况都有这样的共同特性:

  • 都没有手动删除Entry
  • 当先线程都在运行

也就是说,只要我们在使用完ThreadLocal后,调用其remove()方法删除对应的Entry就可以避免内存泄漏的问题。

并且由于ThreadLoaclMap是Thread的一个属性,故而它的生命周期和线程一样,那么当线程的生命周期结束,自然也就没有Map指向Entry,这也就在根源上解决了问题。

综上所述,造成ThreadLoacl内存泄漏的根本原因是:由于ThreadLoaclMap的生命周期和Thread一样长,如果没有手动删除对应的Key就会导致内存泄漏。




 本次的分享就到此为止了,希望我的分享能给您带来帮助,创作不易也欢迎大家三连支持,你们的点赞就是博主更新最大的动力!如有不同意见,欢迎评论区积极讨论交流,让我们一起学习进步!有相关问题也可以私信博主,评论区和私信都会认真查看的,我们下次再见

这篇关于图文详解ThreadLocal:原理、结构与内存泄漏解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1093999

相关文章

基于C++的UDP网络通信系统设计与实现详解

《基于C++的UDP网络通信系统设计与实现详解》在网络编程领域,UDP作为一种无连接的传输层协议,以其高效、低延迟的特性在实时性要求高的应用场景中占据重要地位,下面我们就来看看如何从零开始构建一个完整... 目录前言一、UDP服务器UdpServer.hpp1.1 基本框架设计1.2 初始化函数Init详解

springboot+redis实现订单过期(超时取消)功能的方法详解

《springboot+redis实现订单过期(超时取消)功能的方法详解》在SpringBoot中使用Redis实现订单过期(超时取消)功能,有多种成熟方案,本文为大家整理了几个详细方法,文中的示例代... 目录一、Redis键过期回调方案(推荐)1. 配置Redis监听器2. 监听键过期事件3. Redi

Springboot配置文件相关语法及读取方式详解

《Springboot配置文件相关语法及读取方式详解》本文主要介绍了SpringBoot中的两种配置文件形式,即.properties文件和.yml/.yaml文件,详细讲解了这两种文件的语法和读取方... 目录配置文件的形式语法1、key-value形式2、数组形式读取方式1、通过@value注解2、通过

自定义注解SpringBoot防重复提交AOP方法详解

《自定义注解SpringBoot防重复提交AOP方法详解》该文章描述了一个防止重复提交的流程,通过HttpServletRequest对象获取请求信息,生成唯一标识,使用Redis分布式锁判断请求是否... 目录防重复提交流程引入依赖properties配置自定义注解切面Redis工具类controller

C++ 右值引用(rvalue references)与移动语义(move semantics)深度解析

《C++右值引用(rvaluereferences)与移动语义(movesemantics)深度解析》文章主要介绍了C++右值引用和移动语义的设计动机、基本概念、实现方式以及在实际编程中的应用,... 目录一、右值引用(rvalue references)与移动语义(move semantics)设计动机1

MySQL 筛选条件放 ON后 vs 放 WHERE 后的区别解析

《MySQL筛选条件放ON后vs放WHERE后的区别解析》文章解释了在MySQL中,将筛选条件放在ON和WHERE中的区别,文章通过几个场景说明了ON和WHERE的区别,并总结了ON用于关... 今天我们来讲讲数据库筛选条件放 ON 后和放 WHERE 后的区别。ON 决定如何 "连接" 表,WHERE

Java线程池核心参数原理及使用指南

《Java线程池核心参数原理及使用指南》本文详细介绍了Java线程池的基本概念、核心类、核心参数、工作原理、常见类型以及最佳实践,通过理解每个参数的含义和工作原理,可以更好地配置线程池,提高系统性能,... 目录一、线程池概述1.1 什么是线程池1.2 线程池的优势二、线程池核心类三、ThreadPoolE

Mybatis的mapper文件中#和$的区别示例解析

《Mybatis的mapper文件中#和$的区别示例解析》MyBatis的mapper文件中,#{}和${}是两种参数占位符,核心差异在于参数解析方式、SQL注入风险、适用场景,以下从底层原理、使用场... 目录MyBATis 中 mapper 文件里 #{} 与 ${} 的核心区别一、核心区别对比表二、底

Python中Request的安装以及简单的使用方法图文教程

《Python中Request的安装以及简单的使用方法图文教程》python里的request库经常被用于进行网络爬虫,想要学习网络爬虫的同学必须得安装request这个第三方库,:本文主要介绍P... 目录1.Requests 安装cmd 窗口安装为pycharm安装在pycharm设置中为项目安装req

Python容器转换与共有函数举例详解

《Python容器转换与共有函数举例详解》Python容器是Python编程语言中非常基础且重要的概念,它们提供了数据的存储和组织方式,下面:本文主要介绍Python容器转换与共有函数的相关资料,... 目录python容器转换与共有函数详解一、容器类型概览二、容器类型转换1. 基本容器转换2. 高级转换示