深入理解Linux线程(LWP):概念、结构与实现机制(1)

2024-02-29 23:12

本文主要是介绍深入理解Linux线程(LWP):概念、结构与实现机制(1),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

                                               🎬慕斯主页修仙—别有洞天

                                              ♈️今日夜电波:会いたい—Naomile

                                                                1:12━━━━━━️💟──────── 4:59
                                                                    🔄   ◀️   ⏸   ▶️    ☰  

                                      💗关注👍点赞🙌收藏您的每一次鼓励都是对我莫大的支持😍


 

目录

Linux线程的概念

定义

从进程理解线程

Linux线程的理解

局部性原理

概念

线程切换为什么效率高?


Linux线程的概念

定义

        课本上的定义:线程是比进程更轻量化的一种执行流,线程是在进程内部执行的一种执行流。大白话:线程是CPU调度的基本单位,进程是承担系统资源的基本实体。

        对于Linux线程详细的定义:在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序列。一切进程至少都有一个执行线程。线程在进程内部运行,本质是在进程地址空间内运行。在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化。透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就形成了线程执行流 。

 

从进程理解线程

        我们都知道Linux中的一个进程是由对应的PCB、进程地址空间、页表组成的。

        大致的图示如下:

        从上面进程的大致示意图可见,如果我们要创建一个进程,还是挺麻烦的,它要创建对应的PCB来管理,要加载各种各样的数据,涉及到IO等等。可以发现成本是挺高的。进程在创建时需要做很多工作。而线程就是在进程创建完成后,只需再创建“PCB”指向该进程的地址空间,再将代码数据等等拆解成几部分,分别让这些“PCB”进行管理对应的部分,他无需再进行资源的申请等等操作,只需进行资源的分配即可。CPU在识别到这些“PCB”时,他就会执行该进程的一部分代码、一部分数据,我们把这种比传统的进程更轻的概念叫做“线程”。当然,由于线程访问的是同一块地址空间,那么他们是很容易实现某一部分代码、数据的共享的。

        而如果OS如果要支持线程,那么也是需要管理线程的,那么就需要按照六字真言:“先描述,在组织”来进行管理。对此OS中有两种管理线程的方法:方法一:按照像上述进程一样创建PCB,额外的像进程一样创建名为:TCB(Thread Control Block)来描述,再像进程一样创建调度队列、阻塞队列、运行队列、优先级等等等等。还需要对应的数据结构、算法等等来维护起来方法二:从方法一可以知道线程所需的属性跟进程是很相似的,我们可以“拿PCB来充当TCB”,可以直接复用进程的管理方法来管理线程。在Linux中,我们就是使用方法二来管理线程的,很明显方法二更简单,更加可靠,健壮性更,更好维护。Linux中线程也叫做:轻量级进程(LWP)(light weight process)大致图示如下:

        从上图可知,Linux中其实不存在实际意义上的线程,他只是利用进程的数据结构来模拟了线程,所以CPU在调度时,他不管进程还是线程,他看到一个PCB就会执行对应的方法,他们都可以被称为“轻量级进程”。因此,上面对应的线程的执行流<=进程的执行流。

Linux线程的理解

        通过代码来理解Linux线程(对于下面的一些线程相关函数后续详细介绍):

#include <iostream>
#include <unistd.h>
#include <pthread.h>
#include <sys/types.h>
#include <unistd.h>int gcnt = 100;// 新线程
void *ThreadRoutine(void *arg)
{const char *threadname = (const char *)arg;while (true){std::cout << "I am a new thread: " << threadname << ", pid: " << getpid() << "gcnt: " << gcnt << " &gcnt: " << &gcnt << std::endl;gcnt--;sleep(1);}
}int main()
{pthread_t tid;pthread_create(&tid, NULL, ThreadRoutine, (void *)"thread 1");//创建进程while (true){std::cout << "I am main thread"<< ", pid: " << getpid()  << "gcnt: " << gcnt << " &gcnt: " << &gcnt << std::endl;sleep(1);}return 0;
}

        如下图可知:我们创建了一个线程,在创建线程后,可以很明显的看到我们共享了全局变量。对于创建了一个线程前,我们可以理解为原来只有一个线程(也就是进程)。后来创建了一个线程后,我们就拥有了两个线程,通过传入对应的函数即可区分两个进程,他们还可以共享同一段代码(全局变量)

        我们可以通过以下代码查看线程:

ps -aL 

局部性原理

概念

        局部性原理是指在程序执行期间,无论是指令还是数据的访问都倾向于聚集在一个较小的连续区域中。它主要分为两种类型:

  • 时间局部性:如果一个指令或数据刚刚被访问过,那么它将很可能在不久的将来再次被访问。这种现象是由于程序中存在循环和迭代等结构,导致相同的指令或数据被重复使用。
  • 空间局部性:如果一个指令或数据被访问,那么与其相邻的指令或数据也很可能即将被访问。这是因为程序往往是顺序执行的,指令和数据在内存中的位置通常是连续的,因此访问也是连续的。

        局部性原理是计算机体系结构中的一个重要概念,它直接影响了CPU缓存的设计和操作系统的内存管理策略。了解和利用局部性原理,可以帮助开发者编写更高效的程序,同时也指导硬件设计者优化处理器性能。

线程切换为什么效率高?

        CUP中存在着一个硬件叫做cache,他通常用于用于存储最近访问的数据和指令以提高计算机性能

        局部性原理给预加载机制提供了理论基础,预加载机制可以将一部分代码预先加载到缓冲区里,如果CPU正在访问第10行代码,以后很大概率会访问附近的代码,所以一旦访问到第10行就会把10行附近的数据和代码全部加载到内存中或者CPU的cache中。保存在cache中的数据叫做热数据。cache在缓存时是以线程为单位的,线程间切换不需要切换cache,因为他们同属于一个进程,而进程间切换需要切换cache,重新预加载。为什么线程切换为什么比进程高?因为:1、寄存器少。2、不需要重新更新cache。

 


                       感谢你耐心的看到这里ღ( ´・ᴗ・` )比心,如有哪里有错误请踢一脚作者o(╥﹏╥)o! 

                                       

                                                                        给个三连再走嘛~  

这篇关于深入理解Linux线程(LWP):概念、结构与实现机制(1)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/760411

相关文章

使用Python实现矢量路径的压缩、解压与可视化

《使用Python实现矢量路径的压缩、解压与可视化》在图形设计和Web开发中,矢量路径数据的高效存储与传输至关重要,本文将通过一个Python示例,展示如何将复杂的矢量路径命令序列压缩为JSON格式,... 目录引言核心功能概述1. 路径命令解析2. 路径数据压缩3. 路径数据解压4. 可视化代码实现详解1

PyQt6/PySide6中QTableView类的实现

《PyQt6/PySide6中QTableView类的实现》本文主要介绍了PyQt6/PySide6中QTableView类的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学... 目录1. 基本概念2. 创建 QTableView 实例3. QTableView 的常用属性和方法

PyQt6/PySide6中QTreeView类的实现

《PyQt6/PySide6中QTreeView类的实现》QTreeView是PyQt6或PySide6库中用于显示分层数据的控件,本文主要介绍了PyQt6/PySide6中QTreeView类的实现... 目录1. 基本概念2. 创建 QTreeView 实例3. QTreeView 的常用属性和方法属性

Android使用ImageView.ScaleType实现图片的缩放与裁剪功能

《Android使用ImageView.ScaleType实现图片的缩放与裁剪功能》ImageView是最常用的控件之一,它用于展示各种类型的图片,为了能够根据需求调整图片的显示效果,Android提... 目录什么是 ImageView.ScaleType?FIT_XYFIT_STARTFIT_CENTE

pandas中位数填充空值的实现示例

《pandas中位数填充空值的实现示例》中位数填充是一种简单而有效的方法,用于填充数据集中缺失的值,本文就来介绍一下pandas中位数填充空值的实现,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是中位数填充?为什么选择中位数填充?示例数据结果分析完整代码总结在数据分析和机器学习过程中,处理缺失数

Golang HashMap实现原理解析

《GolangHashMap实现原理解析》HashMap是一种基于哈希表实现的键值对存储结构,它通过哈希函数将键映射到数组的索引位置,支持高效的插入、查找和删除操作,:本文主要介绍GolangH... 目录HashMap是一种基于哈希表实现的键值对存储结构,它通过哈希函数将键映射到数组的索引位置,支持

Pandas使用AdaBoost进行分类的实现

《Pandas使用AdaBoost进行分类的实现》Pandas和AdaBoost分类算法,可以高效地进行数据预处理和分类任务,本文主要介绍了Pandas使用AdaBoost进行分类的实现,具有一定的参... 目录什么是 AdaBoost?使用 AdaBoost 的步骤安装必要的库步骤一:数据准备步骤二:模型

使用Pandas进行均值填充的实现

《使用Pandas进行均值填充的实现》缺失数据(NaN值)是一个常见的问题,我们可以通过多种方法来处理缺失数据,其中一种常用的方法是均值填充,本文主要介绍了使用Pandas进行均值填充的实现,感兴趣的... 目录什么是均值填充?为什么选择均值填充?均值填充的步骤实际代码示例总结在数据分析和处理过程中,缺失数

Java对象转换的实现方式汇总

《Java对象转换的实现方式汇总》:本文主要介绍Java对象转换的多种实现方式,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录Java对象转换的多种实现方式1. 手动映射(Manual Mapping)2. Builder模式3. 工具类辅助映

Go语言开发实现查询IP信息的MCP服务器

《Go语言开发实现查询IP信息的MCP服务器》随着MCP的快速普及和广泛应用,MCP服务器也层出不穷,本文将详细介绍如何在Go语言中使用go-mcp库来开发一个查询IP信息的MCP... 目录前言mcp-ip-geo 服务器目录结构说明查询 IP 信息功能实现工具实现工具管理查询单个 IP 信息工具的实现服