《程序员的自我修养》之线程基础

2024-08-24 09:08

本文主要是介绍《程序员的自我修养》之线程基础,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、线程是程序执行流的最小单位。

2、线程的组成:线程ID、当前指令指针(PC)、寄存器集合、堆栈。

3、进程与线程的关系:
一个进程包含一个或多个线程,每个线程之间共享程序的内存空间及一些进程级的资源(如打开文件和信号)。这里的内存空间包括代码段、数据段、堆栈等。

4、多线程优点:

—>某个操作可能会陷入长时间的等待,多线程执行可以有效利用等待的时间。(例子:等待网络响应)

—>某个操作(如:计算)会消耗大量的时间,如果只有一个线程,程序和用户之间的交互会中断。多线程可以让一个线程负责交互,另一个线程负责计算。—程序逻辑本身要求并发操作(如:一个多段下载软件,比如Bittorrent)

—>多CPU或多核计算机,本身就具备多个线程同时执行的能力。

—>相对于进程,多线程在数据共享方面效率更高。

5、线程的访问权限

线程可以访问进程内存里的所有数据,甚至包括其他线程的堆栈(如果某个线程知道另一个线程的堆栈地址即可)

线程也有自己的私有空间,如下:
1) 栈
2) 线程局部存储(Thread Local Storage,TLS)
3) 寄存器(包括PC寄存器),其是执行流的基本数据,为线程私有

小结:
1) 属于线程私有的有:局部变量、函数的参数、TLS数据
2) 线程之间可共享(进程所有)的有:全局变量、堆上的数据、函数里的静态变量、程序代码、打开的文件(A线程打开的文件可以由B线程读写)

6、进程与线程的一个简单解释(非常贴切)

1) 计算机的核心是CPU,它承担了所有的计算任务。它就像一座工厂,时刻在运行。

2) 假定工厂的电力有限,一次只能供给一个车间使用。也就是说,一个车间开工的时候,其他车间都必须停工。背后的含义就是,单个CPU一次只能运行一个任务。

3) 进程就好比工厂的车间,它代表CPU所能处理的单个任务。任一时刻,CPU总是运行一个进程,其他进程处于非运行状态。

4) 一个车间里,可以有很多工人。他们协同完成一个任务。

5) 线程就好比车间里的工人。一个进程可以包括多个线程。

6) 车间的空间是工人们共享的,比如许多房间是每个工人都可以进出的。这象征一个进程的内存空间是共享的,每个线程都可以使用这些共享内存。

7) 可是,每间房间的大小不同,有些房间最多只能容纳一个人,比如厕所。里面有人的时候,其他人就不能进去了。这代表一个线程使用某些共享内存时,其他线程必须等它结束,才能使用这一块内存。

8) 一个防止他人进入的简单方法,就是门口加一把锁。先到的人锁上门,后到的人看到上锁,就在门口排队,等锁打开再进去。这就叫“互斥锁”(Mutual exclusion,缩写 Mutex),防止多个线程同时读写某一块内存区域。

9) 还有些房间,可以同时容纳n个人,比如厨房。也就是说,如果人数大于n,多出来的人只能在外面等着。这好比某些内存区域,只能供给固定数目的线程使用。

10) 这时的解决方法,就是在门口挂n把钥匙。进去的人就取一把钥匙,出来时再把钥匙挂回原处。后到的人发现钥匙架空了,就知道必须在门口排队等着了。这种做法叫做“信号量”(Semaphore),用来保证多个线程不会互相冲突。

不难看出,mutex是semaphore的一种特殊情况(n=1时)。也就是说,完全可以用后者替代前者。但是,因为mutex较为简单,且效率高,所以在必须保证资源独占的情况下,还是采用这种设计。

7、操作系统的设计,因此可以归结为三点:
(1)以多进程形式,允许多个任务同时运行;
(2)以多线程形式,允许单个任务分成不同的部分运行;
(3)提供协调机制,一方面防止进程之间和线程之间产生冲突,另一方面允许进程之间和线程之间共享资源。

8、线程状态及状态转移
(1)就绪:此时线程可以立刻运行,但CPU已经被占用
(2)运行:此时线程正在执行
(3)等待(阻塞):此时线程正在等待某一事件(通常是I/O或同步)的发生,无法执行
这里写图片描述

1)就绪——运行:对就绪状态的进程,当进程调度程序按一种选定的策略从中选中一个就绪进程,为之分配了处理机后,该进程便由就绪状态变为执行状态;

2)运行——等待:正在执行的进程因发生某等待事件而无法执行,则进程由执行状态变为等待状态,如:进程提出输入/输出请求而变成等待外部设备传输信息的状态,进程申请资源(主存空间或外部设备)得不到满足时变成等待资源状态,进程运行中出现了故障(程序出错或主存储器读写错等)变成等待干预状态等等;

3)等待——就绪:处于等待状态的进程,在其等待的事件已经发生,如输入/输出完成,资源得到满足或错误处理完毕时,处于等待状态的进程并不马上转入执行状态,而是先转入就绪状态,然后再由系统进程调度程序在适当的时候将该进程转为执行状态;

4)运行——就绪:正在执行的进程,因时间片用完而被暂停执行,或在采用抢先式优先级调度算法的系统中,当有更高优先级的进程要运行而被迫让出处理机时,该进程便由执行状态转变为就绪状态。

9、线程调度方法
—优先级调度
—轮转法

10、Windows和Linux关于多线程的区别

–Windows内核有明确的线程和进程的概念。

在Windows API中,可以使用CreateProcess和CreateThread来创建进程和线程,并有一系列的API来操纵它们。

–Linux内核中并不存在真正意义上的线程概念。

Linux将所有的执行实体(不管是线程还是进程)都称之为任务(Task),每一个任务概念上都类似于一个单线程的进程,具有内存空间、执行实体、文件资源等。

Linux的不同任务之间,可以有选择的共享内存空间,因而从实际意义上来看,共享了同一个内存空间的多个任务构成一个进程,这些任务也就构成了这个进程里的线程。

11、Linux创建一个新任务的方法:
–fork:复制当前进程
–exec:使用新的可执行映像覆盖当前可执行映像
–clone:创建子进程并从指定位置开始执行

fork代码如下:

pid_t pid;
if(pid = fork())
{...
}

fork函数产生一个和当前进程完全一样的新进程,并和当前进程一样从fork函数里返回,只是本任务的fork将返回新任务的pid,而新任务的fork将返回0。

注意:fork并不复制原任务的内存空间,而是和原任务一起共享一个写时复制(Copy on Write,COW)的内存空间

注解:什么是写时复制(COW)?
写时复制指的是两个任务可以同时自由的读取内存,但任意一个任务试图对内存进行修改时,内存就会复制一份提供给修改方单独使用,避免影响其他任务的使用。

–fork只能产生本任务的镜像,要启动别的新任务,需要exec的配合。
–exec可以用新的可执行映像替换当前的可执行映像。
–当fork产生一个新任务后,新任务可调用exec来执行新的可执行文件。
–fork和exec用于产生新任务,而要产生新线程,则使用clone。
clone函数原型如下:

int clone(int (*fn) (void*), void* child_stack, int flags, void* arg)

使用clone可以产生一个新的任务,从指定位置开始执行,并且(可选的)共享当前进程的内存空间和文件。

这篇关于《程序员的自我修养》之线程基础的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1102050

相关文章

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以打印WAV音频文件每个packet(也称为数据包或多媒体包)的信息,这些信息包含该packet的pts、dts: 打印出来的“pts”实际是AVPacket结构体中的成员变量pts,是以AVStream->time_base为单位的显

C 语言基础之数组

文章目录 什么是数组数组变量的声明多维数组 什么是数组 数组,顾名思义,就是一组数。 假如班上有 30 个同学,让你编程统计每个人的分数,求最高分、最低分、平均分等。如果不知道数组,你只能这样写代码: int ZhangSan_score = 95;int LiSi_score = 90;......int LiuDong_score = 100;int Zhou

线程的四种操作

所属专栏:Java学习        1. 线程的开启 start和run的区别: run:描述了线程要执行的任务,也可以称为线程的入口 start:调用系统函数,真正的在系统内核中创建线程(创建PCB,加入到链表中),此处的start会根据不同的系统,分别调用不同的api,创建好之后的线程,再单独去执行run(所以说,start的本质是调用系统api,系统的api

c++基础版

c++基础版 Windows环境搭建第一个C++程序c++程序运行原理注释常亮字面常亮符号常亮 变量数据类型整型实型常量类型确定char类型字符串布尔类型 控制台输入随机数产生枚举定义数组数组便利 指针基础野指针空指针指针运算动态内存分配 结构体结构体默认值结构体数组结构体指针结构体指针数组函数无返回值函数和void类型地址传递函数传递数组 引用函数引用传参返回指针的正确写法函数返回数组

【QT】基础入门学习

文章目录 浅析Qt应用程序的主函数使用qDebug()函数常用快捷键Qt 编码风格信号槽连接模型实现方案 信号和槽的工作机制Qt对象树机制 浅析Qt应用程序的主函数 #include "mywindow.h"#include <QApplication>// 程序的入口int main(int argc, char *argv[]){// argc是命令行参数个数,argv是

【MRI基础】TR 和 TE 时间概念

重复时间 (TR) 磁共振成像 (MRI) 中的 TR(重复时间,repetition time)是施加于同一切片的连续脉冲序列之间的时间间隔。具体而言,TR 是施加一个 RF(射频)脉冲与施加下一个 RF 脉冲之间的持续时间。TR 以毫秒 (ms) 为单位,主要控制后续脉冲之前的纵向弛豫程度(T1 弛豫),使其成为显著影响 MRI 中的图像对比度和信号特性的重要参数。 回声时间 (TE)

java线程深度解析(六)——线程池技术

http://blog.csdn.net/Daybreak1209/article/details/51382604 一种最为简单的线程创建和回收的方法: [html]  view plain copy new Thread(new Runnable(){                @Override               public voi