1.1.1.多线程的发展--对cpu性能的压榨史

2023-12-10 15:44

本文主要是介绍1.1.1.多线程的发展--对cpu性能的压榨史,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一.压榨历史

1.单进程人工切换。纸带机。只能解决简单的数学问题。

2.单道批处理。多进程批处理。多个任务批量执行。解决手动操作时需要人工切换作业导致的系统利用率低的问题

3.多进程并行处理。把程序写在不同的内存位置来回切换。当一个作业在等待I/O处理时,多批处理系统会通过相应调度算法调度另外一个作业让计算机执行

4.多线程。一个程序内部不同任务的来回切换。实现进程中任务的切换,又可以避免进程切换内存地址空间(将计算机实际调度的单元转到线程)。

5.纤程/协程与管程

二.相关含义介绍

什么是程序?什么是进程?什么是进程?什么是纤程/协程、管程?

1.程序-->抽象概念

操作系统可以执行的一个计算机文件。是一组计算机能识别和执行的指令序列。如QQ.exe

2.进程-->静态概念

进程是程序计算机(内存)中的一次运行活动。更通俗一点来说:进程是程序的实例化(类似于程序是class,进程是class的对象)。

进程是系统进行资源分配的基本单位,进程是线程的容器。

3.线程-->动态概念

一条线程指的是进程中一个单一顺序的执行路线(也可以说是执行流、控制流)。即进程中的实际运行单位。

资源调度的基本单位。

4.线程上下文

线程上下文是指某一时间点 CPU 寄存器和程序计数器的内容。

4.1.使用场景

上下文切换 (context switch) 。即任务切换, 或者CPU寄存器切换。

当多任务内核决定运行另外的任务时, 它保存正在运行任务的当前状态, 也就是CPU寄存器中的全部内容。这些内容被保存在任务自己的堆栈中, 入栈工作完成后就把下一个将要运行的任务的当前状况从该任务的栈中重新装入CPU寄存器, 并开始下一个任务的运行, 这一过程就是context switch。

4.2.上下文切换带来的问题

程序执行效率与线程并发数,从正相关变为负相关;

三.思考问题

1.单核的CPU设定多线程是否有意义?

其实个人的观点是,需要分析多线程的本质-->是对cpu性能的压榨。

那么,如果说单线程已经达到非常好的cpu利用率,则使用多线程意义不是太大。这种作业就称为cpu密集型(性能瓶颈是CPU运算)。

相对的,将性能瓶颈是IO(网络通信、硬盘读写、阻塞等待等)的作业称为io密集型。因为这种作业会造成cpu空闲,而使用多线程可显著减少此情况。

2.工作线程数是不是设置得越大越好?

a.先看一个示例:
package com.pavin.thread;
​
import java.text.DecimalFormat;
import java.util.Random;
import java.util.concurrent.CountDownLatch;
​
public class multiThread_01 {
​private static double[] nums = new double[1_0000_0000];private static Random r = new Random();private static DecimalFormat df = new DecimalFormat("0.00");static {for (int j = 0; j < nums.length; j++) {nums[j] = r.nextDouble();}}
​private static void singleThread() {long start = System.currentTimeMillis();
​double result = 0.0;for (int j = 0; j < nums.length; j++) {result += nums[j];}
​long end = System.currentTimeMillis();System.out.println("1   " + " singleThread: cost " + (end-start) + "ms result: " + df.format(result));}
​static double result1 = 0.0, result2 = 0.0, result3 = 0.0;private static void twoThreads() throws InterruptedException {
​Thread t1 = new Thread(() -> {for (int j = 0; j < nums.length / 2; j++) {result1 += nums[j];}});
​Thread t2 = new Thread(() -> {for (int j = nums.length / 2; j < nums.length; j++) {result2 += nums[j];}});
​long start = System.currentTimeMillis();t1.start();t2.start();t1.join();t2.join();
​result3 = result1 + result2;long end = System.currentTimeMillis();System.out.println("2   " + " Threads: cost " + (end-start) + "ms result: " + df.format(result3));}
​private static void multiThreads(int threadCount) throws InterruptedException {
​Thread[] threads = new Thread[threadCount];double[] results = new double[threadCount];final int segmentCount = nums.length / threadCount;CountDownLatch latch = new CountDownLatch(threadCount);
​for (int i = 0; i < threadCount; i++) {int m = i;
​threads[i] = new Thread(() -> {for (int j = m * segmentCount; j < (m+1) * segmentCount && j < nums.length; j++) {results[m] += nums[j];}});
​latch.countDown();}
​double result = 0.0;long start = System.currentTimeMillis();for (Thread t : threads) {t.start();}
​latch.await();for (double v : results) {result += v;}
​long end = System.currentTimeMillis();System.out.println(threadCount + " Threads: cost " + (end-start) + "ms result: " + df.format(result));}
​public static void main(String[] args) throws InterruptedException {singleThread();twoThreads();
​multiThreads(10000);}
}

输出结果:

1    singleThread: cost 134ms result: 49997084.08
2    Threads: cost 78ms result: 49997084.08
10000 Threads: cost 1012ms result: 49997084.08

由此可见,使用两个线程时明显比一个线程更快,但是使用10000个线程时,非常慢。所以线程并不是越大越好。

b.造成效率下降的原因

见线程上下文

3.工作线程数(线程池中的线程数量)设置为多少合适?

公式+压测

a.公式

CPU密集型:理论上线程的数量=CPU核数最合适。

不过实际中一般会设为CPU核数+1。此时当线程因为偶尔的内存页失效或其他原因导致阻塞时,这个额外的线程可以顶上,从而保证CPU的利用率

IO密集型 :线程数 = CPU核心数 * 目标CPU利用率 *(1+平均等待时间/平均工作时间)

b.实际中的问题
i.环境开销

比如一个普通的SpringBoot 为基础的业务系统,默认Tomcat容器+HikariCP连接池+G1回收器。

Tomcat有自己的线程池,HikariCP也有自己的后台线程,JVM也有一些编译的线程,连G1都有自己的后台线程。这些线程也是运行在当前进程、当前主机上的,也会占用CPU的资源。

ii.测算"平均等待时间"、“平均工作时间”

方法1,通过日志和统计的方式得出。

方法2,第三方工具:profiler/Jprofiler

c.实际策略

一般情况下,内部业务系统相对于性能,更注重稳定好用、符合需求。实际生产推荐的线程数:CPU核心数+1

这篇关于1.1.1.多线程的发展--对cpu性能的压榨史的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/477539

相关文章

C#使用yield关键字实现提升迭代性能与效率

《C#使用yield关键字实现提升迭代性能与效率》yield关键字在C#中简化了数据迭代的方式,实现了按需生成数据,自动维护迭代状态,本文主要来聊聊如何使用yield关键字实现提升迭代性能与效率,感兴... 目录前言传统迭代和yield迭代方式对比yield延迟加载按需获取数据yield break显式示迭

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6

使用Python检查CPU型号并弹出警告信息

《使用Python检查CPU型号并弹出警告信息》本教程将指导你如何编写一个Python程序,该程序能够在启动时检查计算机的CPU型号,如果检测到CPU型号包含“I3”,则会弹出一个警告窗口,感兴趣的小... 目录教程目标方法一所需库步骤一:安装所需库步骤二:编写python程序步骤三:运行程序注意事项方法二

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

usaco 1.1 Broken Necklace(DP)

直接上代码 接触的第一道dp ps.大概的思路就是 先从左往右用一个数组在每个点记下蓝或黑的个数 再从右到左算一遍 最后取出最大的即可 核心语句在于: 如果 str[i] = 'r'  ,   rl[i]=rl[i-1]+1, bl[i]=0 如果 str[i] = 'b' ,  bl[i]=bl[i-1]+1, rl[i]=0 如果 str[i] = 'w',  bl[i]=b

黑神话,XSKY 星飞全闪单卷性能突破310万

当下,云计算仍然是企业主要的基础架构,随着关键业务的逐步虚拟化和云化,对于块存储的性能要求也日益提高。企业对于低延迟、高稳定性的存储解决方案的需求日益迫切。为了满足这些日益增长的 IO 密集型应用场景,众多云服务提供商正在不断推陈出新,推出具有更低时延和更高 IOPS 性能的云硬盘产品。 8 月 22 日 2024 DTCC 大会上(第十五届中国数据库技术大会),XSKY星辰天合正式公布了基于星

【WebGPU Unleashed】1.1 绘制三角形

一部2024新的WebGPU教程,作者Shi Yan。内容很好,翻译过来与大家共享,内容上会有改动,加上自己的理解。更多精彩内容尽在 dt.sim3d.cn ,关注公众号【sky的数孪技术】,技术交流、源码下载请添加微信号:digital_twin123 在 3D 渲染领域,三角形是最基本的绘制元素。在这里,我们将学习如何绘制单个三角形。接下来我们将制作一个简单的着色器来定义三角形内的像素