高性能服务系列【十二】终篇:等待的代价

2024-04-03 00:28

本文主要是介绍高性能服务系列【十二】终篇:等待的代价,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

上一篇《主题匹配》入选CSDN的区块链领域内容榜,最早我看到的时候是排行榜34名,写这篇文章的时候已经落到了46名。虽然我没有觉得和区域链有什么关系,估计入选的原因是那篇文章涉及到几个算法吧。

在整个高性能服务系列中,我很少提及算法,倒不是说和算法没有关系,确切地说,性能本身是很难脱离算法的。一个原因是算法涉及的内容过于庞杂,见《算法导论》和高纳德的《计算机程序设计艺术》;另外一个原因,性能涉及到的算法并不会太多,反而是追求简单,加上系统级别的加成。

我们在总结高性能服务系列的核心关键是减少等待时间,而尽可能让CPU有效的跑满,重点提示,是有效的CPU时间。排除显而易见的网络IO、磁盘IO或者其他慢速服务,以及代码BUG导致死锁等。

我们假设一切都是正常的,没有低级错误,那么影响性能的几个因素,在之前几个篇章都提到过,这里做下总结。

一、锁互斥

这个不需要太多解释,锁互斥对性能的影响有两个:1、临界区资源只能被一个线程访问,其他线程等待导致的性能损失;2、等待线程被系统调度,切换出执行区间,再次进入可执行状态,需要重新加载内存。

为了降低锁互斥导致的等待时间,就要缩小临界区,使得进出临界区的执行时间尽可能的小。然后,再加上自旋锁,使得等待线程不需要被切换让出CPU执行时间。

或者更干脆地采用无锁数据结构,避免锁互斥,标本兼治。但无锁数据结构极为复杂,要编写一个正确的无锁数据结构,殊为不易,性价比太低。

如果从架构设计上,去减少需要被互斥共享的临界区,也是个不错的解决方案,从理论上讲是可行的。

二、系统调用

系统调用并不像锁那样容易理解,因为调用系统API简单而自然。一般不会注意到一个简单的系统调用,需要从用户空间切换到系统空间,要经过多个调用链。

我们之前提到过linux的futex调用,就是尽量将锁停留在用户空间,除非迫不得已,才会进行系统调用。windows下也有类似的API。

三,等待唤醒

有了等待,也同样有唤醒,比如条件变量,windows和Linux下都有。使用条件变量,就会涉及到互斥锁,见第一节。条件变量和信号量唤醒机制,都会出现虚假唤醒和唤醒丢失。虚假唤醒,比如惊群效应,最多损失性能,而唤醒丢失就比较严重了,不单是损失性能,甚至导致程序错误。唤醒丢失在条件变量时,还特别容易出现,需要警惕。windows下的事件,Event算是一种特殊的信号量,不单独论述。

四、内存分配

内存分配所需要的时间,也很容易被忽视。考察那些高性能软件源码,大部分都会自己定制一个内存分配器,或者引入第三方tcmalloc和jemalloc。传统的ptmalloc分配小块内存的代价比较大,远不如tcmalloc和jemalloc效果好,ptmalloc2已经做了不少优化。


内存分配之所以代价比较大,有这么几个方面。1、内存和地址空间是全局,因此在分配时,存在互斥的。2、小内存分配和释放是基本操作,调用频繁,所以对性能的影响很明显。

要自己定制一个内存分配器,代价比较大,还不如tcmalloc和jemalloc,但在一些特殊场景下,比如类似流水线的场景,就容易实现,也值得去定制一个内存分配器。

五、内存刷新

内存一致性协议导致的等待,因为是纳秒级别的,基本被忽视。只有用到原子操作,追求高性能的时候,才会被重视。题外话,用到原子操作时,必须特别注意到内存屏障。c++11引入了原子,std::memory_order集成了内存屏障,因此,需要理解每个memory_order的含义。

这篇关于高性能服务系列【十二】终篇:等待的代价的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/871463

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

MySQL高性能优化规范

前言:      笔者最近上班途中突然想丰富下自己的数据库优化技能。于是在查阅了多篇文章后,总结出了这篇! 数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 临时库表必须以tmp_为前缀并以日期为后缀,备份

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

【区块链 + 人才服务】区块链集成开发平台 | FISCO BCOS应用案例

随着区块链技术的快速发展,越来越多的企业开始将其应用于实际业务中。然而,区块链技术的专业性使得其集成开发成为一项挑战。针对此,广东中创智慧科技有限公司基于国产开源联盟链 FISCO BCOS 推出了区块链集成开发平台。该平台基于区块链技术,提供一套全面的区块链开发工具和开发环境,支持开发者快速开发和部署区块链应用。此外,该平台还可以提供一套全面的区块链开发教程和文档,帮助开发者快速上手区块链开发。

flume系列之:查看flume系统日志、查看统计flume日志类型、查看flume日志

遍历指定目录下多个文件查找指定内容 服务器系统日志会记录flume相关日志 cat /var/log/messages |grep -i oom 查找系统日志中关于flume的指定日志 import osdef search_string_in_files(directory, search_string):count = 0

GPT系列之:GPT-1,GPT-2,GPT-3详细解读

一、GPT1 论文:Improving Language Understanding by Generative Pre-Training 链接:https://cdn.openai.com/research-covers/languageunsupervised/language_understanding_paper.pdf 启发点:生成loss和微调loss同时作用,让下游任务来适应预训

基于SpringBoot的宠物服务系统+uniapp小程序+LW参考示例

系列文章目录 1.基于SSM的洗衣房管理系统+原生微信小程序+LW参考示例 2.基于SpringBoot的宠物摄影网站管理系统+LW参考示例 3.基于SpringBoot+Vue的企业人事管理系统+LW参考示例 4.基于SSM的高校实验室管理系统+LW参考示例 5.基于SpringBoot的二手数码回收系统+原生微信小程序+LW参考示例 6.基于SSM的民宿预订管理系统+LW参考示例 7.基于

Java基础回顾系列-第七天-高级编程之IO

Java基础回顾系列-第七天-高级编程之IO 文件操作字节流与字符流OutputStream字节输出流FileOutputStream InputStream字节输入流FileInputStream Writer字符输出流FileWriter Reader字符输入流字节流与字符流的区别转换流InputStreamReaderOutputStreamWriter 文件复制 字符编码内存操作流(