乱序和屏障2 : UP单核需要处理的CPU乱序问题

2023-10-21 10:50

本文主要是介绍乱序和屏障2 : UP单核需要处理的CPU乱序问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 前言
    • 弱内存顺序模型
    • 屏障指令的封装
        • rmb/wmb/mb
        • armv7
        • ARMv8
        • RV32&RV64
    • mb/rmb/wmb 的应用
        • 执行流分析
        • 情景1 单用户流
        • 情景2 用户流与异常流

前言

UP : (Uni-Processor)编译器乱序 对应的 编译器 内存屏障 问题 已经在 https://blog.csdn.net/u011011827/article/details/124563277
中提及, 并 做了实验接着 我们 讨论一下 单核需要处理的CPU乱序问题
这个和架构相关
我们主要考察 arm32/arm64/rv32/rv64
他们都是弱内存顺序模型 , 我们先就 弱内存顺序模型考察一番

弱内存顺序模型

对 load & store 的执行顺序没有要求, 只要不将依赖相关的指令乱序,则可以任意乱序
例如 如下,只要没有依赖,都可以乱序(但不一定100%乱序) // 格式为 before-store
load-load
store-store
load-store
store-load

屏障指令的封装

rmb/wmb/mb
读内存屏障本线程所有后续的读操作均在本条指令以后执行
写内存屏障本线程所有之前的写操作均在本条指令以前执行
读写内存屏障本线程所有之前的读写操作均在本条指令以前执行
armv7

在这里插入图片描述

注意 : ARMv7 没有 LD 选项 . ARMv8 有
以Inner Shareable(ISH)为例使用"SY"可防止 所有的 的reorder (read&write memory barrier)load-loadstore-storeload-storestore-load
使用"ST"防止以下的乱序 (write memory barrier)store-store
#define dsb(opt) __asm__ __volatile__ ("dsb " #opt : : : "memory")
#define mb()            dsb() // 等同于 dsb(sy)
#define rmb()           dsb() // 等同于 dsb(sy)
#define wmb()           dsb(st)
ARMv8

在这里插入图片描述

write-read 即 store-load 没必要 屏障吗?没有必要 // TODO如果有依赖,自然不会乱序如果没有依赖,store什么时候发生以及完成都无所谓
#define dsb(opt) __asm__ __volatile__ ("dsb " #opt : : : "memory")
#define mb()            dsb(sy)
#define rmb()           dsb(ld)
#define wmb()           dsb(st)
RV32&RV64

在这里插入图片描述

#define RISCV_FENCE(p, s) \__asm__ __volatile__ ("fence " #p "," #s : : : "memory")#define mb()            RISCV_FENCE(iorw,iorw)
#define rmb()           RISCV_FENCE(ir,ir)
#define wmb()           RISCV_FENCE(ow,ow)

mb/rmb/wmb 的应用

执行流分析
如果只有一个执行流,应该没啥问题, 因为 有依赖关系的指令 不会乱序如果我改了下一条指令呢?是不是要 刷新一下流水线目前 我的代码里面有两个 执行流一个是正常的用户执行流一个是异常执行流
那么就考虑 mb/rmb/wmb 在 两个执行流中会导致的问题
情景1 单用户流
不加屏障的情况command1 	// 改了 command3 所在的地址 的指令 为 异常产生指令(svc/ecall)command2    // nop 指令command3 	// command3 指令(待修改 为 svc/ecall)
加了屏障的情况command1 	// 改了 command3 所在的地址 的指令 为 异常产生指令(svc/ecall)command2    // mb 指令command3 	// command3 指令(待修改 为 svc/ecall)结果 :不加屏障 : command3 已经被加载到 pipeline , 还是执行 原来的 command3加屏障 : command3 已经被加载到 pipeline , 然后flush pipeline , 执行 svc/ecall
实验代码:https://gitee.com/suweishuai/baremetal/commit/b5bd7565c84bf4ad69e4773719b8d6082df086ef
情景2 用户流与异常流
// 初始化 flag = 0 ;
// 初始化 data = 0 ;
User:while (flag == 0);  	// U1printf("%d\n",data); 	// U2
Execption:data = 0x200;			// E1flag = 1;  				// E2会有两个问题:Q1 :User flow 里面  U2 先于 U1 执行 ? Q2 :Execption flow 里面 E2 先于 E1 执行, E1 还未执行,此时 Execption 切出,然后 U1 U2 执行,打印 了 0Q1 可以测试
Q2 不可测试(因为Execption 不会在那时切出) // 只有 如下情况才可测试UserA:while (flag == 0);  	// UA1printf("%d\n",data); 	// UA2UserB:data = 0x200;			// UB1flag = 1;  				// UB2UserB flow 里面 UB2 先于 UB1 执行, UB1 还未执行,此时 UserB 切出,然后 UA1 UA2 执行,打印 了 0Q1 实际情况 // 在四种架构下都不会有 U2 先于 U1 执行 的情况 , 这里拿aarch64来说U1 反汇编 为 U1.1 U1.2 U1.3U2 反汇编 为 U2.1 U2.2 U2.3 U2.4// 看起来也没有依赖,为什么不会发生乱序呢? // TODO40005e44:   b9402be0    ldr w0, [sp, #40]  					// U1.140005e48:   7100001f    cmp w0, #0x0 						// U1.240005e4c:   54ffffc0    b.eq    40005e44 <new_fun+0x74>     // U1.340005e50:   b94027e1    ldr w1, [sp, #36] // 开始准备调用 printf  	// U2.140005e54:   f0000000    adrp    x0, 40008000 <__func__.0+0x2a8>		// U2.240005e58:   91272000    add x0, x0, #0x9c8  						// U2.340005e5c:   97fff414    bl  40002eac <printf> 						// U2.4

这篇关于乱序和屏障2 : UP单核需要处理的CPU乱序问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/253901

相关文章

Pyserial设置缓冲区大小失败的问题解决

《Pyserial设置缓冲区大小失败的问题解决》本文主要介绍了Pyserial设置缓冲区大小失败的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录问题描述原因分析解决方案问题描述使用set_buffer_size()设置缓冲区大小后,buf

resultMap如何处理复杂映射问题

《resultMap如何处理复杂映射问题》:本文主要介绍resultMap如何处理复杂映射问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录resultMap复杂映射问题Ⅰ 多对一查询:学生——老师Ⅱ 一对多查询:老师——学生总结resultMap复杂映射问题

java实现延迟/超时/定时问题

《java实现延迟/超时/定时问题》:本文主要介绍java实现延迟/超时/定时问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java实现延迟/超时/定时java 每间隔5秒执行一次,一共执行5次然后结束scheduleAtFixedRate 和 schedu

如何解决mmcv无法安装或安装之后报错问题

《如何解决mmcv无法安装或安装之后报错问题》:本文主要介绍如何解决mmcv无法安装或安装之后报错问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mmcv无法安装或安装之后报错问题1.当我们运行YOwww.chinasem.cnLO时遇到2.找到下图所示这里3.

浅谈配置MMCV环境,解决报错,版本不匹配问题

《浅谈配置MMCV环境,解决报错,版本不匹配问题》:本文主要介绍浅谈配置MMCV环境,解决报错,版本不匹配问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录配置MMCV环境,解决报错,版本不匹配错误示例正确示例总结配置MMCV环境,解决报错,版本不匹配在col

Vue3使用router,params传参为空问题

《Vue3使用router,params传参为空问题》:本文主要介绍Vue3使用router,params传参为空问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录vue3使用China编程router,params传参为空1.使用query方式传参2.使用 Histo

SpringBoot首笔交易慢问题排查与优化方案

《SpringBoot首笔交易慢问题排查与优化方案》在我们的微服务项目中,遇到这样的问题:应用启动后,第一笔交易响应耗时高达4、5秒,而后续请求均能在毫秒级完成,这不仅触发监控告警,也极大影响了用户体... 目录问题背景排查步骤1. 日志分析2. 性能工具定位优化方案:提前预热各种资源1. Flowable

Python FastAPI+Celery+RabbitMQ实现分布式图片水印处理系统

《PythonFastAPI+Celery+RabbitMQ实现分布式图片水印处理系统》这篇文章主要为大家详细介绍了PythonFastAPI如何结合Celery以及RabbitMQ实现简单的分布式... 实现思路FastAPI 服务器Celery 任务队列RabbitMQ 作为消息代理定时任务处理完整

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面