Cache Maintenance-通过VA对cache进行clean和invalidate操作-汇编程序详解

本文主要是介绍Cache Maintenance-通过VA对cache进行clean和invalidate操作-汇编程序详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

cache操作相关寄存器:CTR

程序1:清除指定的一段地址空间的缓存

读取CTR获取cache line 的大小

使用cache line的size作为虚拟地址的步进值,循环清理缓存

程序2:清理某个指定地址的cache line


cache操作相关寄存器:CTR

CTR寄存器负责提供寄存器的基础结构:

 其中用于获取数据缓存和指令缓存的cache line 的大小的字段分别为:

  •  DminLine, bits [19:16] ,为log2(the number of words),单位为word。
  •  IminLine, bits [3:0],同上。

CTR示例: 

 在这个例子中,CTR的值为0x8444804,二进制编码为:

由此可得:

[19:16]字段的值为0b100,十进制为4,所以一个cache line 的大小为 2^4 = 16 words,为16个字,换成字节为:64字节(1 word = 4 bytes)。

详细解析可参考博文:关于cache maintenance 操作的四个寄存器(CTR,CLIDR,CSSELR,CCSIDR)解析 

程序1:清除指定的一段地址空间的缓存

地址空间的基址保存在:寄存器X0

需要清理的地址空间长度保存在:寄存器X1

该代码通过虚拟地址VA,清理清除数据和指令缓存,该虚拟地址用于从寄存器x0中给定的基址和寄存器x1中给定的长度开始的区域。

//
// X0 = base address 
// X1 = length (we assume the length is not 0)
// Calculate end of the region 
ADD x1, x1, x0               // Base Address + Length
//
// Clean the data cache by MVA 
MRS X2, CTR_EL0             // Read Cache Type Register
// Get the minimun data cache lineUBFX X4, X2, #16, #4       // Extract DminLine (log2 of the cache line)
MOV X3, #4                 // Dminline iss the number of words (4 bytes)
LSL X3, X3, X4             // X3 should contain the cache line
SUB X4, X3, #1             // get the mask for the cache line
BIC X4, X0, X4             // Aligned the base address of the region
clean data cache: 
DC CVAU, X4                // Clean data cache line by VA to PoU
ADD X4, X4, X3             // Next cache line
CMP X4, X1                 // Is X4 (current cache line) smaller than the end // of the region
B.LT clean_data_cache      // while (address < end_address)
DSB ISH                    // Ensure visibility of the data cleaned from cache

读取CTR获取cache line 的大小

MRS X2, CTR_EL0             // 读取Cache Type Register

UBFX X4, X2, #16, #4       // 抽取DminLine 字段(log2 of the cache line)
MOV X3, #4                 // Dminline is the number of words (4 bytes)
LSL X3, X3, X4             // X3=4 * 2^(X4)

 寄存器X3中保存的即是数据缓存的cache line的大小,以换算成字节(bytes)为单位。

使用cache line的size作为虚拟地址的步进值,循环清理缓存

SUB X4, X3, #1             // 获取cache line的掩码,假设line size为64(0b1000000)字节,减1操作后,X4的值为0b111111
BIC X4, X0, X4             // 清除基址X0的前6位,相当于对其取整,使得基址能够整除cache line大小的字节数(64),

 使用虚拟地址VA作为操作对象清理缓存,一次只能清理一个与该地址对应的cache line。

所以被操作的地址需要能够被cache line 的size整除。 

clean data cache: 
DC CVAU, X4                // Clean data cache line by VA to PoU
ADD X4, X4, X3             // 由于一个字节对应一个地址,地址加上一个cache line的字节数,相当于指向下一个 cache line的地址
CMP X4, X1                 // 地址空间为[X4:X0],判断当前地址是否还在区间内,如果还在,则继续清理操作
B.LT clean_data_cache      // while (address < end_address)
DSB ISH                    // 内存屏障,同步上下文 

 只需更改DC CVAU, X4 这条指令,就可以对不同的cache进行清理清除操作。

程序2:清理某个指定地址的cache line

 X0:保存需要清理的虚拟地址

假设此时cache line 的大小为64(0b100 0000 = 0x40)字节

与程序1同理,清理地址前先判断该地址是否能被cache line的大小整除。

假设X0中保存的地址为0x4400 0010,cache line的大小为0x40字节,不能被其整除。

以该地址为起始地址,需要被清理的一个cache line大小的地址空间范围为:0x4400 0010 ~ 0x4400 0050,该地址空间占了两个cache line:

  • 0x4400 0000 ~ 0x4400 0040
  • 0x4400 0040 ~ 0x4400 0080

所以清理该地址0x4400 0010开始的一个cache line大小的缓存,需要清理两个cache line。

以下是具体程序:

AND X2, X0, #0x3F    //0x3F = 0b0011 1111,将X0的低6位保存在X2中,相当于整除cache line 大小后的余数
ADD W1, W2, #64      //
BFI X0, XZR, #0, #6    //比特插入,将X0的低6位置零

DCLC_LOOP
    DC CIVAC, X0      // 对数据缓存执行清理清除命令
    ADD X0, X0, #64  // 指向下一个cache line的首地址
    SUBS W1, W1, #64  //检查余数是否为零
    B.GT DCLC_LOOP    // 如果不为0,则开始下一个cache line 的清除

ARMv7中关于Cache Maintenance操作的CP15指令:

​​​​​​​​​​​​​​ARM Architecture Reference Manual ARMv7-A and ARMv7-R edition

 ARMv8中对应的指令ARM Cortex-A Series Programmer's Guide for ARMv8-A

 

这篇关于Cache Maintenance-通过VA对cache进行clean和invalidate操作-汇编程序详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/564370

相关文章

MySQL 中的 JSON 查询案例详解

《MySQL中的JSON查询案例详解》:本文主要介绍MySQL的JSON查询的相关知识,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录mysql 的 jsON 路径格式基本结构路径组件详解特殊语法元素实际示例简单路径复杂路径简写操作符注意MySQL 的 J

Pandas使用AdaBoost进行分类的实现

《Pandas使用AdaBoost进行分类的实现》Pandas和AdaBoost分类算法,可以高效地进行数据预处理和分类任务,本文主要介绍了Pandas使用AdaBoost进行分类的实现,具有一定的参... 目录什么是 AdaBoost?使用 AdaBoost 的步骤安装必要的库步骤一:数据准备步骤二:模型

使用Pandas进行均值填充的实现

《使用Pandas进行均值填充的实现》缺失数据(NaN值)是一个常见的问题,我们可以通过多种方法来处理缺失数据,其中一种常用的方法是均值填充,本文主要介绍了使用Pandas进行均值填充的实现,感兴趣的... 目录什么是均值填充?为什么选择均值填充?均值填充的步骤实际代码示例总结在数据分析和处理过程中,缺失数

Python ZIP文件操作技巧详解

《PythonZIP文件操作技巧详解》在数据处理和系统开发中,ZIP文件操作是开发者必须掌握的核心技能,Python标准库提供的zipfile模块以简洁的API和跨平台特性,成为处理ZIP文件的首选... 目录一、ZIP文件操作基础三板斧1.1 创建压缩包1.2 解压操作1.3 文件遍历与信息获取二、进阶技

一文详解Java异常处理你都了解哪些知识

《一文详解Java异常处理你都了解哪些知识》:本文主要介绍Java异常处理的相关资料,包括异常的分类、捕获和处理异常的语法、常见的异常类型以及自定义异常的实现,文中通过代码介绍的非常详细,需要的朋... 目录前言一、什么是异常二、异常的分类2.1 受检异常2.2 非受检异常三、异常处理的语法3.1 try-

Java中的@SneakyThrows注解用法详解

《Java中的@SneakyThrows注解用法详解》:本文主要介绍Java中的@SneakyThrows注解用法的相关资料,Lombok的@SneakyThrows注解简化了Java方法中的异常... 目录前言一、@SneakyThrows 简介1.1 什么是 Lombok?二、@SneakyThrows

Java中字符串转时间与时间转字符串的操作详解

《Java中字符串转时间与时间转字符串的操作详解》Java的java.time包提供了强大的日期和时间处理功能,通过DateTimeFormatter可以轻松地在日期时间对象和字符串之间进行转换,下面... 目录一、字符串转时间(一)使用预定义格式(二)自定义格式二、时间转字符串(一)使用预定义格式(二)自

Redis Pipeline(管道) 详解

《RedisPipeline(管道)详解》Pipeline管道是Redis提供的一种批量执行命令的机制,通过将多个命令一次性发送到服务器并统一接收响应,减少网络往返次数(RTT),显著提升执行效率... 目录Redis Pipeline 详解1. Pipeline 的核心概念2. 工作原理与性能提升3. 核

Python正则表达式语法及re模块中的常用函数详解

《Python正则表达式语法及re模块中的常用函数详解》这篇文章主要给大家介绍了关于Python正则表达式语法及re模块中常用函数的相关资料,正则表达式是一种强大的字符串处理工具,可以用于匹配、切分、... 目录概念、作用和步骤语法re模块中的常用函数总结 概念、作用和步骤概念: 本身也是一个字符串,其中

Nginx location匹配模式与规则详解

《Nginxlocation匹配模式与规则详解》:本文主要介绍Nginxlocation匹配模式与规则,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、环境二、匹配模式1. 精准模式2. 前缀模式(不继续匹配正则)3. 前缀模式(继续匹配正则)4. 正则模式(大