CSAPP Cache 知识总结; Cache Lab Part A

2024-04-19 14:48
文章标签 总结 知识 part cache lab csapp

本文主要是介绍CSAPP Cache 知识总结; Cache Lab Part A,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

CSAPP 高速缓存部分总结

1、程序的局部性
时间局部性:多次引用相同的内存位置
空间局部性:引用之前临近的内存位置
为什么cache能加速访问?——程序的局部性特征

3、缓存不命中种类:
(1)冷不命中:缓存为空时
(2)冲突不命中:访问的数据映射到同一个缓存块所导致
(3)容量不命中:缓存过小

Cache映射方式:

1、直接映射:
每个主存块映射到cache的固定行,优点是电路简单、缺点是可能冲突不命中,且cache空间没有充分利用。
(1)Cache结构:
n行,每行一个标记位,一个有效位(0 or 1)
标记位的作用是标记取自哪个块群(假设拿直接映射方式距离,0,4,8,12…会放到同一个cache行中,那么怎么区分?答案就是使用标记位)
(2)主存地址划分:
标记(和Cache对应行的标记做对比) + Cache行索引(Cache的哪一行) + 块内地址
(3)主存地址到cache的映射:
1、先根据行号找到对应的行
2、比较标记位,不符合的话从内存调
3、如果有效位为1,则命中

2、全相联映射:
有空就放
缺点:比较时间长,但空间利用率高
(1)Cache结构:
标记位 + 主存块
标记位的作用是标记主存块,因此位数多

3、组相联映射:
把Cache所有行分成几组(直接映射是整个Cache为一组),是直接映射和组相联的结合
(1)主存地址划分:
还是 标记 + Cache组索引 + 块内地址
但Cache行索引位数少了,标记位数多了,判断是否命中方式和直接映射一样。

几个概念:
(1)命中率/缺失率:
(2)关联度:主存块映射到cache时,可能存放的位置个数
几种映射方式的关联度:
直接映射:1
全相联:Cache行数
N路组相联:N

关联度越高,标记位数越多

Cache替换算法:
情景:组相联映射,第0组目前装入第0块和第8块,现在主存第16块需要装入Cache,是驱逐第0块还是第8块?

1、LRU最近最少用 : 特点是命中率随组的增大而提高
2、FIFO先进先出
3、LFU最不经常用
4、随机替换

LRU实现策略:
在cache的每行记录一个LRU位,如果命中,LRU位+1;
如果需要驱逐,则驱逐每组中LRU位最小的行

Cache一致性问题:
如果要写的单元在cache中存在,则有两种处理方法
(1)同时往cache和主存中写,需要加write buffer避免cpu等待内存
(2)write block,锁定内存,一次回写

Lab

lab分为两部分
(1)编写cache模拟程序
(2)优化矩阵转置

实验注意事项(来自实验指导书):
(1)对cache的操作有三种 L:加载数据 S:
1、编写cache模拟程序

(1)getopt函数解析命令行
因为要在命令行输入cache的组索引位数(s)、关联度(E)、块索引(b)、轨迹文件,格式为:
./csim -s 1 -E 1 -b 1 -t traces/yi2.trace
因此需要对命令行进行解析,使用getopt函数。

在这里插入图片描述
按照说明,因为 s,E等后面都有参数,因此需要加冒号,解析代码为:

  while((c = getopt(argc,argv,"s:E:b:t:"))!= -1 ){switch(c){case 's':s = atoi(optarg);printf("%d\n",s);break;case 'E':E = atoi(optarg);printf("%d\n",E);break;case'b':b = atoi(optarg);printf("%d\n",b);break;case't':tracefile = optarg;printf("%s\n",tracefile);break;}}

(2)Cache组织结构
使用组相联方式组织cache,一个cache有多个组,每组有多个行。
每行有一个有效位,一个标记位,一块数据。
1、定义cache行结构:

typedef struct cache_line {char valid;mem_addr_t tag;unsigned long long int lru;
} cache_line_t;

2、使用指针定义组和cache,将每行的有效位,标记位,lru位都初始化为0

typedef Cache_line_t* cache_set_t; //用行定义组
cache_set_t* cache; //用组定义cache

(3)数据访问
1、获取标记和组索引:

 //获取标记Address tag = addr >> (s+b);/*获取组索引, 地址共64位, 组索引位于中间,需要做按位与运算将标记位置置0set_index_mask = (mem_addr_t) (pow(2, s) - 1);*/Address set_index = (addr >> b) & (set_index_mask);

2、判断是否命中(有效位为1 && 标记位一致),如果命中返回

for(int i = 0; i < E; i++){if(cache_set[i].tag==tag&&cache_set[i].valid){//命中hit_count ++ ;cache_set[i].lru = lru_counter ++;return ;}}  

3、如果没命中
(1)获得lru最小的一行

  miss_count++;for(i=0; i<E; i++){//eviction_lru = ULONG_MAX,初始将eviction_lru置为最大值,以便比较if (cache_set[i].lru < eviction_lru){eviction_line = i;eviction_lru = cache_set[i].lru;}}

(2)根据有效位,决定是否驱逐

    if( cache_set[eviction_line].valid ) eviction_count++;

(3)加载数据

  cache_set[eviction_line].valid = 1;cache_set[eviction_line].tag = tag;cache_set[eviction_line].lru = lru_counter++;

这篇关于CSAPP Cache 知识总结; Cache Lab Part A的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/917845

相关文章

关于C++中的虚拟继承的一些总结(虚拟继承,覆盖,派生,隐藏)

1.为什么要引入虚拟继承 虚拟继承是多重继承中特有的概念。虚拟基类是为解决多重继承而出现的。如:类D继承自类B1、B2,而类B1、B2都继承自类A,因此在类D中两次出现类A中的变量和函数。为了节省内存空间,可以将B1、B2对A的继承定义为虚拟继承,而A就成了虚拟基类。实现的代码如下: class A class B1:public virtual A; class B2:pu

十五.各设计模式总结与对比

1.各设计模式总结与对比 1.1.课程目标 1、 简要分析GoF 23种设计模式和设计原则,做整体认知。 2、 剖析Spirng的编程思想,启发思维,为之后深入学习Spring做铺垫。 3、 了解各设计模式之间的关联,解决设计模式混淆的问题。 1.2.内容定位 1、 掌握设计模式的"道" ,而不只是"术" 2、 道可道非常道,滴水石穿非一日之功,做好长期修炼的准备。 3、 不要为了

[职场] 公务员的利弊分析 #知识分享#经验分享#其他

公务员的利弊分析     公务员作为一种稳定的职业选择,一直备受人们的关注。然而,就像任何其他职业一样,公务员职位也有其利与弊。本文将对公务员的利弊进行分析,帮助读者更好地了解这一职业的特点。 利: 1. 稳定的职业:公务员职位通常具有较高的稳定性,一旦进入公务员队伍,往往可以享受到稳定的工作环境和薪资待遇。这对于那些追求稳定的人来说,是一个很大的优势。 2. 薪资福利优厚:公务员的薪资和

人工智能机器学习算法总结神经网络算法(前向及反向传播)

1.定义,意义和优缺点 定义: 神经网络算法是一种模仿人类大脑神经元之间连接方式的机器学习算法。通过多层神经元的组合和激活函数的非线性转换,神经网络能够学习数据的特征和模式,实现对复杂数据的建模和预测。(我们可以借助人类的神经元模型来更好的帮助我们理解该算法的本质,不过这里需要说明的是,虽然名字是神经网络,并且结构等等也是借鉴了神经网络,但其原型以及算法本质上还和生物层面的神经网络运行原理存在

Java注解详细总结

什么是注解?         Java注解是代码中的特殊标记,比如@Override、@Test等,作用是:让其他程序根据注解信息决定怎么执行该程序。         注解不光可以用在方法上,还可以用在类上、变量上、构造器上等位置。 自定义注解  现在我们自定义一个MyTest注解 public @interface MyTest{String aaa();boolean bbb()

tensorboard-----summary用法总结

Tensorflow学习笔记——Summary用法         最近在研究tensorflow自带的例程speech_command,顺便学习tensorflow的一些基本用法。 其中tensorboard 作为一款可视化神器,可以说是学习tensorflow时模型训练以及参数可视化的法宝。 而在训练过程中,主要用到了tf.summary()的各类方法,能够保存训练过程以及参数分布图并在

七种排序方式总结

/*2018.01.23*A:YUAN*T:其中排序算法:冒泡排序,简单排序,直接插入排序,希尔排序,堆排序,归并排序,快速排序*/#include <stdio.h>#include <math.h>#include <malloc.h>#define MAXSIZE 10000#define FALSE 0#define TRUE 1typedef struct {i

Java实现MD5加密总结

Java实现MD5加密总结 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 1. 什么是MD5加密 MD5是一种常用的哈希算法,用于将任意长度的数据通过哈希运算转换为固定长度的数据串,通常为128位的二进制串,常用于对密码等敏感信息进行加密存储或传输。 2. Java实现MD5加密的方法 2.1 使用java.sec

Linux通配符总结

Linux通配符总结 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在Linux系统中,通配符是一种用于匹配文件名或路径名的特殊字符。通过使用通配符,可以方便地匹配多个文件或目录,从而进行文件操作或查找。 2. 常用的通配符 在Linux系统中,常用的通配符包括以下几种: *:匹配任意长度的任意字符。?:匹配任意单个字符

【Linux文件系统】被打开的文件与文件系统的文件之间的关联刨析总结

操作系统管理物理内存以及与外设磁盘硬件进行数据的交换 操作系统如何管理物理内存呢? 其实操作系统内核先对内存先描述再组织的!操作系统管理内存的基本单位是4KB,操作系统会为每一个4KB大小的物理内存块创建一个描述该4KB内存块的struct page结构体,该结构体存储着这4KB内存块的属性信息,通过管理struct page来对内存进行管理,page结构体的大小比较小,OS通常将它们组成一个