CSAPP Cache 知识总结; Cache Lab Part A

2024-04-19 14:48
文章标签 总结 知识 part cache lab csapp

本文主要是介绍CSAPP Cache 知识总结; Cache Lab Part A,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

CSAPP 高速缓存部分总结

1、程序的局部性
时间局部性:多次引用相同的内存位置
空间局部性:引用之前临近的内存位置
为什么cache能加速访问?——程序的局部性特征

3、缓存不命中种类:
(1)冷不命中:缓存为空时
(2)冲突不命中:访问的数据映射到同一个缓存块所导致
(3)容量不命中:缓存过小

Cache映射方式:

1、直接映射:
每个主存块映射到cache的固定行,优点是电路简单、缺点是可能冲突不命中,且cache空间没有充分利用。
(1)Cache结构:
n行,每行一个标记位,一个有效位(0 or 1)
标记位的作用是标记取自哪个块群(假设拿直接映射方式距离,0,4,8,12…会放到同一个cache行中,那么怎么区分?答案就是使用标记位)
(2)主存地址划分:
标记(和Cache对应行的标记做对比) + Cache行索引(Cache的哪一行) + 块内地址
(3)主存地址到cache的映射:
1、先根据行号找到对应的行
2、比较标记位,不符合的话从内存调
3、如果有效位为1,则命中

2、全相联映射:
有空就放
缺点:比较时间长,但空间利用率高
(1)Cache结构:
标记位 + 主存块
标记位的作用是标记主存块,因此位数多

3、组相联映射:
把Cache所有行分成几组(直接映射是整个Cache为一组),是直接映射和组相联的结合
(1)主存地址划分:
还是 标记 + Cache组索引 + 块内地址
但Cache行索引位数少了,标记位数多了,判断是否命中方式和直接映射一样。

几个概念:
(1)命中率/缺失率:
(2)关联度:主存块映射到cache时,可能存放的位置个数
几种映射方式的关联度:
直接映射:1
全相联:Cache行数
N路组相联:N

关联度越高,标记位数越多

Cache替换算法:
情景:组相联映射,第0组目前装入第0块和第8块,现在主存第16块需要装入Cache,是驱逐第0块还是第8块?

1、LRU最近最少用 : 特点是命中率随组的增大而提高
2、FIFO先进先出
3、LFU最不经常用
4、随机替换

LRU实现策略:
在cache的每行记录一个LRU位,如果命中,LRU位+1;
如果需要驱逐,则驱逐每组中LRU位最小的行

Cache一致性问题:
如果要写的单元在cache中存在,则有两种处理方法
(1)同时往cache和主存中写,需要加write buffer避免cpu等待内存
(2)write block,锁定内存,一次回写

Lab

lab分为两部分
(1)编写cache模拟程序
(2)优化矩阵转置

实验注意事项(来自实验指导书):
(1)对cache的操作有三种 L:加载数据 S:
1、编写cache模拟程序

(1)getopt函数解析命令行
因为要在命令行输入cache的组索引位数(s)、关联度(E)、块索引(b)、轨迹文件,格式为:
./csim -s 1 -E 1 -b 1 -t traces/yi2.trace
因此需要对命令行进行解析,使用getopt函数。

在这里插入图片描述
按照说明,因为 s,E等后面都有参数,因此需要加冒号,解析代码为:

  while((c = getopt(argc,argv,"s:E:b:t:"))!= -1 ){switch(c){case 's':s = atoi(optarg);printf("%d\n",s);break;case 'E':E = atoi(optarg);printf("%d\n",E);break;case'b':b = atoi(optarg);printf("%d\n",b);break;case't':tracefile = optarg;printf("%s\n",tracefile);break;}}

(2)Cache组织结构
使用组相联方式组织cache,一个cache有多个组,每组有多个行。
每行有一个有效位,一个标记位,一块数据。
1、定义cache行结构:

typedef struct cache_line {char valid;mem_addr_t tag;unsigned long long int lru;
} cache_line_t;

2、使用指针定义组和cache,将每行的有效位,标记位,lru位都初始化为0

typedef Cache_line_t* cache_set_t; //用行定义组
cache_set_t* cache; //用组定义cache

(3)数据访问
1、获取标记和组索引:

 //获取标记Address tag = addr >> (s+b);/*获取组索引, 地址共64位, 组索引位于中间,需要做按位与运算将标记位置置0set_index_mask = (mem_addr_t) (pow(2, s) - 1);*/Address set_index = (addr >> b) & (set_index_mask);

2、判断是否命中(有效位为1 && 标记位一致),如果命中返回

for(int i = 0; i < E; i++){if(cache_set[i].tag==tag&&cache_set[i].valid){//命中hit_count ++ ;cache_set[i].lru = lru_counter ++;return ;}}  

3、如果没命中
(1)获得lru最小的一行

  miss_count++;for(i=0; i<E; i++){//eviction_lru = ULONG_MAX,初始将eviction_lru置为最大值,以便比较if (cache_set[i].lru < eviction_lru){eviction_line = i;eviction_lru = cache_set[i].lru;}}

(2)根据有效位,决定是否驱逐

    if( cache_set[eviction_line].valid ) eviction_count++;

(3)加载数据

  cache_set[eviction_line].valid = 1;cache_set[eviction_line].tag = tag;cache_set[eviction_line].lru = lru_counter++;

这篇关于CSAPP Cache 知识总结; Cache Lab Part A的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/917845

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

整数Hash散列总结

方法:    step1  :线性探测  step2 散列   当 h(k)位置已经存储有元素的时候,依次探查(h(k)+i) mod S, i=1,2,3…,直到找到空的存储单元为止。其中,S为 数组长度。 HDU 1496   a*x1^2+b*x2^2+c*x3^2+d*x4^2=0 。 x在 [-100,100] 解的个数  const int MaxN = 3000

状态dp总结

zoj 3631  N 个数中选若干数和(只能选一次)<=M 的最大值 const int Max_N = 38 ;int a[1<<16] , b[1<<16] , x[Max_N] , e[Max_N] ;void GetNum(int g[] , int n , int s[] , int &m){ int i , j , t ;m = 0 ;for(i = 0 ;

go基础知识归纳总结

无缓冲的 channel 和有缓冲的 channel 的区别? 在 Go 语言中,channel 是用来在 goroutines 之间传递数据的主要机制。它们有两种类型:无缓冲的 channel 和有缓冲的 channel。 无缓冲的 channel 行为:无缓冲的 channel 是一种同步的通信方式,发送和接收必须同时发生。如果一个 goroutine 试图通过无缓冲 channel