本文主要是介绍天人合一之毕设——实践阶段—— 6 尚未解决的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
目前为止,功能应该算是大体完备
我的思路是:
首先将代码过一遍,进行局部插桩,比如if else等分支插{print 当前行},将所有的当前行按序构造成一个数组
循环体思想也是类似,插计数器,用数组按序记载所有循环次数
接下来扫描代码,提取出所有函数的起始位置和结束位置
现在开始正式的遍历,以main函数为入口,逐层调用,每个函数里逐行访问,首先进行if-else语句和循环语句的判断,
如果if不执行就跳过直到分支结束,循环体就是设置对象访问应该乘以的倍数
然后正式开始对象malloc、free以及访问的判断,malloc时要设置对象序号(主键)、名字、malloc语句的序号
malloc语句在的函数(不变)、namespace(会随着return和传参变化)
一旦malloc就加入当前对象列表curobjectlist,一旦free掉就加入free列表freelist
所有判断对象访问的条件都是对象在当前对象列表curobjectlist里且命名空间namespace和目前所在函数体一样
前面说了这个namespace是会变的嘛,因为你return到上层函数或者传参到下层函数,还是指向同一块内存
但是指针名字可能会变,如果没变就只需要改变此对象的namespace即可
变了就新建一个对象,序号和之前的相同,名字和namespace变化
当前我还考虑了让另一个指针指向对象的情况,思路相似,新建一个相同编号的对象即可。
最后用一个sum函数来进行统计总体访问次数,输出表格
访问顺序也得到了,五个一行(序号+名字)
后期画时序图可以画成折线图,横坐标为accesslist的顺序编号,纵坐标为对象编号
当有一条直线时,说明就是局部比较热的,比如上图的3号e
漏说了一个问题:设置这个对象表里funCall的原因是,一个函数可能会被调用很多次,比如我函数里的hash_insert
同一段malloc代码可能会被执行好几次,分配几个并不相同的内存(对象),而且被访问次数可能有的多有的少
为了插桩分配时方便,我就设置了这个属性,大意就是第几次进入这个函数执行malloc代码。
还需要考虑的问题:
1.循环次数为0的情况(暂未做)
我想可以试着像if那种桩一样,插一句curline,如果不匹配就直接循环次数设为0
2.循环中的break和continue情况(暂未做)
break的情况稍微简单一点,遇到break执行就将循环次数设为0,知道结束了再重新设为1
continue时,首先得知道continue执行了n次(一般是在if语句块里),然后continue后面语句就是repeat_cnt-n次了
这个比较麻烦的是,如果循环体里有多个continue和break,会复杂些
还有考虑掉了一个switch结构,而且这个里面的break还需和循环里的break区分开
3.后一步插桩时(已做)
因为一个子函数里的代码可能会执行很多次,每一次同名对象的访问次数可能不一样
后续的分配nvm和DRAM可能会有所不同,所以要在对象类里记录下来执行此函数的次数,这样好区分
同样,为了后续分配工作不重新识别一次,在对象类里继续下malloc的地点(即行数)比较方便
4.对象大小还没有提取,因为C中是用的sizeof,在Java中不太容易交互。分配需要根据对象大小吗?
目前想到的解决方法就是类似于if-else和循环体,用一个数组记录下所有对象大小
目前已经解决,听师兄的意思分配策略方面不考虑对象大小,只考虑访问次数
5.局部热的情况:是应该分阶段计算访问频度,还是认为当循环出现时是最可能出现局部热的呢?
是不是只考虑一开始存放在NVM当中比较冷的数据局部变热呢?
从NVM迁移到DRAM是个置换过程,相当于先选中两个置换对象,然后分别插桩
malloc (nvm_malloc) memcpy free 这几个过程
6.调用库函数,不知道底层对他的访问,统计起来比较麻烦,不需要考虑
7.后期自己改代码时
总共malloc内存占多少合适,每个malloc是不是太小没意义(?之前张博提到)
对象多少个合适(必须要把DRAM装满吧,不然没有意义)
DRAM和NVM的配比
【师兄曾说:和纯DRAM对比没有意义,我们要认为DRAM是有限的,这样分配和迁移才有意义】
【可以认为是DRAM放不下,也可以认为是为DRAM节省了空间,让出这部分空间去跑别的数据】
8.代码的普遍性问题
我目前是针对字典(手动benchmark做的),只跑一个会不会太少了,别人觉得没代表性
跑多了我又怕别的访存特征不明显
9.HME
这篇关于天人合一之毕设——实践阶段—— 6 尚未解决的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!