文献阅读(303)CGRA子图解耦合 访存优化

2024-04-07 19:38

本文主要是介绍文献阅读(303)CGRA子图解耦合 访存优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 1 introduction
  • 1 introduction

  • 题目:Subgraph Decoupling and Rescheduling for Increased Utilization in CGRA Architecture
  • 时间:2021
  • 会议:DATE
  • 研究机构:上海交大

1 introduction

本篇论文的重点在于提高PE利用率,比如下图中的嵌套循环,黄色和粉色逻辑分别映射到不同的PE中,但内侧循环一直在执行,黄色的PE隔很久才执行一次,利用率较低
在这里插入图片描述
再比如说分支逻辑,true和false两条不同的分支如果映射到不同的PE上,那么同一时刻只会有一半的PE是在真正的工作,因为二者是互斥的;如果想办法将其两条分支映射到同一个PE的话,则要看两条分支是不是对称,不对称的逻辑也很难融合
在这里插入图片描述
还有下图的循环依赖,红黄部分交替依赖,更麻烦
在这里插入图片描述
本篇论文的解决方案是:将DFG分割成多个子图,一次只映射一个子图,算完再串行执行下一个子图,这样就不存在部分逻辑不执行的情况,本篇论文的主要贡献:

  1. 提出了一种子图解耦方法,保证同一个子图以相同的速率执行,提高PE利用率
  2. zero-cost domino context switching method
  3. PE内部轻量级的子图切换逻辑

在这里插入图片描述
此时对于嵌套循环,执行的顺序就变成了先计算黄色逻辑,再计算粉色逻辑


  • 题目:Reducing Memory Access Conflicts with Loop Transformation and Data Reuse on Coarse-grained Reconfigurable Architecture
  • 时间:2021
  • 会议:DATE
  • 研究机构:交大

1 introduction

本篇论文聚集与减少内存访问冲突,现有的方法是设计片上的全局存储器,但是这还不够,循环中冗余的数据访问、
不平衡的数据带宽负责都会影响数据访问的效率,本篇论文的主要贡献是:

  1. 循环转换模型来最大化迭代间数据重用
  2. 在编译过程中,基于启发式的空间映射方法,考虑访存带宽和可能是bank冲突
  3. 考虑冗余访存操作的context modification approach,增加数据利用的可能

在这里插入图片描述
本篇论文是基于ADRES的CGRA架构,其中每个PE都已访问到片上的全局buffer和全局的寄存器堆

这篇关于文献阅读(303)CGRA子图解耦合 访存优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/883486

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

MySQL高性能优化规范

前言:      笔者最近上班途中突然想丰富下自己的数据库优化技能。于是在查阅了多篇文章后,总结出了这篇! 数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 临时库表必须以tmp_为前缀并以日期为后缀,备份

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

软件架构模式:5 分钟阅读

原文: https://orkhanscience.medium.com/software-architecture-patterns-5-mins-read-e9e3c8eb47d2 软件架构模式:5 分钟阅读 当有人潜入软件工程世界时,有一天他需要学习软件架构模式的基础知识。当我刚接触编码时,我不知道从哪里获得简要介绍现有架构模式的资源,这样它就不会太详细和混乱,而是非常抽象和易

图解TCP三次握手|深度解析|为什么是三次

写在前面 这篇文章我们来讲解析 TCP三次握手。 TCP 报文段 传输控制块TCB:存储了每一个连接中的一些重要信息。比如TCP连接表,指向发送和接收缓冲的指针,指向重传队列的指针,当前的发送和接收序列等等。 我们再来看一下TCP报文段的组成结构 TCP 三次握手 过程 假设有一台客户端,B有一台服务器。最初两端的TCP进程都是处于CLOSED关闭状态,客户端A打开链接,服务器端