2014 Micro. Architectural Specialization for Inter-Iteration Loop Dependence Patterns

本文主要是介绍2014 Micro. Architectural Specialization for Inter-Iteration Loop Dependence Patterns,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

动机

专门的硬件加速器需要有明确对源码进行软硬件抽象,分裂出硬件能够执行的代码,然后使用硬件去加速。软硬件分离的过程是比较耗费人力或者硬件的,比如专用加速器需要人工的方式抽象硬件执行的代码,乱序处理器能够处理循环内的迭代,但硬件开销相比顺序处理器大的多。
本文作者提出了xloop(explicit loop specialization)来编码循环迭代间的依赖关系,指示硬件去执行循环。这些重新编码的循环可以根据加速的硬件执行的快慢来调整执行的载体,即当CPU、加速硬件那个执行的快由谁去执行。

实现

1、编码循环间的迭代

xloop ISA扩展指令的目的是,使用xloop指令对循环数据依赖和控制依赖模式进行编码,刻画出循环固有的并行性
在这里插入图片描述

这篇关于2014 Micro. Architectural Specialization for Inter-Iteration Loop Dependence Patterns的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/572323

相关文章

Google Code Jam 2014(附官方题解)

2014年Google编程挑战赛 Problem A. Magic Trick Confused? Read the quick-start guide. Small input 6 points You have solved this input set. Note: To advance to the next rounds, you will need to s

Codeforces April Fools Day Contest 2014(附官方题解)

Codeforces2014年愚人节的坑题。。。但还是感觉挺好玩的。。。 A. The Great Game time limit per test 1 second memory limit per test 256 megabytes input standard input output standard output Two teams mee

论坛开发者总结:再见2013,你好2014!

转自:http://www.cocoachina.com/gamedev/misc/2014/0102/7644.html 在跨年的时候,我和你一样听着电视里的各种欢呼声,看着时针分针不慌不忙地走向0点,有点兴奋有点怅然有点对过往的追忆也有对未来的期许,但在0点钟声敲响的时候,不管过往如何,都信心满满地对自己说了声--你好2014! 对于开发者来说,2013年移动游

2014年10月8日

这是我上班第一天,我早早的来到了公司门口,足足等了一个小时才开门,已经到上午九点了,结识了很多同事,项目经理让我们熟悉业务(集团服开系统)。高姐给我讲了一遍服务开通,从CRM到集团服开,从订单到派单,回单的整个演示过程,中午很快就到了,有点困了,中午又给我们发了一份vpn的文档,当前电信集团主要用到CN2这个网络技术,知道了我们这个团队主要从事电信集团的服务开通相关工作。

Oracle6--之循环loop

主要有以下五种循环:Exit When、Loop、While、For(普通循环)、For(游标循环),下面举例一一说明(均为存储过程)。 1、Exit When循环: create or replace procedure proc_test_exit_when is i number; begin i:=0; LOOP Exit When(i>5); Dbms_Output.put_li

Linux下Tomcat开机自动启动 原创 2014年07月18日 12:32:49 标签:Linux /tomcat /shell /启动 22095 Linux下tomcat开机自动启动有两种方法

Linux下Tomcat开机自动启动 原创  2014年07月18日 12:32:49 标签:Linux /tomcat /shell /启动 22095 Linux下tomcat开机自动启动有两种方法,一种是简单,一种是复杂而又专业的,使用shell脚本要实现,我们一般推荐shell脚本启动方式。下面我们分别介绍这两种方法。 1.shell脚本启动 众所周知,在L

TT-2014 研发笔试题

1 在一个单链表中,若p所指的结点不是最后结点,在p所指结点之后插进s所指结点,则应执行操作 () 【解析】 s->next=p->next;p->next=s 2 在下列排序方法中,不稳定的方法有() 【解析】 不稳定排序的意思是在排序过程中,相等的两个数比较之后不会改变其原来的位置,即不需要交换。 常见的稳定排序有: 冒泡排序,插入排序,归并排序,基数排序。 常见的不稳定排序有: 选择排序

torch.optim 之 Algorithms (Implementation: for-loop, foreach, fused)

torch.optim的官方文档 官方文档中文版 一、Implementation torch.optim的官方文档在介绍一些optimizer Algorithms时提及它们的implementation共有如下三个类别:for-loop, foreach (multi-tensor), and fused。 Chat-GPT对这三个implementation的解释是: For-loo

2014计算机求职总结---面试篇

2014年计算机求职总结--准备篇 分类: 笔试与面试 2013-10-24 16:44 16272人阅读 评论(65) 收藏 举报 计算机 求职 找工作 IT 2014 版权所有,转载请注明出处,谢谢! http://blog.csdn.net/walkinginthewind/article/details/13000431 找工作是一个长期准备的过程,突击是没什

2014年5月

2014年5月份记录表 日期 ACM C/C++ 数据库 操作系统 英语 安卓 其它5月1日 uva10344(全排列+dfs) BNU4071(dfs)  hdu1175(dfs) --------------------5月2日hdu1427(dfs) hdu2594(KMP)---------------nonetheless subsidize unduly3日uva10160(