specialization专题

2014 Micro. Architectural Specialization for Inter-Iteration Loop Dependence Patterns

动机 专门的硬件加速器需要有明确对源码进行软硬件抽象,分裂出硬件能够执行的代码,然后使用硬件去加速。软硬件分离的过程是比较耗费人力或者硬件的,比如专用加速器需要人工的方式抽象硬件执行的代码,乱序处理器能够处理循环内的迭代,但硬件开销相比顺序处理器大的多。 本文作者提出了xloop(explicit loop specialization)来编码循环迭代间的依赖关系,指示硬件去执行循环。这些重新编

The Accelerator Wall: Limits of Chip Specialization

The Accelerator Wall: Limits of Chip Specialization 摘要: 加速器墙:芯片上可用晶体管数量的停滞将限制加速器的设计优化空间,导致专有化硬件回报的减少,最终将会遇到加速器墙论文工作:探讨了在未来加速器和定制化芯片的限制将会有哪些 论文使用数千个芯片的数据表(datasheet)构建的模型工具,论文描述了当前加速器如何依赖于CMOS缩放(scal

STL源码剖析:class template explicit specialization代码测试和理解

目的:对STL源码进行理解,需要通过实现来理解。这个模块,我感觉是对其中的specialization的理解,像是对模板中的类型进行实例化。比如一般的模板肯定是类型可以任意的,但是有些时候,我们需要特定的类型,模板就提供这个功能。测试代码如下: #include<iostream>using namespace std;#define __STL_TEMPLATE_NULL template<