RTL设计指导原则

2024-04-14 18:28
文章标签 设计 原则 指导 rtl

本文主要是介绍RTL设计指导原则,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

RTL设计指导原则

一、面积与速度互换原则

1. 电路设计中的面积与速度

面积:设计所消耗的目标器件的硬件资源数量或者ASIC芯片的面积。

  • FPGA:所消耗的触发器(FF)和查找表(LUT)数量来衡量;

  • ASIC:设计的面积、门数等衡量。

速度:设计在芯片上稳定运行时所能够达到的最高频率。

与众多时序特征向量密切相关:

  • 设计满足的时钟周期
  • PAD to PAD Time
  • Clock Set up Time
  • Clock Hold Time
  • Clock-to-Output Dela

面积和速度这两个指标贯穿于RTL设计的始终,是衡量设计质量的终极标准。

2. 面积和速度的平衡与互换原则

面积和速度是对立统一的矛盾体,要求设计面积最小,运行速率最高是不现实的。

2.1 科学的设计目标

面积:在满足设计时序要求(包含对设计最高频率的要求)的前提下,占用最小的芯片面积;

速度:在所规定的面积下,使设计的时序余量更大,频率更高。

如果设计的时序余量比较大,运行的频率比较高,

  • 设计的健壮性更强

  • 整个系统的质量更有保证

设计所消耗的面积更小

  • 在单位芯片上实现的功能模块更多

  • 需要的芯片数量更少

  • 成本大幅度削减

满足时序、工作频率的要求更重要一些,当两者发生冲突时,应采用速度优先的原则。

2.2 面积和速度的互换理论

用速度的优势对换面积的节约。

若设计时序余量大,能跑的频率远远高于设计要求

设计方法:通过功能模块复用减少整个设计所消耗的芯片面积,

用面积复制换取速度的提高。

若设计时序要求高,普通方法达不到设计频率

设计方法:

  • 将数据流串并转换

  • 并行复制多个操作模块,

  • 对整个设计采取"乒乓操作"和"串并转换"的思想进行处理

  • 在芯片输出模块处再对数据进行"井串转换"

面积和速度互换的操作技巧

  • 模块复用
  • 乒乓操作
  • 串井转换

实例:

输入数据流的速率450Mbit/s,数据处理模块的处理速度最大为150Mbit/s,处理模块的数据吞吐量满足不了要求。

解决方案:

  • 利用“面积换速度”的思想,至少复制3个处理模块;

  • 首先将输入数据进行“串并转换”;

  • 然后利用这3个模块并行处理分配的数据;

  • 最后将处理结果“并串转换"以满足数据速率的要求。

设计示意图如所示:

在这里插入图片描述

二、乒乓操作

“乒乓操作”是一个常常应用于数据流控制的处理技巧。

典型乒乓操作如同所示:

在这里插入图片描述

1. 乒乓操作的流程

输入数据流通过输入数据流选择单元,将输入数据流等分配到两个数据缓存区

数据缓冲模块,为任何存储模块。

常用的存储单元为:

  • 双口RAM(DPRAM)

  • 单口RAM(SPRAM)

  • FIFO

在第1个缓冲周期

将输入的数据流缓存到数据缓冲模块1

在第2个缓冲周期

  • 通过数据选择单元的切换,将输入的数据流缓存到数据缓冲模块2中

  • 同时将数据缓冲模块1缓存的第1个周期的数据,通过输出数据选择单元的选择送到数据流运算处理模块进行运算处理

在第3个缓冲周期

  • 通过数据选择单元的再次切换,将输入的数据流缓存到数据缓冲模块1中

  • 同时将数据缓冲模块2缓存的第2个周期的数据,通过输出数据选择单元的选择切换送到数据流运算处理模块进行运算处理

如此循环,完成数据输入

2.乒乓操作的优点

1、应用于流水线式算法,完成数据的无缝缓冲与处理。

乒乓操作的最大特点是通过“输入数据选择单元”和“输出数据选择单元”按节拍、相互配合的切换。将经过缓冲的数据流没有停顿地送到“数据流运算处理模块”进行运算与处理。

把乒乓操作模块当做一个整体,站在这个模块的两端看数据,输入数据流和输出数据流都是连续不断的,没有任何停顿,因此非常适合对数据流进行流水线式处理。所以乒乓操作常常应用于流水线式算法,完成数据的无缝缓冲与处理。

2、节约缓冲区空间。

例子:WCDMA基带应用

1个帧是有15个时隙组成,需要将1整帧的数据延时一个时隙后处理。

解决方案:

比较直接的方法:帧数据缓存起来,然后延时1个时隙进行处理

这时缓冲区的长度是一整帧的长,假设数据速率为3.84Mbps,1帧长10ms,此时需要缓冲区的长度为38400位。

采用乒乓操作

只需定义两个能缓冲1个时隙数据的RAM(单口RAM即可)。

在这里插入图片描述

当向一块RAM写数据的时候,从另一块RAM来读取数据,然后送到处理单元进行处理

此时,每块RAM的容量为:38400/15=2560

两个RAM加起来的容量只要5120位。

3、巧妙运用乒乓操作还可以达到用低速模块处理高速数据流的效果。

例子:

假设端口输入A的数据流的速率为100Mbps,乒乓操作的缓冲周期10ms,以下分析各个节点端口的数据速率

在这里插入图片描述

数据缓冲模块采用双口RAM(DPRAM),在DPRAM之后,引入了一级数据预处理模块

数据预处理,可以根据需要的各种数据运算(如,在WCDMA设计中,对输入数据流进行解扩、解扰、去旋转等)

解决方案:

在第1个缓冲周期10ms内

通过输入数据选择单元,从B1到达DPRAM1,B1处的数据速率也是100Mbps,所以DPRAM1要在10ms内写入1Mb数据。

在第2个缓冲周期10ms内

数据流切换到DPRAM2,端口B2处的数据速率也是100Mbps,DPRAM2在第2个10ms被写入1Mb数据。

在第3个缓冲周期10ms内

数据流切换到DPRAM1,DPRAM1被写入1Mb数据。

到第3个周期时,留给DPRAM1读取数据,并送到数据预处理模块1的时间,一共是20ms。

所以端口C1的数据速率为1Mb/20ms=500Mbps

因此,数据预处理模块1的最低数据吞吐能力也仅仅要求为500Mbps,

同理,数据预处理模块2的最低数据吞吐能力也仅仅要求为500Mbps.

数据读取过程:

在第2个缓冲周期,向DPRAM2写数据的10ms内,DPRAM1是可以进行读操作的。

在第1个缓冲周期的第5ms起(绝对时间为5ms时刻),DPRAM1就可以一边向500K以后的地址写数据,一边从地址0读数,到达10ms时,DPRAM1刚好写完了1Mb数据,并且读了500K数据,这个缓冲时间内DPRAM1读了5ms。

在第3个缓冲周期的第5ms起(绝对时间为35ms时刻),同理可以一边向500K以后的地址写数据一边从地址0读数,又读取了5个ms,所以截止DPRAM1第一个周期存入的数据被完全覆盖以前,DPRAM1最多可以读取20ms时间,而所需读取的数据为1Mb。

换言之,通过乒乓操作,数据预处理模块的时序压力就减轻了。仅仅为输入速率的二分之一。

三、流水线

电路的最高频率,取决于最长组合逻辑链的延迟值。

1. 组合逻辑链的串行闲置

如果将这条最长组合逻辑路径,划分为很多小的逻辑,就可以看到,在数据向前传播的过程中,每个时刻,大部分的组合逻辑单元,总是处于闲置状态,电路效率很低。

在这里插入图片描述

在这里插入图片描述

例子:计算log(|a+b|)

在这里插入图片描述

使用组合逻辑进行计算,整条路径上的延迟=加法器+求绝对值+求对数,三个部分组合逻辑之和。

如果在电路中插入两级寄存器,那么电路的工作频率取决于加法器、求绝对值、求对数,三者的最大值。而且,每个时刻,三个部分都在运行。

在这里插入图片描述

这种插入寄存器的形式,来提高电路运行频率的方法,叫做流水线。

对比发现,流水线的方式,可以充分提高电路工作频率,理想情况下,本例中运行的频率,可以提升为原来的三倍。

2. 典型四级流水线的结构

通过四级触发器,把一条组合逻辑划成4部分

注意:这个划分是根据延迟来划分的,不是根据功能。

在这里插入图片描述

四级流水线比较
相比流水线划分之前,流水线方法可以充分提高系统的工作频率,但是评价一个电路的运算性能,通常是考虑其单位时间的计算量或者是一定计算总量下的处理时间。

如果是以一组N个顺序输入数据的运算时间作为衡量,非流水线计算时间为NT,流水线为(N+3)pipeline的时间。

哪个更好,需要通过具体情况判断。绝大部分情况,流水线更好。

非流水线四级流水线
逻辑链延迟时间 T T T T p i p e T_{pipe} Tpipe
系统最高时钟频率 f = 1 / T f=1/T f=1/T f p i p e = 1 / T p i p e f_{pipe}=1/T_{pipe} fpipe=1/Tpipe
一组 N 个顺序输入数据的运算时间 N T NT NT 4 T p i p e + ( N − 1 ) T p i p e = ( N − 3 ) T p i p e 4T_{pipe}+(N-1)T_{pipe}=(N-3)T_{pipe} 4Tpipe+(N1)Tpipe=(N3)Tpipe

3. 流水线特点与好处:

特点:

  • 通过插入寄存器,将长的串行逻辑链分成较小的部分

  • 当系统运算是串行的时候,利用时钟控制,使运算依照顺序按续进行

  • 在任何给定时刻,大部分电路都在工作

好处:

  • 每一部分延时较小→可使用更快的时钟

  • 大部分电路同时进行运算→可提高数据通过量

4. 流水线参数设计

流水线的参数设计中,系统时钟取决于最慢的流水线级的延时。

流水线分割点及级数的确定要考虑的因素包括:

  • 单元延迟时间及时钟频率的大小决定了数据通过速率
  • 过多的级数不一定能产生最快的结果
  • 太多寄存器的插入会导致芯片面积增加,布线困难,时钟偏差增加

参考资料:

芯动力——硬件加速设计方法

RTL设计指导原则

这篇关于RTL设计指导原则的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/903679

相关文章

Python中的可视化设计与UI界面实现

《Python中的可视化设计与UI界面实现》本文介绍了如何使用Python创建用户界面(UI),包括使用Tkinter、PyQt、Kivy等库进行基本窗口、动态图表和动画效果的实现,通过示例代码,展示... 目录从像素到界面:python带你玩转UI设计示例:使用Tkinter创建一个简单的窗口绘图魔法:用

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

怎么让1台电脑共享给7人同时流畅设计

在当今的创意设计与数字内容生产领域,图形工作站以其强大的计算能力、专业的图形处理能力和稳定的系统性能,成为了众多设计师、动画师、视频编辑师等创意工作者的必备工具。 设计团队面临资源有限,比如只有一台高性能电脑时,如何高效地让七人同时流畅地进行设计工作,便成为了一个亟待解决的问题。 一、硬件升级与配置 1.高性能处理器(CPU):选择多核、高线程的处理器,例如Intel的至强系列或AMD的Ry

基于51单片机的自动转向修复系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 单片机

SprinBoot+Vue网络商城海鲜市场的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质创作者,全网30w+

JVM内存调优原则及几种JVM内存调优方法

JVM内存调优原则及几种JVM内存调优方法 1、堆大小设置。 2、回收器选择。   1、在对JVM内存调优的时候不能只看操作系统级别Java进程所占用的内存,这个数值不能准确的反应堆内存的真实占用情况,因为GC过后这个值是不会变化的,因此内存调优的时候要更多地使用JDK提供的内存查看工具,比如JConsole和Java VisualVM。   2、对JVM内存的系统级的调优主要的目的是减少

单片机毕业设计基于单片机的智能门禁系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍程序代码部分参考 设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订

理解分类器(linear)为什么可以做语义方向的指导?(解纠缠)

Attribute Manipulation(属性编辑)、disentanglement(解纠缠)常用的两种做法:线性探针和PCA_disentanglement和alignment-CSDN博客 在解纠缠的过程中,有一种非常简单的方法来引导G向某个方向进行生成,然后我们通过向不同的方向进行行走,那么就会得到这个属性上的图像。那么你利用多个方向进行生成,便得到了各种方向的图像,每个方向对应了很多

Spring的设计⽬标——《Spring技术内幕》

读《Spring技术内幕》第二版,计文柯著。 如果我们要简要地描述Spring的设计⽬标,可以这么说,Spring为开发者提供的是⼀个⼀站式的轻量级应⽤开发框架(平台)。 作为平台,Spring抽象了我们在 许多应⽤开发中遇到的共性问题;同时,作为⼀个轻量级的应⽤开发框架,Spring和传统的J2EE开发相⽐,有其⾃⾝的特点。 通过这些⾃⾝的特点,Spring充分体现了它的设计理念:在

开题报告中的研究方法设计:AI能帮你做什么?

AIPaperGPT,论文写作神器~ https://www.aipapergpt.com/ 大家都准备开题报告了吗?研究方法部分是不是已经让你头疼到抓狂? 别急,这可是大多数人都会遇到的难题!尤其是研究方法设计这一块,选定性还是定量,怎么搞才能符合老师的要求? 每次到这儿,头脑一片空白。 好消息是,现在AI工具火得一塌糊涂,比如ChatGPT,居然能帮你在研究方法这块儿上出点主意。是不