多途径降低FPGA设计的功耗

2024-08-22 02:08
文章标签 设计 fpga 降低 功耗 途径

本文主要是介绍多途径降低FPGA设计的功耗,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

多途径降低FPGA设计的功耗

转载 2006040821:53:00

为了更好地理解本文所要讨论的设计技巧如何能节省功耗,让我们先对功耗做一个简要介绍。

 

功耗包含两部分:动态功耗与静态功耗。动态功耗是指对器件中的容性负载进行充放电所需的功耗。它很大程度上取决于频率、电压和负载。这三个变量中的每一个都能由你以某种形式进行控制。

 

静态功耗是指由器件中所有晶体管的泄漏电流(源极到漏极以及栅极泄漏,常常集中为静止电流)所引起的功耗之和,以及任何其他恒定的功耗需求。泄漏电流在很大程度上取决于结温和晶体管尺寸。

 

恒定功耗需求包括因端接(如上拉电阻)所造成的电流泄漏。没有多少措施可以用来影响泄漏,但却能控制恒定功耗。

 

尽早考虑功耗

 

你制定的功耗决策在设计的早期阶段具有最大的影响。决定采用何种元件对功耗有很大的意义,而在时钟上插入一个 BUFGMUX 则影响甚微。因此须尽早考虑你下一个设计的功耗。

1:利用使能信号来减少功耗。 

并非所有元件都拥有同样的待机功耗。作为一种通用法则,器件工艺尺寸越小,晶体管的速度就越快,但漏电功耗也越高。不过,并非所有工艺技术都完全一样。例如,面向领域优化的90nm平台FPGA的待机功耗与其他90 nm FPGA技术的待机功耗有很大的差异。面向领域优化的90 nm平台FPGA采用一种称为三栅极氧化层 (triple-oxide) 技术的新工艺方法,通过有选择地增加栅极氧化层厚度来减少泄漏电流(同时又不牺牲性能),而有效地解决了静态功耗问题。尽管这个三栅极氧化层仍很薄,但这些晶体管的确展现出比标准薄氧化层晶体管更低的漏电流。据我们研究,90 nm平台FPGA的静态功耗比上一代130 nm平台FPGA的静态功耗要低一半。我们相信这是FPGA历史上第一次在迁移到新的、尺寸更小的工艺节点时静态功耗减小。

 

不过,虽然待机功耗随着工艺尺寸的减小而增加,动态功耗却将下降,因为更小的工艺尺寸往往伴随着更低的电压和更小的电容。因此请仔细考虑何种功耗对你的设计影响更大——是待机功耗还是动态功耗?

 

除了通用逻辑单元外,一些FPGACPLD器件还拥有专用逻辑,包括块RAM18 x 18乘法器、DSP48块、SRL16以及其他逻辑。你应该总是采用专用逻辑,而不是基于逻辑单元的模块。专用逻辑不仅具有更高的性能,而且所要求的密度更低,因此对于同样的操作其功耗也更低。当评估你的器件选择时,请仔细考虑专用逻辑的类型与数量。

 

选择一项合适的I/O标准也能节省功耗。这些都是简单的决定,如选择最低驱动强度或较低电压标准等。当系统速度要求使用高功率I/O标准时,你可计划一个默认状态来降低功耗。有些I/O标准(例如GTL/+)需要使用一个上拉电阻才能正常工作。因此,如果该I/O的默认状态为高而不是低,则可节省流过该端接电阻的直流功耗。对于GTL+,将50 ohm端接电阻的默认状态设置为1.5V,可使每个I/O节省30 mA的电流。

 

数据使能

 

当总线上的数据与寄存器相关时,常常使用片选或时钟使能逻辑来控制寄存器的使能。进一步讲,尽早对该逻辑进行数据使能,可以阻止数据总线与时钟使能寄存器组合逻辑之间不必要的转换,如图 1 所示。红色波形表示原设计;绿色波形表示修改后的设计。

 

另一种选择是在板上(而不是在芯片上)进行这种数据使能。例如,你可以用一个CPLD从处理器上卸载掉一些简单任务,使其能更长久地处于待机模式。同样的概念也可运用于FPGA。尽管FPGA不一定拥有待机模式,但用CPLD来截取总线数据并有选择地将数据馈送给FPGA,亦可节省不必要的输入转换。一些CPLD具有一种称为数据门控的特性,此特性可以禁止引脚上的逻辑转换到达 CPLD 的内部逻辑。数据门控使能可由片上逻辑或一个引脚来控制。

 

状态机设计

 

你应该根据预测的下一个状态条件来列举状态机,同时选择在通常状态之间具有较少转换位的状态值。这么做,你就能减少状态机网络的转换量(转换频率)。确定常态转换并选择适当的值,是一种可减少功耗同时对设计影响较小的简单方法。编码方式越简单,所使用的译码逻辑也就越少。

 

让我们来看一个在状态7和状态8之间频繁进行状态转换的状态机。如果你为该状态机选择二进制编码,则意味着每次在状态7和状态8之间转换时,都有四位需要改变状态,如表1所示。

1:通过状态编码来减少信号转换。 

如果状态机采用格雷码而不是二进制码来设计,则这两个状态之间的转换所需的逻辑转换量将降至仅为一位。另外,如果将状态78分别编码为00100011,亦可达到同样的效果。

 

时钟管理

 

在一个设计的所有吸取功耗的信号当中,时钟是罪魁祸首。尽管时钟可以运行在100 MHz上,但从该时钟派生出的信号却通常运行在主时钟频率的较小分量(通常为12% ~ 15%)上。此外,时钟的扇出也一般较高。这两个因素表明,要降低功耗,须认真研究时钟。

 

如果设计的某个部分可处于非活动状态,则可考虑使用一个BUFG-MUX(而不是使用时钟使能)来禁止时钟树翻转。时钟使能将阻止寄存器进行不必要的翻转,但时钟树仍然会翻转,从而消耗功率。不过,采用时钟使能总比什么措施也不用强。

 

你还应隔离时钟以使用最少量的信号区。不使用的时钟树信号区不会翻转,从而降低该时钟网络的负载。细心的底层规划可在不影响实际设计的情况下达到此目标。

 

功耗估算工具

 

Xilinx提供了两种形式的功耗估算工具:一种是称为“Web功耗工具的实现前工具,另一种是称为“XPower”的实现后工具。Web功耗工具可基于对逻辑使用率的大致估计提供功耗估算。利用它,你可以仅凭设计利用率估计就能获得功耗评估,而无需实际设计文件。

 

XPower用于分析实际器件利用率,并结合实际的适配后 (post-fit) 仿真数据(VCD 文件格式),给出实际功耗数据。利用 Xpower,你可以在完全不接触芯片的情况下分析设计更改对总功耗的影响。

 

基于Web的功耗估计,是在设计流程的早期获得器件功耗情况的最快捷和最方便的方法。这些工具每季度都会发布新版本,因此信息总是最新,且不需要安装或下载,只需拥有互联网连接和一个 Web 浏览器即可。你可以指定设计参数并保存和加载设计设置,从而免去通过交互使用重新输入设计参数的麻烦。只要有对设计行为的估计并选定目标器件即可开始。

 

Xpower 是所有Xilinx ISE(设计工具配置中的一个免费组件,你可以用它来对设计的功耗需求进行更为详细的估计。XPower是在映射或布局与布线后设计的基础上对器件功耗进行估计的。对于成熟的量产FPGACPLDXPower计算出的功耗估计的平均设计批量误差小于 10%。它将把器件数据与你的设计文件结合起来综合考虑,并根据你的特定设计信息来给出器件功耗估计的高精度报告。

 

XPower直接集成在ISE软件中,可提供分层及详细网络功耗显示、详细总结报告和功耗向导。XPower可接受仿真设计活动数据,并可以 GUI 模式和批处理模式运行。XPower 将考虑设计中的每个网络和逻辑元素。ISE 设计文件提供准确的资源使用情况、XPower 交叉参考布线信息以及特征化电容数据。设计特征化将对新器件持续进行,以给出最精确的结果。Xpower 采用网络翻转速率和输出负载,后再计算功耗和结温,并能显示单个网络的功耗数据。

 

作者:Arthur Yang
高级产品应用工程师
Xilinx公司

这篇关于多途径降低FPGA设计的功耗的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1094933

相关文章

Python中的可视化设计与UI界面实现

《Python中的可视化设计与UI界面实现》本文介绍了如何使用Python创建用户界面(UI),包括使用Tkinter、PyQt、Kivy等库进行基本窗口、动态图表和动画效果的实现,通过示例代码,展示... 目录从像素到界面:python带你玩转UI设计示例:使用Tkinter创建一个简单的窗口绘图魔法:用

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

怎么让1台电脑共享给7人同时流畅设计

在当今的创意设计与数字内容生产领域,图形工作站以其强大的计算能力、专业的图形处理能力和稳定的系统性能,成为了众多设计师、动画师、视频编辑师等创意工作者的必备工具。 设计团队面临资源有限,比如只有一台高性能电脑时,如何高效地让七人同时流畅地进行设计工作,便成为了一个亟待解决的问题。 一、硬件升级与配置 1.高性能处理器(CPU):选择多核、高线程的处理器,例如Intel的至强系列或AMD的Ry

基于51单片机的自动转向修复系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 单片机

SprinBoot+Vue网络商城海鲜市场的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质创作者,全网30w+

单片机毕业设计基于单片机的智能门禁系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍程序代码部分参考 设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订

Spring的设计⽬标——《Spring技术内幕》

读《Spring技术内幕》第二版,计文柯著。 如果我们要简要地描述Spring的设计⽬标,可以这么说,Spring为开发者提供的是⼀个⼀站式的轻量级应⽤开发框架(平台)。 作为平台,Spring抽象了我们在 许多应⽤开发中遇到的共性问题;同时,作为⼀个轻量级的应⽤开发框架,Spring和传统的J2EE开发相⽐,有其⾃⾝的特点。 通过这些⾃⾝的特点,Spring充分体现了它的设计理念:在

开题报告中的研究方法设计:AI能帮你做什么?

AIPaperGPT,论文写作神器~ https://www.aipapergpt.com/ 大家都准备开题报告了吗?研究方法部分是不是已经让你头疼到抓狂? 别急,这可是大多数人都会遇到的难题!尤其是研究方法设计这一块,选定性还是定量,怎么搞才能符合老师的要求? 每次到这儿,头脑一片空白。 好消息是,现在AI工具火得一塌糊涂,比如ChatGPT,居然能帮你在研究方法这块儿上出点主意。是不

创业者该如何设计公司的股权架构

本文来自七八点联合IT橘子和车库咖啡的一系列关于设计公司股权结构的讲座。 主讲人何德文: 在公司发展的不同阶段,创业者都会面临公司股权架构设计问题: 1.合伙人合伙创业第一天,就会面临股权架构设计问题(合伙人股权设计); 2.公司早期要引入天使资金,会面临股权架构设计问题(天使融资); 3.公司有三五十号人,要激励中层管理与重要技术人员和公司长期走下去,会面临股权架构设计问题(员工股权激

分布式文件系统设计

分布式文件系统是分布式领域的一个基础应用,其中最著名的毫无疑问是 HDFS/GFS。如今该领域已经趋向于成熟,但了解它的设计要点和思想,对我们将来面临类似场景 / 问题时,具有借鉴意义。并且,分布式文件系统并非只有 HDFS/GFS 这一种形态,在它之外,还有其他形态各异、各有千秋的产品形态,对它们的了解,也对扩展我们的视野有所俾益。本文试图分析和思考,在分布式文件系统领域,我们要解决哪些问题、有