数字芯片——时钟与复位

2024-06-12 06:52
文章标签 时钟 芯片 数字 复位

本文主要是介绍数字芯片——时钟与复位,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关于此次章节我想要探讨的问题是门控时钟的处理(Clock Gating Methodology)和时钟复位策略。在低功耗设计中,门控时钟是结构最简洁,最容易实现的电路结构。如上期所讲的,一个控制信号和时钟逻辑与在一起输出的信号作用在其他时序逻辑域,均受该控制信号的控制。如此,当电路空闲的时候,拉低该控制信号,即可降低该部分时序逻辑域的动态功耗。这里会引入一个问题,当门控信号按照一定频率跳转,或者出现glish 时,(AND 逻辑门是不能屏蔽glish ),该glish 会被传递到时钟端,对于时序逻辑电路 这是一个致命的缺陷。从netlist(后仿网表) 仿真会造成时序违例(setup/hold timing violation),假若这样的时序违例不被修改,在实际的电路中这样的一个glish 会导致数字芯片出现异常跳转(不符合设计需求),会导致相应的功能失效。从结果分析就是如此。

如下图1所示:
在这里插入图片描述

基于锁存器的时钟门控方式在设计中增加了一个电平敏感锁存器,以保持使能信号从时钟的有效边沿一直保持到时钟的非有效边沿。

如图2所示:
在这里插入图片描述
由于锁存器能捕捉使能信号的状态,并将其保持到完整的时钟脉冲产生为止,因此使能信号只需在时钟上升沿附近保持稳定即可。采用这种技术后,每次只需改变使能端的信号关闭和开启,从而确保电路的输出不会出现任何毛刺或尖峰。在使用此技术时,应特别注意时钟的占空比和生成使能信号逻辑的延迟,因为使能信号必须在半个时钟周期内产生。如果生成使能信号的逻辑特别复杂,或者时钟的占空比严重不平衡,这种情况可能会导致问题产生。然而,与其它时钟门控方法产生的问题相比,控制占空比和逻辑延迟在电路设计中是可接受的。

为了确保在生产制造过程中达到高故障覆盖率,必须确保时钟门控电路在采用扫描方法学时是完全可控和可观察的。可以加入一个控制信号,该信号使得设计中的所有触发器都能够被时钟驱动,无论使能信号的值是什么,这样做能让扫描链正常地传送信息。这样设计的目的是在进行测试时,通过这个控制信号暂时解除时钟门控,使得扫描测试能够全面触及并验证每个触发器的状态,从而提高对潜在故障的检测能力。此控制信号可以在进入锁存器之前与使能信号进行逻辑或运算,并且可以连接到两种类型的信号之一:一种是贯穿整个扫描测试过程都被置为激活状态的测试模式使能信号;另一种则是在仅在扫描移位期间才被置为激活状态的扫描使能信号。这样的设计允许在不改变正常操作逻辑的前提下,灵活地在测试模式下控制时钟门控行为,确保扫描测试的高效执行与全面的故障覆盖率。

大多数专用集成电路(ASIC)供应商确实会将这种“时钟门控单元”作为其标准库cell的一部分来提供。这意味着设计人员可以方便地利用这些预定义的cell进行设计,以实现高效的时钟管理,同时确保与供应商工艺的兼容性和设计的可靠性。通过直接使用这些标准库中的clock gate cell,工程师能够简化设计流程,减少设计错误,并加速产品的开发周期。

有效的功耗管理可以通过针对特信号使用门控技术来实现。类似于时钟门控的概念,信号门控减少了无时钟控制信号的切换次数。一个最常见的例子就是解码器的使能信号。解码器输入端的一个开关切换将会引起大量门电路的翻转。通过启用或选择信号来控制这一点,可以阻止它们开关活动的传播,这样做会使逻辑稍微复杂。

如图3所示:
在这里插入图片描述
简而言之,信号门控策略,比如利用解码器的使能信号,能够有效减少非时钟信号的无谓切换,以此降低功耗。虽然这可能需要更复杂的控制逻辑,但它能在保持系统功能完整的同时,显著提升能源效率。接下来多嘴说一句数据重排在数字电路中的运用。

数据路径重新排序以减少开关传播是指在数字电路设计中通过调整数据通路中各组件或模块的布局顺序,来优化信号的转换和传播,进而减少能量消耗和延迟的一种方法。这一技术的核心思想是通过分析和改变数据流经不同逻辑门或寄存器的顺序,最小化不必要的信号切换和传播效应。

具体实施时,数字电路设计师可能会考虑以下几点:

  1. 关键路径分析:识别设计中的关键路径,即决定整个系统性能上限的最长信号延迟路径。通过重排,尝试缩短这些路径或减少关键路径上的开关活动。
  2. 信号相关性:分析数据之间的依赖关系,尽量将频繁交互或有数据相关性的模块靠近布置,以减少长距离信号传输造成的延迟和功耗。
  3. 平衡负载:在重排过程中,力求均衡分配到各条总线或资源上的负载,避免局部过载导致的额外能耗。
  4. 利用寄存器重定时:通过插入或调整寄存器的位置,控制信号的流动和时序,减少不必要的数据转发和中间结果的保存,从而降低动态功耗。

通过上述方法,数据路径的重新排序不仅能够减少信号在通路中的传播延迟,还能够显著降低由于信号频繁切换引起的功耗,对于高性能、低功耗的集成电路设计尤为重要。

多个数据通路组件,例如解码器或比较运算器,以及存在“毛刺”现象的逻辑电路,都可能显著增加功率消耗。这些“毛刺”由信号的延迟到达或偏斜造成,它们会穿过其他数据通路元件和逻辑,直到到达寄存器为止。在这个传播过程中,随着信号在逻辑电平间的转换,会消耗更多的功率。为了减少这种无效的功率损耗,设计者需要重写硬件描述语言(HDL)代码,并尽可能缩短传播路径。

如图4所示:
在这里插入图片描述
4展示了优先级复用器的两种实现方式,其中 “毛刺”发生和“稳定”状态 的排列顺序有所不同。通过优化这些实现方式,选择一个更合理的信号排列顺序,可以有效减少毛刺传播,从而降低功耗。理想情况下,设计者会倾向于采用“稳定”条件下的实现方式,因为它能更有效地抑制毛刺信号的产生与传播,保持信号的干净与稳定,最终达到节能的目的。

对于相关复位的话题在前面的内容中有提及,感兴趣可以往前面的内容再次看看。

复位的主要目的是迫使片上系统(SoC)进入一个已知的状态以确保稳定运行。这样可以避免SoC上电后处于随机状态而导致系统挂起。一旦SoC构建完成,是否需要施加复位主要由系统需求、SoC的应用场景以及SoC的设计本身决定。一个良好的设计准则是,无论系统是否明确要求,都应对SoC中的每一个触发器提供复位信号。但在某些情况下,对于高速应用中使用的流水线触发器(移位寄存器触发器),为了实现更高性能的设计,可能会从某些触发器中省略复位信号。

设计时可以选择使用异步复位、同步复位或两者结合的方式。使用同步或异步复位各有其明显的优势和劣势,且在实际设计中任一方法都能得到有效应用。设计者必须采用最适合其设计的方法。

同步复位

同步复位基于这样一个前提:复位信号仅在时钟的有效边沿影响或重置触发器的状态。在某些仿真器中,根据逻辑方程,逻辑可能会阻止复位信号到达触发器。但这仅是一个仿真问题,并非真实的硬件问题。

如图5所示:
在这里插入图片描述

同步复位存在的一个问题是,综合工具很难将复位信号与任何其他数据信号区分开来。综合工具可能无意中将复位信号当作普通数据信号处理,从而生成不符合预期的电路结构。为了避免这种情况,设计者需要明确指示综合工具如何处理复位信号,或者在HDL代码中采用特定的编码风格来区分复位逻辑,确保复位信号得到正确的合成。

如图6所示:
在这里插入图片描述

例如,如果讨论的是图6中未提及的具体电路结构,应当是指某种特定的、优化过的或正确处理复位信号的电路布局。正确指导综合工具生成期望的电路图是解决这一问题的关键,这可能涉及到使用复位专用的引脚属性标注、专门的复位控制模块或者遵循特定的编码约定,以确保复位逻辑的意图在综合和布局布线阶段不被误解。

5所示的电路在功能上与图6所示的实现完全一致,唯一的不同在于复位与门被放置在了多路复用器(MUX)的外部。现在,考虑在门级仿真开始时会发生什么情况。通过保持“rst_n”为低电平(即复位信号有效),可以强制MUX两个通道的输入均为0。但是,如果“load”信号处于未知状态(X)且MUX的仿真模型较差,那么触发器的状态将保持未知(X),而不是被复位至0。需要注意的是,这个问题仅在仿真过程中存在。真实的电路会正常工作,将触发器成功复位至0

综合工具常常会提供编译器指令,这些指令告诉综合工具某个特定信号是同步复位(或置位)信号。综合工具随后会尽可能地将这个复位信号“pull”至触发器,以防止初始化问题的发生。通过这种方式优化复位信号的路由,确保复位功能在实际电路及仿真环境中都能正确执行。在实际的数字电路设计中,有一个很重要的流程需要设计者去清除的就是CDC问题了(vcspyglass 等),用工具去检查自己电路设计的合理性。

建议从项目一开始就将这些指令添加到RTL代码中,以避免在项目后期重新进行设计综合,这样做可以防止因遗忘或推迟设置而导致的时间成本和潜在的设计风险。在项目初期明确指定哪些信号为同步复位或置位信号,可以帮助综合工具从一开始就正确处理这些信号,确保后续的仿真和硬件实现都能顺利进行,同时也便于进行设计审查和维护。这样能够提前发现并解决问题,提高设计的可靠性和开发效率。

同步复位设计的优势与劣势:

  1. 同步复位通常确保电路100%处于同步状态。这意味着所有的状态变化,包括复位过程,都在时钟边沿控制之下,有助于维持时序的确定性和一致性。
  2. 同步复位逻辑通常综合出更小的触发器,特别是当复位信号与生成触发器输入逻辑相结合时。这样可以减少所需硬件资源,优化芯片面积和功耗。
  3. 同步复位确保复位仅在时钟的有效边沿发生。时钟起到了滤波器的作用,可以消除微小的复位毛刺,防止这些毛刺引起不希望的电路状态变化。
  4. 在某些设计中,复位信号需要由一系列内部条件生成。对于这类设计,推荐使用同步复位,因为它能够在时钟之间过滤掉逻辑方程中的毛刺,从而避免因内部逻辑瞬态错误引发的不必要复位,增加了系统的稳定性和可靠性。

并非所有ASIC库都包含内置同步复位功能的触发器。因为同步复位实质上等同于触发器的另一个数据输入,所以复位逻辑可以很自然地在触发器外部进行综合生成。这意味着不必依赖库中自带同步复位的特定触发器类型,设计者完全可以在触发器外部构造所需的复位控制逻辑,从而实现同步复位功能,这也增加设计复杂度和逻辑面积。

  1. 同步复位可能需要脉冲扩展器:为了确保复位脉冲宽度足够宽,以便在时钟的有效边沿期间复位信号保持有效,同步复位设计中可能需要使用脉冲扩展器。这一点在多时钟域设计中尤为重要。可以通过添加一个小计数器来保证复位脉冲至少持续一定数量的时钟周期。
  2. 组合逻辑产生的复位潜在问题:如果片上系统(SoC)中的复位信号由组合逻辑生成,或者复位信号需要穿过多级局部组合逻辑,那么在仿真过程中,根据复位信号的生成方式或应用到功能块的方式,复位信号可能会被未知值(X)所掩盖。问题的关键不在于复位类型的本身,而是复位信号是否能容易地通过外部引脚进行控制。
  3. 同步复位固有的时钟依赖性:同步复位的本质要求在复位电路时必须有工作时钟。这在某些情况下可能成为问题,特别是当使用门控时钟来节省功耗时,复位被声明的同时时钟也会被禁用。仅在异步复位的情况下,这种情况才能得到解决,因为在时钟恢复前复位信号就可以被撤销。

ASIC(专用集成电路)或FPGA(现场可编程门阵列)中,如果存在内部三态总线,那么在复位条件时对时钟的需求就显得尤为重要。为了防止芯片上电时内部三态总线上出现总线竞争,芯片应该具备上电异步复位功能,正如图7中所示那样。

如图7所示:
在这里插入图片描述
上电异步复位的重要性在于:

  1. 防止总线冲突:上电瞬间,如果没有明确的状态控制,连接在同一总线上的多个器件可能同时尝试驱动总线,导致不可预测的行为甚至损坏,因为总线冲突。异步复位确保所有连接到总线的器件在允许任何器件驱动总线前,都处于已知状态(通常是高阻抗态或固定输出电平)。
  2. 确保干净的初始化:异步复位由电源电压达到足够水平触发,确保在电源接通后尽快启动初始化序列,无需等待时钟信号稳定。这对于内部总线尤其重要,因为在初始上电阶段保持数据完整性是至关重要的。
  3. 复位后的同步:异步复位将所有设备置于安全状态后,芯片内部的同步逻辑便可以接管。这通常涉及同步复位机制,进一步将内部状态机和逻辑与系统时钟同步,确保从复位状态平稳过渡到工作状态。

那么我们谈谈寄存器异步复位的优劣:
在这里插入图片描述

  1. 使用异步复位的最大优势在于,只要供应商库中提供了支持异步复位的触发器,就能确保数据通路的纯净性。对于那些数据通路时序已经非常紧张的设计来说,无法承受因插入用于处理同步复位的额外逻辑门以及由此带来的网络延迟。采用异步复位,设计者可以确保复位信号不会被添加到数据通路中,从而不影响原有时序。
  2. 支持异步复位最明显的优点是,无论是否有时钟存在,电路都可以被复位。综合工具倾向于自动推断异步复位,而无需设计者手动添加任何综合属性,这简化了设计流程并减少了潜在的人为错误。

异步复位的缺点包括:

  1. 对于DFT(设计可测性)而言,如果异步复位不由I/O引脚直接驱动,则在进行DFT扫描和测试时,必须禁用来自复位驱动器的复位网络。这意味着需要额外的控制机制来确保测试的完整性。
  2. 异步复位最大的问题在于它的提出和撤销都是非同步的。复位信号的提出一般不会有问题,但撤销时却可能引发问题。如果异步复位在触发器的有效时钟边沿附近被释放,触发器的输出可能会进入亚稳态,从而导致SoC的复位状态丢失。
  3. 根据复位信号的来源,异步复位还可能面临由板上或系统级复位线路上的噪声或毛刺引起的误复位问题。通常需要设计去毛刺滤波器来消除毛刺对复位电路的影响。若此类问题在系统中较为严重,可能会促使设计者考虑采用同步复位作为解决方案。
  4. 无论采用同步还是异步复位,复位信号树的时序都必须经过精心安排,确保复位释放能在一拍时钟周期内完成。复位信号树的时序分析应在布局之后进行,以确保满足这一时序要求。为解决这一问题,一种方法是采用分布式复位同步器触发器,这样可以减轻时序约束并增强系统的鲁棒性。

异步复位移除问题:

在系统中移除异步复位可能导致芯片进入亚稳态或未知状态,因此需避免复位过程中的这一问题。在解除复位时必须格外小心,确保在复位释放时芯片不会进入亚稳态。使用同步复位时,复位的前沿和后沿都应远离时钟的活动边沿。

如图8所示:
在这里插入图片描述
如图8所示,当异步复位信号与时钟信号不同步地解除时,存在两个潜在问题:

  1. 违反复位恢复时间。复位恢复时间指的是复位信号解除到时钟信号再次变高之间的时间间隔。如果未能满足这一恢复时间要求,可能会导致寄存器数据输出的信号完整性问题或亚稳态问题。
  2. 不同时钟周期下,不同序列元件的复位移除。当复位解除与上升时钟边沿不同步时,复位信号和/或时钟信号的传播延迟微小差异,可能导致某些寄存器或触发器在其他寄存器之前提前退出复位状态,从而引起同步问题和数据不一致性。

解决异步复位移除问题的方法是使用复位同步器(Reset Synchronizer)。这是在使用异步复位的电路中保证正确移除复位的最常用技术。如果不使用复位同步器,即使在仿真过程中复位能够正常工作,异步复位在最终系统中的效用也将变得毫无意义。

简而言之,复位同步器是实现异步复位信号与系统时钟域同步的关键,它解决了异步信号引入的不确定性问题,提高了电路的稳定性和可靠性,是设计中不可或缺的一环,尤其是在复杂的多时钟域系统设计中。

作为一个异步复位源,复位信号毛刺的规避尤为重要,因为其毛刺引起的电路错误很严重,如何规避复位源的毛刺?

  1. 异步复位易受到毛刺的影响,这意味着任何宽度达到触发器最小复位脉冲宽度的输入信号都会导致触发器复位。如果复位线路遭受毛刺干扰,这将是一个实际问题。设计中可能没有非常高频率的采样时钟来检测复位信号上的微小毛刺。在数字电路设计中提出了一种可以滤除毛刺的方法。该方案需要一个数字延迟来滤除微小的毛刺。 复位输入引脚也应该是一个施密特触发电路的引脚,以辅助毛刺滤波。图9展示了复位毛刺滤波电路及其时序图。
  2. 为了增加延迟,一些供应商提供了可手工实例化的延迟宏。如果没有可用的延迟宏,设计者可以在优化后手动将延迟插入到综合设计中。第二种方法是在模块中实例化一个慢速缓冲器,然后多次实例化该模块以获得所需的延迟。基于此概念可以发展出多种变化形式。
  3. 由于这种方法使用了延迟线,其缺点之一是延迟会随温度、电压和工艺的变化而变化。必须谨慎确保在所有PVT(工艺、电压、温度)角上,延迟都能满足设计要求。

如图9所示:

在这里插入图片描述

这篇关于数字芯片——时钟与复位的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1053496

相关文章

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

第10章 中断和动态时钟显示

第10章 中断和动态时钟显示 从本章开始,按照书籍的划分,第10章开始就进入保护模式(Protected Mode)部分了,感觉从这里开始难度突然就增加了。 书中介绍了为什么有中断(Interrupt)的设计,中断的几种方式:外部硬件中断、内部中断和软中断。通过中断做了一个会走的时钟和屏幕上输入字符的程序。 我自己理解中断的一些作用: 为了更好的利用处理器的性能。协同快速和慢速设备一起工作

usaco 1.2 Name That Number(数字字母转化)

巧妙的利用code[b[0]-'A'] 将字符ABC...Z转换为数字 需要注意的是重新开一个数组 c [ ] 存储字符串 应人为的在末尾附上 ‘ \ 0 ’ 详见代码: /*ID: who jayLANG: C++TASK: namenum*/#include<stdio.h>#include<string.h>int main(){FILE *fin = fopen (

AIGC6: 走进腾讯数字盛会

图中是一个程序员,去参加一个技术盛会。AI大潮下,五颜六色,各种不确定。 背景 AI对各行各业的冲击越来越大,身处职场的我也能清晰的感受到。 我所在的行业为全球客服外包行业。 业务模式为: 为国际跨境公司提供不同地区不同语言的客服外包解决方案,除了人力,还有软件系统。 软件系统主要是提供了客服跟客人的渠道沟通和工单管理,内部管理跟甲方的合同对接,绩效评估,BI数据透视。 客服跟客人

NC 把数字翻译成字符串

系列文章目录 文章目录 系列文章目录前言 前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。 描述 有一种将字母编码成数字的方式:‘a’->1, ‘b->2’, … , ‘z->26’。 现在给一串数字,返回有多少种可能的译码结果 import java.u

34465A-61/2 数字万用表(六位半)

34465A-61/2 数字万用表(六位半) 文章目录 34465A-61/2 数字万用表(六位半)前言一、测DC/AC电压二、测DC/AC电流四、测电阻五、测电容六、测二极管七、保存截图流程 前言 1、6位半数字万用表通常具有200,000个计数器,可以显示最大为199999的数值。相比普通数字万用表,6位半万用表具有更高的测量分辨率和更高的测量准确度,适用于精度比较高的测

超级 密码加密 解密 源码,支持表情,符号,数字,字母,加密

超级 密码加密 解密 源码,支持表情,符号,数字,字母,加密 可以将表情,动物,水果,表情,手势,猫语,兽语,狗语,爱语,符号,数字,字母,加密和解密 可以将文字、字母、数字、代码、标点符号等内容转换成新的文字形式,通过简单的文字以不同的排列顺序来表达不同的内容 源码截图: https://www.httple.net/152649.html

两个长数字相加

1.编程题目 题目:要实现两个百位长的数字直接相加 分析:因为数字太长所以无法直接相加,所以采用按位相加,然后组装的方式。(注意进位) 2.编程实现 package com.sino.daily.code_2019_6_29;import org.apache.commons.lang3.StringUtils;/*** create by 2019-06-29 19:03** @autho

在亚马逊云科技上利用Graviton4代芯片构建高性能Java应用(上篇)

简介 在AI迅猛发展的时代,芯片算力对于模型性能起到了至关重要的作用。一款能够同时兼具高性能和低成本的芯片,能够帮助开发者快速构建性能稳定的生成式AI应用,同时降低开发成本。今天小李哥将介绍亚马逊推出的4代高性能计算处理器Gravition,带大家了解如何利用Graviton芯片为Java生成式AI应用提高性能、优化成本。 本篇文章将介绍如何在云平台上创建Graviton芯片服务器,并在Gra

关于字符串转化为数字的深度优化两种算法

最近在做项目,在实际操作中发现自己在VC环境下写的字符串转化为整型的函数还是太过理想化了,或者说只能在window平台下软件环境中运行,重新给大家发两种函数方法: 第一个,就是理想化的函数,在VC环境下充分利用指针的优越性,对字符串转化为整型(同时也回答了某位网友的答案吖),实验检验通过: #include <stdio.h> #include <string.h> int rayatoi(c