单片机中的 _nop_() 延时以及其相关的基础扩展

2023-10-29 18:45

本文主要是介绍单片机中的 _nop_() 延时以及其相关的基础扩展,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用 _nop_() 函数做延时遇到的一些问题 以及对此延伸出的一些需要了解的基本概念 ...... by  矜辰所致
完善文章内容结构,补充指令周期、机器周期等一些基本概念             2023/10/25

前言

最近还是继续做着项目,因为在某 8051 内核芯片上使用到了 I2C 通讯,又需要 _nop_() 函数来实现 us 延时,那么正好来写一篇由_nop_() 函数引起的一系列基本概念 。

本文的内容包括:对 nop 的认识,单片机中的 nop 函数做延时的一些注意事项,以及单片机中基本的指令周期,机器周期等一些基本概念的说明。

我是矜辰所致,全网同名,尽量用心写好每一系列文章,不浮夸,不将就,认真对待学知识的我们,矜辰所致,金石为开!

目录

  • 前言
  • 一、 NOP 指令
    • 1.1 NOP 指令的作用
  • 二、单片机中的 `_nop_()` 函数
    • 2.1 C语言中的 NOP
    • 2.2 _nop_ 函数消耗的时间
  • 三、用 `_nop_()` 延时的注意事项
    • 3.1 函数调用对延时的影响
    • 3.2 调用函数中的语句对延时的影响
      • 3.2.1 单片机执行一条指令所需要的时间
  • 四、指令周期、机器周期、时钟周期
  • 结语

一、 NOP 指令

_nop_() 函数产生的是 NOP 指令,先来简单介绍一下 NOP 指令,基本介绍走个流程把:

NOP 是编程语言中一个经常用到的指令,它的全称是 No Operation,即无操作指令。

NOP 是汇编语言中的一个伪指令,通过NOP一系列的编程语句,能够不改变任何程序可以访问的寄存器。

1.1 NOP 指令的作用

  1. 我们知道,指令、数据对齐可以有效地提高程序的性能, 使用 NOP 指令,可以使得指令按字对齐,从而提高效率 。
    比如一条指令占用 3 个字节,再加上一个 NOP 指令,就使得指令 4 字节对齐了。

  2. 通过 NOP 指令产生一定的延迟,这与 CPU 的频率有关系,适用于一些频率低的 单片机 场合。

  3. 计算机在输入或者输出的过程中,使用 NOP 指令可可以很好的等待计算机缓冲区清空,等待总线恢复正常,其实也算是延时的一种了

二、单片机中的 _nop_() 函数

2.1 C语言中的 NOP

如果使用汇编语言,我们可以直接使用 NOP 指令的 ,直接写一个 nop 就可以,比如下面示例:

        .text                   ; 代码段开始.syntax unified         ; start:mov r0, #0x55          ; 将0x55存储在寄存器R0中nop                    ; 插入NOP指令mov r1, #0xAA          ; 将0xAA存储在寄存器R1中add r2, r0, r1         ; 将R0和R1相加并将结果存储在R2中

但是我们在单片机中编程,现在都是使用 C 语言,对于 C 语言本身来说,是没有空语句的。

但是我们在做51单片机的开发中,在库文件中提供了一个void _nop_(void);函数,这个函数声明一般在 intrins.h 头文件当中,我们只需要 #include <intrins.h> 就可以使用 _nop_(); 函数了。

比如:
在这里插入图片描述

我们已经知道了 nop 是空语句,什么都不做,但是在这里我们还是得明确的知道 一个 _nop_()表示空循环一个机器指令的时间。

2.2 nop 函数消耗的时间

那么在我们的单片机中,一个 nop 的时间是多少呢?、

上面说到,一个 nop 表示一个机器周期,那么一个机器周期是多少?

机器周期当然与主频有关,在单片机中指的就是晶振的频率。

首先基本的东西还是要知道的 一个机器周期包含12个晶振周期。 所以我们可以通过下面的计算得知 nop 函数消耗的时间:

假设单片机 12M 晶振,晶振周期1/12微秒,一个机器周期包含12个晶振周期,所以12M晶振时机器周期 = 12x(1/12)us = 1us 。
.
所以12M 晶振中一个 nop 表示延时1us;
6M 晶振中延时2us,24M 晶振中延时 0.5 us

至于其他的晶振频率,我们可以按照上面的计算代入即可。

对于 _nop_() 函数 其实在我以前的文章 BH1750 传感器实战教学 —— 驱动移植篇 中有过说明:

在这里插入图片描述

三、用 _nop_() 延时的注意事项

到此,我们已经可以知道在我们的程序中,一个 nop 函数执行所需要时间,我们可以利用多个 _nop_() 函数来实现一些 us 级别的延时。

比如我以前一些帖子里面提到的在 51 上面的 I2C 通讯:

在这里插入图片描述

在上图中,就是一个简单的 I2C 其实信号的实现方式, 在上图中,有说明 多几个 nop 少几个 nop 无所谓,实际上现在看来是有问题的,这让我付出了代价,这一点我后面会在写某个传感器测试博文的时候会提到。

3.1 函数调用对延时的影响

那么本文这里要说明的是一些使用时候的问题,依然是我以前文中提到的,在 STM32 HAL 库中没有 us 延时,所以我一直用的是:

void delay_us(uint32_t Delay)
{uint32_t cnt = Delay * 8;   // 32Mhz ,其他频率其他倍数uint32_t i = 0;for(i = 0; i < cnt; i++)__NOP();
}

于是乎,对于本次使用的 16MHZ 晶振的 51 芯片,我改成了如下:

void delay_us(uint32 Delay)
{uint32 cnt = Delay * 4;   // 32Mhz 8 ,其他频率其他倍数  	  16Mhz慢一点  4uint32 i = 0;for(i = 0; i < cnt; i++)_nop_();
}

然后自然的把上面的 I2C_Start 改成如下:

void I2C_Start1(void)
{sda_high();delay_us(5);scl_high();delay_us(10);sda_low();delay_us(10);scl_low(); //使SCL置低,准备发送或者接受数据delay_us(10);
}

反正改完以后传感器通讯是不正确的,于是乎最后上了示波器,惊讶的发现,在我使用的 51 上面采用上面的方式的波形图如下(注意看波形的时间):

在这里插入图片描述

是不是很意外,时间周期居然可以达到 ms 级别,就是使用一个一个循环调用 nop 的函数……,我一个 I2C 传感器的初始化工作,居然持续了好几秒时间……

而在 STM32 平台下面,我观察到的波形图如下(us级别算是正常的):

在这里插入图片描述

虽然知道调用函数会占用时间,但是上面的情况也太离谱了点,即便我最后把循环里面的 *4 都直接删除,波形周期还是 ms 级别。

这…… 真的是有点太离谱了,一个简单的 nop 延时函数在实际上会有这么久的延时……

反正最后我还是去掉了函数,采用直接使用很多个 nop 函数直接写的方式,如下图的上面部分:

在这里插入图片描述

实际上,除了调用函数,在函数中的使用什么语法也决定了这个函数执行的时间长短,这个问题对于我们现在大家常用的 ARM 内核来说,可能都不太容易发现,或者影响没那么大,但是对于老一点的 51 内核,影响就大了,但是大到上面这种程度,也是我没想到的。

3.2 调用函数中的语句对延时的影响

那说到除了调用函数,函数中的语句是如何影响时间的呢,这因为在C51编译器中,对不同的循环方法,采用不同的指令来完成的,对于不同的指令,单片机执行所需要的的时间也是不一样的。

3.2.1 单片机执行一条指令所需要的时间

完成一条指令需要的时间,也就是指令周期。

指令周期就是 单片机 取出一条指令并执行这条指令所需要的时间。指令周期,是从取指令、分析指令到执行完所需的全部时间。

指令周期一般由若干个机器周期组成(我们上面讲过,一个 _nop_() 就是一个机器周期),他是以机器周期为单位的!!!

其实通过我们前文的介绍,我们已经知道如何算一个 单片机的 机器周期(一个 nop 的时间,他是由 12 个时钟周期组成的),我们只需要知道这条指令是由几个机器周期组成的就可以,这一点会在单片机的使用手册中有说明,比如下图:

在这里插入图片描述

上图中上面一些指令需要 12 个时钟周期,就是一个机器周期,最后一个需要 2个 机器周期。

大家都能看到其实后面有一个 6T 模式的说明,很容易理解,就是1机器周期等于 6 个时钟周期的模式,这样会使得单片机执行效率提升 2 倍 ,现代单片机有许多都有这种高效率模式。


了解完了指令周期,那我们是不是很容易的就明白了,在函数中为什么不同的语句会对延时产生不同影响了。

这里呢,我就不对不同的语句进行单独的分析了,大家有时间可以自己生成汇编文件自己研究,这里我就从网上截取了部分说明:

在选择C51中循环语句时,要注意以下几个问题
.
第一、定义的 C51 中循环变量,尽量采用无符号字符型变量。
.
第二、在 for 循环语句中,尽量采用变量减减来做循环。
.
第三、在do…while,while语句中,循环体内变量也采用减减方法。

我们要知道的是,上面的做法都是为了减少额外的时间开销,使得我们想要的延时时间更加准确。

四、指令周期、机器周期、时钟周期

在文章上面部分由反复的提到过几个概念:指令周期,机器周期,时钟周期。

为了防止有的小伙伴还是迷迷糊糊的,这里来简单的总结一下(以 8051 单片机为例):

时钟周期 = 1/ 晶振频率
单片机的心跳,基本时间单位
.
机器周期 = 时钟周期 * 12
单片机的基本操作周期,一个机器周期,单片机完成一项基本操作,如取指令,读/写存储器
.
指令周期 :
CPU 执行一条指令所需要的时间, 以机器周期为单位。
指令周期所需要的的机器周期,可以通过单片机使用手册中的指令表查询得到。

当然,其实与上面这些概念相关的还有一个状态周期,他等于 2个 时钟周期,这里也提一下。

结语

本文通过一个简单的 _nop_() 函数,我们探讨了在单片机中实现 us 延时的一些时间问题以及注意事项,进而引出了一些时间周期的基本概念,相信能让大家在日后使用到的时候能够更好的理解与计算自己所需要的延时时间。

好了本文就到这里,谢谢大家,赶在 10.24.发,仓促结尾! 不好意思!

文章已经完善更新,谢谢大家! … by 矜辰所致

这篇关于单片机中的 _nop_() 延时以及其相关的基础扩展的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/302632

相关文章

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close

Spring框架5 - 容器的扩展功能 (ApplicationContext)

private static ApplicationContext applicationContext;static {applicationContext = new ClassPathXmlApplicationContext("bean.xml");} BeanFactory的功能扩展类ApplicationContext进行深度的分析。ApplicationConext与 BeanF

基于51单片机的自动转向修复系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 单片机

两个月冲刺软考——访问位与修改位的题型(淘汰哪一页);内聚的类型;关于码制的知识点;地址映射的相关内容

1.访问位与修改位的题型(淘汰哪一页) 访问位:为1时表示在内存期间被访问过,为0时表示未被访问;修改位:为1时表示该页面自从被装入内存后被修改过,为0时表示未修改过。 置换页面时,最先置换访问位和修改位为00的,其次是01(没被访问但被修改过)的,之后是10(被访问了但没被修改过),最后是11。 2.内聚的类型 功能内聚:完成一个单一功能,各个部分协同工作,缺一不可。 顺序内聚:

log4j2相关配置说明以及${sys:catalina.home}应用

${sys:catalina.home} 等价于 System.getProperty("catalina.home") 就是Tomcat的根目录:  C:\apache-tomcat-7.0.77 <PatternLayout pattern="%d{yyyy-MM-dd HH:mm:ss} [%t] %-5p %c{1}:%L - %msg%n" /> 2017-08-10