DSP_TMS320F28377D_算法加速方法3_使用TMU库加速

2023-11-21 00:20

本文主要是介绍DSP_TMS320F28377D_算法加速方法3_使用TMU库加速,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

继上两篇方法

DSP_TMS320F28377D_算法加速方法1_拷贝程序到RAM运行_江湖上都叫我秋博的博客-CSDN博客

DSP_TMS320F28377D_算法加速方法2_添加浮点运算快速补充库rts2800_fpu32_fast_supplement.lib_江湖上都叫我秋博的博客-CSDN博客

之后,本文继续讨论第三种DSP算法加速的方法——TMU库

TMU库在28377D的项目中,一般是自动配置上的,用户是无需任何操作的。

另外,本人实测,在28335项目中,TMU库是无效的,我怀疑28335就不支持TMU加速。如果有知道怎么操作的朋友,可评论区、私信告知。

该方法的加速能力比方法2还强。不过同样也有一个范围的:

 方法2我们简称为FPU加速,本文的方法(方法3)我们简称为TMU加速  FPU加速和TMU加速是两种互斥的方法,就是你用了某一种,就不能用另一种了。 所以你必须有所取舍

1 速度对比

下面我们从速度和精度两方面做一个对比,首先来看速度。(代码贴到最后吧)

TMU相比于FPU在速度上有非常明显的优势,TMU相比于FPU能够加速两倍以上。 (最后10 11 12,都是测试的小数的除法,12的结果是我直接用常数运算,而没有用变量的方式)。 

2 精度对比

精度方面,我用sin(1.9)来做一个对比测试吧。

可以看到精度都要损失,但是FPU和TMU两种方法的精度是一样的。

结论:对于相同的函数,最优的选择就是TMU

3 代码

代码的整体框架本文不赘述,看:DSP_基于TMS320F28377D双核芯片和CCS7.40的编程入门_ccs双核芯片下载_江湖上都叫我秋博的博客-CSDN博客

如何获取代码块的运行时间,本文也不赘述,看: DSP_TMS320F28377D_使用定时器实现<获取代码块运算时间>的功能_江湖上都叫我秋博的博客-CSDN博客

代码我就只贴一下main.c 和 main.h

// main.c
#include <main.h>float64 rt[13];
double s1;
double s2;
void main(void)
{int i;InitSysCtrl();DINT;InitPieCtrl();InitGpio();IER     = 0x0000;IFR     = 0x0000;InitPieVectTable();InitCpuTimers();s1 = sin(1.9);s2 = __sin(1.9);asm ("  ESTOP0");runtime_init();while(1){for(i = 0; i < 13; i++){runtime_start();testfunction(i+1);runtime_stop();rt[i] = runtime;}}}void testfunction(int sel){int i = 0;double s,a,b;a = 1.023;b = 2.312;switch(sel){case 1:for(i = 0; i < 1000; i++){s = sin(a);}break;case 2:for(i = 0; i < 1000; i++){s = __sin(a);}break;case 3:for(i = 0; i < 1000; i++){s = cos(a);}break;case 4:for(i = 0; i < 1000; i++){s = __cos(a);}break;case 5:for(i = 0; i < 1000; i++){s = atan(a);}break;case 6:for(i = 0; i < 1000; i++){s = __atan(a);}break;case 7:for(i = 0; i < 1000; i++){s = atan2(a,b);}break;case 8:for(i = 0; i < 1000; i++){s = __atan2(a,b);}break;case 9:for(i = 0; i < 1000; i++){s = sqrt(a);}break;case 10:for(i = 0; i < 1000; i++){s = __sqrt(a);}break;case 11:for(i = 0; i < 1000; i++){s = a/b;}break;case 12:for(i = 0; i < 1000; i++){s = __divf32(a,b);}break;case 13:for(i = 0; i < 1000; i++){s = 1.023 / 2.312;}break;default :break;}}// main.h
#include <F28x_Project.h>
#include <runtime.h>
#include <math.h>interrupt void CpuTimer0ISR(void);
#pragma CODE_SECTION(testfunction,".TI.ramfunc");void testfunction(int sel);

 算了,还是runtime的也贴上吧

// runtime.c#include <runtime.h>float64 runtime = 0;    // 单位usvoid runtime_init(void){ConfigCpuTimer(&CpuTimer1, 200, 10000000);   // 支持代码块最长运行时常10s
}void runtime_start(void){CpuTimer1Regs.TCR.bit.TRB = 1;  // 周期计时器重装载CpuTimer1Regs.TCR.bit.TSS = 0;  // 开始计数
}void runtime_stop(void){runtime = (float64)(CpuTimer1Regs.PRD.all -  CpuTimer1Regs.TIM.all) * 0.005;    // 等价于 / 200, 单位usCpuTimer1Regs.TCR.bit.TSS = 1;  // 停止计数
}// runtime.h
#ifndef PROGRAM_RUNTIME_RUNTIME_H_
#define PROGRAM_RUNTIME_RUNTIME_H_#include <main.h>extern float64 runtime;
void runtime_init(void);
void runtime_start(void);
void runtime_stop(void);#endif /* PROGRAM_RUNTIME_RUNTIME_H_ */

4 关于是否与方法1叠加加速

答:可以! 亲测可叠加!  

5 中断中是否可用

答:肯定可以!我猜的,我没测😄。 

后续会再推出DSP算法加速的方法与大家探讨。感谢您的阅读,如果您有什么优化方法,欢迎留言分享、收藏点赞

这篇关于DSP_TMS320F28377D_算法加速方法3_使用TMU库加速的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/398477

相关文章

Java function函数式接口的使用方法与实例

《Javafunction函数式接口的使用方法与实例》:本文主要介绍Javafunction函数式接口的使用方法与实例,函数式接口如一支未完成的诗篇,用Lambda表达式作韵脚,将代码的机械美感... 目录引言-当代码遇见诗性一、函数式接口的生物学解构1.1 函数式接口的基因密码1.2 六大核心接口的形态学

Python实现文件下载、Cookie以及重定向的方法代码

《Python实现文件下载、Cookie以及重定向的方法代码》本文主要介绍了如何使用Python的requests模块进行网络请求操作,涵盖了从文件下载、Cookie处理到重定向与历史请求等多个方面,... 目录前言一、下载网络文件(一)基本步骤(二)分段下载大文件(三)常见问题二、requests模块处理

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)

vue基于ElementUI动态设置表格高度的3种方法

《vue基于ElementUI动态设置表格高度的3种方法》ElementUI+vue动态设置表格高度的几种方法,抛砖引玉,还有其它方法动态设置表格高度,大家可以开动脑筋... 方法一、css + js的形式这个方法需要在表格外层设置一个div,原理是将表格的高度设置成外层div的高度,所以外层的div需要

使用DeepSeek API 结合VSCode提升开发效率

《使用DeepSeekAPI结合VSCode提升开发效率》:本文主要介绍DeepSeekAPI与VisualStudioCode(VSCode)结合使用,以提升软件开发效率,具有一定的参考价值... 目录引言准备工作安装必要的 VSCode 扩展配置 DeepSeek API1. 创建 API 请求文件2.

使用TomCat,service输出台出现乱码的解决

《使用TomCat,service输出台出现乱码的解决》本文介绍了解决Tomcat服务输出台中文乱码问题的两种方法,第一种方法是修改`logging.properties`文件中的`prefix`和`... 目录使用TomCat,service输出台出现乱码问题1解决方案问题2解决方案总结使用TomCat,

解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题

《解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题》文章详细描述了在使用lombok的@Data注解标注实体类时遇到编译无误但运行时报错的问题,分析... 目录问题分析问题解决方案步骤一步骤二步骤三总结问题使用lombok注解@Data标注实体类,编译时

Java中使用Java Mail实现邮件服务功能示例

《Java中使用JavaMail实现邮件服务功能示例》:本文主要介绍Java中使用JavaMail实现邮件服务功能的相关资料,文章还提供了一个发送邮件的示例代码,包括创建参数类、邮件类和执行结... 目录前言一、历史背景二编程、pom依赖三、API说明(一)Session (会话)(二)Message编程客

C++中使用vector存储并遍历数据的基本步骤

《C++中使用vector存储并遍历数据的基本步骤》C++标准模板库(STL)提供了多种容器类型,包括顺序容器、关联容器、无序关联容器和容器适配器,每种容器都有其特定的用途和特性,:本文主要介绍C... 目录(1)容器及简要描述‌php顺序容器‌‌关联容器‌‌无序关联容器‌(基于哈希表):‌容器适配器‌:(

Python判断for循环最后一次的6种方法

《Python判断for循环最后一次的6种方法》在Python中,通常我们不会直接判断for循环是否正在执行最后一次迭代,因为Python的for循环是基于可迭代对象的,它不知道也不关心迭代的内部状态... 目录1.使用enuhttp://www.chinasem.cnmerate()和len()来判断for