【程序语言】元编程带来的代码展开技巧

2024-03-29 00:18

本文主要是介绍【程序语言】元编程带来的代码展开技巧,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

我们讨论过对int arr[20]所有元素求和的最高执行效率代码,那就是:

     int sum = arr[0]  +arr[1]  +arr[2]  +arr[3]
+arr[4]  +arr[5]  +arr[6]  +arr[7]
+arr[8]  +arr[9]  +arr[10] +arr[11]
+arr[12] +arr[13] +arr[14] +arr[15]
+arr[16] +arr[17] +arr[18] +arr[19];

但是这样写代码实在是太累了,为了效率,也不能这样写代码不是,要是我的数组是int arr[100]岂不是要写到无比长去!那么这次我们就通过元编程完成一次代码自动生成!

 
template <int Dim,typename T>  
struct Sum{  
static T sum(T *arr){  
return (*arr) + Sum<Dim-1,T>::sum(arr+1);  
};  
};  
template<typename T>  
struct Sum<1,T>{  
static T sum(T *arr){  
return *arr;  
};  
};  
/*调用代码*/ 
int sum = Sum<20,int>::sum(arr);  

解释一下上面的代码: 

 step1:当读取到 Sum<20,int>::sum(arr) 时,编译器展开到 *arr + Sum<19,int>::sum(arr+1); 

step2:当读取到 Sum<19,int>::sum(arr) 时,编译器展开到 *arr + *(arr+1) + Sum<18,int>::sum(arr+1+1); 

 ...

 编译器递归地展开上式...

 编译器展开到 *arr           +*(arr+1)     +*(arr+2)      +*(arr+3)     +*(arr+4)    + 

                         *(arr+5)     +*(arr+6)     +*(arr+7)     +*(arr+8)      +*(arr+9)    + 

                         *(arr+10)   +*(arr+11)   +*(arr+12)   +*(arr+13)   +*(arr+14) + 

                         *(arr+15)   +*(arr+16)   +*(arr+17)   +*(arr+18)   +Sum<1,int>::sum(arr+19);

最后按照struct Sum<1,T>的定义展开,即Sum<1,int>::sum(arr+19)会被展开成 *(arr+19);

同理,利用上面的代码,对int arr[100]进行求和的时候,只需调用Sum<int,100>::sum(arr)即可。

这样做的好处是什么呢?最直观的好处是代码效率的提高,循环是程序效率的关键,提高循环处得效率往往是最有效的。那么为什么这样做的效率会提高呢?

1.for(int i=0; i<100; ++i)这段代码,隐含了100处的判断,100处得自加。如果本身循环内只是做简单的加法,那么for循环的附加运算比本身的求和运算还多了。毕竟本身只做一百次求和而已!

2.for循环中的代码难以并行化,循环中的代码通常是串行执行的。但如果是简单的直接加,则编译器能优化出有效的并行指令!

如果将上面的例子继续通用化,我们就得到一种基本的技巧——"unroll the loop",即解循环,将循环用普通代码表示。如果程序中循环满足

1.循环位置是常数,例如20,100等

2.循环中语句是可按照常量分解的,如a[2]+a[4]+a[6]+a[8]+...

3.常量数列你能找到递推方式,如2中可能是2*i那么循环是可解开的。

解开的方式是

template <int Dim,typename T>  
struct name{      
static T function(T 参数){   
return 参数操作语句 + Sum<Dim-1,T>::function(递推参数);   
};    
};  
template<typename T>  
struct name<1,T>{     
static T function(T 参数){       
return 参数操作语句;      
};    
};  


有闲心的朋友可以测试一下,这种方式和普通循环求和的效率差距,我自己做过测试,差距比想象中还大,但我自己一个人的机子不具有普遍说明意义,所有有空的朋友都可以考代码测试一下,欢迎贴结果在评论中!


这篇关于【程序语言】元编程带来的代码展开技巧的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/857097

相关文章

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

SpringBoot+RustFS 实现文件切片极速上传的实例代码

《SpringBoot+RustFS实现文件切片极速上传的实例代码》本文介绍利用SpringBoot和RustFS构建高性能文件切片上传系统,实现大文件秒传、断点续传和分片上传等功能,具有一定的参考... 目录一、为什么选择 RustFS + SpringBoot?二、环境准备与部署2.1 安装 RustF

MySQL的JDBC编程详解

《MySQL的JDBC编程详解》:本文主要介绍MySQL的JDBC编程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言一、前置知识1. 引入依赖2. 认识 url二、JDBC 操作流程1. JDBC 的写操作2. JDBC 的读操作总结前言本文介绍了mysq

Python实现Excel批量样式修改器(附完整代码)

《Python实现Excel批量样式修改器(附完整代码)》这篇文章主要为大家详细介绍了如何使用Python实现一个Excel批量样式修改器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录前言功能特性核心功能界面特性系统要求安装说明使用指南基本操作流程高级功能技术实现核心技术栈关键函

Redis实现高效内存管理的示例代码

《Redis实现高效内存管理的示例代码》Redis内存管理是其核心功能之一,为了高效地利用内存,Redis采用了多种技术和策略,如优化的数据结构、内存分配策略、内存回收、数据压缩等,下面就来详细的介绍... 目录1. 内存分配策略jemalloc 的使用2. 数据压缩和编码ziplist示例代码3. 优化的

Python 基于http.server模块实现简单http服务的代码举例

《Python基于http.server模块实现简单http服务的代码举例》Pythonhttp.server模块通过继承BaseHTTPRequestHandler处理HTTP请求,使用Threa... 目录测试环境代码实现相关介绍模块简介类及相关函数简介参考链接测试环境win11专业版python

Python从Word文档中提取图片并生成PPT的操作代码

《Python从Word文档中提取图片并生成PPT的操作代码》在日常办公场景中,我们经常需要从Word文档中提取图片,并将这些图片整理到PowerPoint幻灯片中,手动完成这一任务既耗时又容易出错,... 目录引言背景与需求解决方案概述代码解析代码核心逻辑说明总结引言在日常办公场景中,我们经常需要从 W

使用Spring Cache本地缓存示例代码

《使用SpringCache本地缓存示例代码》缓存是提高应用程序性能的重要手段,通过将频繁访问的数据存储在内存中,可以减少数据库访问次数,从而加速数据读取,:本文主要介绍使用SpringCac... 目录一、Spring Cache简介核心特点:二、基础配置1. 添加依赖2. 启用缓存3. 缓存配置方案方案

Java实现复杂查询优化的7个技巧小结

《Java实现复杂查询优化的7个技巧小结》在Java项目中,复杂查询是开发者面临的“硬骨头”,本文将通过7个实战技巧,结合代码示例和性能对比,手把手教你如何让复杂查询变得优雅,大家可以根据需求进行选择... 目录一、复杂查询的痛点:为何你的代码“又臭又长”1.1冗余变量与中间状态1.2重复查询与性能陷阱1.

Python内存优化的实战技巧分享

《Python内存优化的实战技巧分享》Python作为一门解释型语言,虽然在开发效率上有着显著优势,但在执行效率方面往往被诟病,然而,通过合理的内存优化策略,我们可以让Python程序的运行速度提升3... 目录前言python内存管理机制引用计数机制垃圾回收机制内存泄漏的常见原因1. 循环引用2. 全局变