调整法建堆过程的优化

2024-05-08 18:58
文章标签 优化 过程 建堆 调整法

本文主要是介绍调整法建堆过程的优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!



        用调整法建堆,并在如下几个方面进行优化:(a)递归函数改成while循环;(b)减少比较次数;(c)减少交换次数;

源代码如下:

#include <string>
#include <fstream>
#include <stdlib.h>
#include <iostream>
#include <sys/time.h>
using namespace std;
#define MAX 10000000void readNum(int a[]){string filename;ifstream infile("data_1000w.txt", ios::in);string textline = "";int i = 0;while(getline(infile, textline, '\n')){a[i] = atoi(string(textline).c_str());//cout << textline << endl;i++;}infile.close();
}long getCurrentTime(){struct timeval tv;gettimeofday(&tv, NULL);return tv.tv_sec * 1000 + tv.tv_usec / 1000;
}int verify(int a[]){for(int i = 0; i < MAX - 1; i++){if(a[i] < a[i+1])return -1;}return 0;
}//原函数---------------------------------------------------void minHeapify(int a[], int heapsize, int index)
{int left = 2*index + 1;int right = 2*index + 2;int min = index;int tmp = -1;if(left < heapsize){if(a[min] > a[left]){min = left;}if(right < heapsize && a[min] > a[right]){min = right;}}if(min != index){tmp = a[min];a[min] = a[index];a[index] = tmp;minHeapify(a, heapsize, min);}
}int buildMinHeap_1(int a[], int length)
{int heapsize = length;if(heapsize < 2){return 0;}for(int i =heapsize/2 - 1; i >= 0; i--){minHeapify(a, heapsize, i);}return 1;
}void heapSort_1(int a[], int length){buildMinHeap_1(a,length);int tmp = -1;for(int i = length-1; i>=0; i--){tmp = a[0];a[0] = a[i];a[i] = tmp;minHeapify(a, i, 0);}
}//优化后的函数--------------------------------------------------void minHeapify_2(int a[], int length, int index)
{int left, right, min, tmp;while(2*index + 1 < length){left = 2*index + 1;right = 2*index + 2;min = index;if(left < length){if(a[min] > a[left]){min = left;}if(right < length && a[min] > a[right]){min = right;}}if(min != index){tmp = a[index];a[index] = a[min];a[min] = tmp;}else{break;}index = min;}
}void minHeapify_3(int a[], int length, int index)
{int child, tmp;while(2*index + 1 < length){child = 2*index + 1;if(child != length -1 && a[child+1] < a[child]){child++;}if(a[index] > a[child]){tmp = a[index];a[index] = a[child];a[child] = tmp;}else{break;}index = child;}
}void minHeapify_4(int a[], int length, int index)
{int child, tmp;tmp = a[index];while(2*index + 1 < length){child = 2*index + 1;if(child != length -1 && a[child+1] < a[child]){child++;}if(tmp > a[child]){a[index] = a[child];}else{break;}index = child;}a[index] = tmp;
}void heapSort_2(int a[], int length){int tmp = -1;for(int i = length/2 - 1; i >= 0; i--){minHeapify_2(a, length, i);}for(int i = length-1; i > 0; i--){tmp = a[0];a[0] = a[i];a[i] = tmp;minHeapify_2(a, i, 0);}
}void heapSort_3(int a[], int length){int tmp = -1;for(int i = length/2 - 1; i >= 0; i--){minHeapify_3(a, length, i);}for(int i = length-1; i > 0; i--){tmp = a[0];a[0] = a[i];a[i] = tmp;minHeapify_3(a, i, 0);}
}void heapSort_4(int a[], int length){int tmp = -1;for(int i = length/2 - 1; i >= 0; i--){minHeapify_4(a, length, i);}for(int i = length-1; i > 0; i--){tmp = a[0];a[0] = a[i];a[i] = tmp;minHeapify_4(a, i, 0);}
}//---------------------------------------------------main(){int a[MAX] = {0};int b[MAX] = {0};int c[MAX] = {0};int d[MAX] = {0};/*srand((unsigned)time(NULL));for(int i = 0; i < MAX; i++){a[i] = rand()%MAX;cout << a[i] << endl;}*/readNum(a);readNum(b);readNum(c);readNum(d);cout << "----1111-----" << endl;long time_1_1 = getCurrentTime();heapSort_1(a, MAX);long time_1_2 = getCurrentTime();cout << time_1_2 - time_1_1 << endl;int aa = verify(a);cout << aa << endl;	cout << "----2222-----" << endl;long time_2_1 = getCurrentTime();heapSort_2(b, MAX);long time_2_2 = getCurrentTime();cout << time_2_2 - time_2_1 << endl;int bb = verify(b);cout << bb << endl;	cout << "----3333-----" << endl;long time_3_1 = getCurrentTime();heapSort_3(c, MAX);long time_3_2 = getCurrentTime();cout << time_3_2 - time_3_1 << endl;int cc = verify(c);cout << cc << endl;	cout << "----4444-----" << endl;long time_4_1 = getCurrentTime();heapSort_4(d, MAX);long time_4_2 = getCurrentTime();cout << time_4_2 - time_4_1 << endl;int dd = verify(d);cout << dd << endl;	/*for(int k = 0; k < MAX; k++){cout << d[k] <<endl;}*/
}



        依次记录上述优化的幅度,结果如下图所示:1、2、3、4分别为原算法、递归函数改成while循环、减少比较次数、减少交换次数的运行时间(单位:毫秒)。两幅图分别为100w和1000w数据量的时间耗费。 

100万数据量:

改进后,相对于原函数的优化幅度分别为:8.1%、17.3%、27.6%。


1000万数据量:


改进后,相对于原函数的优化幅度分别为:5.6%、22.3%、30.4%。


        下面讨论为什么同样的程序,不同的数据规模,各种优化方案的优化幅度不一致,考虑两种情况:
         一方面这个可能和待排序的数据有关。由于原始数据是随机的,因此待排序的数据初始的状态是不确定的,它们的本身是否有序对排序有一定的影响。
        另一方面考虑排序算法本身的因素。排序过程比较耗费时间的主要有两个方面:一个是数据的比较、数据交换、递归过程(分配局部栈等开销)。下面从这三个方面进行分析:
        (1)首先,对于第一种优化,即把递归函数改为循环,堆调整函数minHeapify_2比minHeapify_1的改进就是将递归改成了循环,数据的比较次数、数据交换的次数都没有改变。在数据规模增大到10倍以后,数据比较次数、数据交换次数都以10log10的数量级增长,而且占总体时间复杂度的绝大部分;同时minHeapify_1递归过程的时间复杂度并没有同步上升。因此在表现上,将递归改写为循环的优化效果会随着数据规模的上升变得越来越不明显。
        (2)第二,对于第二种优化,即把递归函数改为循环,同时减少了比较次数。堆调整函数minHeapify_3比minHeapify_1的改进就是将递归改成了循环,同时减少了数据的比较次数(由5次减到三次,减少40%),但数据交换的次数没有改变。在数据规模增大到10倍以后,影响时间复杂度的三个因素中数据比较次数相对减少成为影响总体时间复杂度的最明显因素。因此在表现上,这种优化效果会随着数据规模的上升变得越来越明显。同时也说明了虽然单次数据比较比单次数据交换需要的时间少很多,但是在堆排序的问题中,数据比较的频次相当的多,因此在总体的时间消耗中也占据了很大的一部分。
        (3)第三,对于第三种优化,即把递归函数改为循环,同时减少了比较次数和交换次数。堆调整函数minHeapify_4比minHeapify_1的改进就是将递归改成了循环,同时减少了数据的比较次数(由5次减到三次,减少40%),数据交换的次数也大大减少。在数据规模增大到10倍以后,影响时间复杂度的三个因素在改进后的算法都进行了优化。在原函数的时间复杂度随着10log10增长时,优化后的算法时间复杂度并没有同步上升。因此在表现上,这种优化效果会随着数据规模的上升变得越来越明显。

这篇关于调整法建堆过程的优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/971161

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

浅析Spring Security认证过程

类图 为了方便理解Spring Security认证流程,特意画了如下的类图,包含相关的核心认证类 概述 核心验证器 AuthenticationManager 该对象提供了认证方法的入口,接收一个Authentiaton对象作为参数; public interface AuthenticationManager {Authentication authenticate(Authenti

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

作业提交过程之HDFSMapReduce

作业提交全过程详解 (1)作业提交 第1步:Client调用job.waitForCompletion方法,向整个集群提交MapReduce作业。 第2步:Client向RM申请一个作业id。 第3步:RM给Client返回该job资源的提交路径和作业id。 第4步:Client提交jar包、切片信息和配置文件到指定的资源提交路径。 第5步:Client提交完资源后,向RM申请运行MrAp

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

MySQL高性能优化规范

前言:      笔者最近上班途中突然想丰富下自己的数据库优化技能。于是在查阅了多篇文章后,总结出了这篇! 数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 临时库表必须以tmp_为前缀并以日期为后缀,备份

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

Solr 使用Facet分组过程中与分词的矛盾解决办法

对于一般查询而言  ,  分词和存储都是必要的  .  比如  CPU  类型  ”Intel  酷睿  2  双核  P7570”,  拆分成  ”Intel”,”  酷睿  ”,”P7570”  这样一些关键字并分别索引  ,  可能提供更好的搜索体验  .  但是如果将  CPU  作为 Facet  字段  ,  最好不进行分词  .  这样就造成了矛盾  ,  解决方法