《算法导论》学习之关于如何利用排序算法,从1亿个数中,选出最大(小)的100个数

2024-05-16 00:18

本文主要是介绍《算法导论》学习之关于如何利用排序算法,从1亿个数中,选出最大(小)的100个数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先声明:本文内容是参考别人的博客,链接为:http://blog.csdn.net/beiyeqingteng/article/details/7534489

前言:

刚刚在CSDN上看到一个网友利用最小堆实现 “ 获取一亿数据获取前100个最大值” 。原帖请看:http://blog.csdn.net/yjflinchong/article/details/7533972。 然后自己利用quicksort的原理也写了一个程序来解决那个问题。通过测试,基于quicksort原理的方法平均运行时间是1.264秒,基于最小堆方法的平均运行时间是0.288秒 (网友写的程序运行时间比我的大很多,0.288秒这个程序是我自己写的,如果测试网友写的基于minHeap的方法,运行时间是2.501秒)。基于最小堆方法运行时间很稳定(每次运行时间相差很小),基于quicksort原理的方法运行时间不稳定(每次运行时间相差大)。

基于quicksort实现的原理如下:

1. 假设数组为 array[N] (N = 1 亿),首先利用quicksort的原理把array分成两个部分,左边部分比 array[N - 1] (array中的最后一个值,即pivot) 大, 右边部分比pivot 小。然后,可以得到 array[array.length - 1] (即 pivot) 在整个数组中的位置,假设是 k.
2. 如果 k 比 99 大,我们在数组[0, k - 1]里找前 100 最大值。 (继续递归)
3. 如果 k 比 99 小, 我们在数组[k + 1, ..., N ]里找前 100 - (k + 1) 最大值。(继续递归)
4. 如果 k == 99, 那么数组的前 100 个值一定是最大的。(退出)

代码如下:

[java]  view plain copy
  1. public class TopHundredQuickSort {  
  2.       
  3.     public void tophundred(int[] array, int start, int end, int k) {  
  4.           
  5.         int switchPointer = start;  
  6.         int pivot = array[end]; //array最后一个值作为pivot  
  7.         for (int i = start; i < end; i++) {  
  8.             if (array[i] >= pivot) {  
  9.                 swap(array, switchPointer, i);  
  10.                 switchPointer++;  
  11.             }  
  12.         }  
  13.         swap(array, end, switchPointer);//交换后,array左边的值比pivot大,右边的值比pivot小  
  14.           
  15.         if (switchPointer < k - 1) {  
  16.             tophundred(array, switchPointer + 1, end, k);  
  17.         } else if (switchPointer == k - 1) {  
  18.             return;  
  19.         } else {  
  20.             tophundred(array, 0, switchPointer - 1, k);  
  21.         }  
  22.     }  
  23.       
  24.     public void swap(int[] array, int i, int j) {  
  25.         int temp = array[i];  
  26.         array[i] = array[j];  
  27.         array[j] = temp;          
  28.     }  
  29.       
  30.     public static void main(String[] args) {  
  31.           
  32.         // the size of the array  
  33.         int number = 100000000;  
  34.         // the top k values  
  35.         int k = 100;  
  36.         // the range of the values in the array  
  37.         int range = 1000000001;  
  38.   
  39.         //input for minHeap based method  
  40.         int[] array = new int[number];  
  41.           
  42.         Random random = new Random();  
  43.         for (int i = 0; i < number; i++) {  
  44.             array[i] = random.nextInt(range);  
  45.         }  
  46.           
  47.         TopHundredQuickSort topHundred = new TopHundredQuickSort();  
  48.           
  49.         //start time  
  50.         long t1 = System.currentTimeMillis();   
  51.         topHundred.tophundred(array, 0, array.length - 1, k);  
  52.         //end time  
  53.         long t2 = System.currentTimeMillis();   
  54.           
  55.         System.out.println("The total execution time " +  
  56.                 "of quicksort based method is " + (t2 - t1) +" millisecond!");  
  57.           
  58.         // print out the top k largest values in the top array  
  59.         System.out.println("The top "+ k + "largest values are:");  
  60.         for (int i = 0; i < k; i++) {  
  61.             System.out.println(array[i]);  
  62.         }  
  63.                   
  64.     }  
  65. }  

下面是基于minHeap写的程序。如果你懂heap sort,那么下面的程序很容易理解。

[java]  view plain copy
  1. public class TopHundredHeap {  
  2.       
  3.     public static void main(String[] args) {  
  4.         // the size of the array  
  5.         int number = 100000000;  
  6.         // the top k values  
  7.         int k = 100;  
  8.         // the range of the values in the array  
  9.         int range = 1000000001;  
  10.   
  11.         //input for minHeap based method  
  12.         int[] array = new int[number];  
  13.           
  14.         Random random = new Random();  
  15.         for (int i = 0; i < number; i++) {  
  16.             array[i] = random.nextInt(range);  
  17.         }  
  18.           
  19.         TopHundredHeap thh = new TopHundredHeap();  
  20.           
  21.         long t1, t2;  
  22.         //start time  
  23.         t1 = System.currentTimeMillis();   
  24.         int[] top = thh.topHundred(array, k);  
  25.           
  26.         //end time  
  27.         t2 = System.currentTimeMillis();   
  28.         System.out.println("The total execution time of " +  
  29.                 "quicksort based method is " + (t2 - t1) +" millisecond!");  
  30.           
  31.         // print out the top k largest values in the top array  
  32.         System.out.println("The top "+ k + "largest values are:");  
  33.         for (int i = 0; i < k; i++) {  
  34.             System.out.println(top[i]);  
  35.         }  
  36.     }  
  37.       
  38.     public int[] topHundred(int[] array, int k) {  
  39.         // the heap with size k  
  40.         int[] top = new int[k];  
  41.           
  42.         for (int i = 0; i < k; i++) {  
  43.             top[i] = array[i];  
  44.         }  
  45.           
  46.         buildMinHeap(top);  
  47.           
  48.         for (int i = k; i < array.length; i++) {  
  49.             if (top[0] < array[i]) {  
  50.                 top[0] = array[i];  
  51.                 minHeapify(top, 0, top.length);  
  52.             }  
  53.         }  
  54.           
  55.         return top;  
  56.     }  
  57.       
  58.     // create a min heap  
  59.     public void buildMinHeap(int[] array) {  
  60.         int heapSize = array.length;  
  61.         for (int i = array.length / 2 - 1; i >= 0; i--) {  
  62.             minHeapify(array, i, heapSize);  
  63.         }  
  64.     }  
  65.       
  66.      /// MinHeapify is to build the min heap from the 'position'  
  67.     public void minHeapify(int[] array, int position, int heapSize)  
  68.     {  
  69.         int left = left(position);  
  70.         int right = right(position);  
  71.         int maxPosition = position;  
  72.           
  73.         if (left < heapSize && array[left] < array[position]) {  
  74.             maxPosition = left;  
  75.         }  
  76.           
  77.         if (right < heapSize && array[right] < array[maxPosition]) {  
  78.             maxPosition = right;  
  79.         }  
  80.           
  81.         if (position != maxPosition) {  
  82.             swap(array, position, maxPosition);  
  83.             minHeapify(array, maxPosition, heapSize);  
  84.         }  
  85.     }  
  86.       
  87.     public void swap(int[] array, int i, int j) {  
  88.         int temp = array[i];  
  89.         array[i] = array[j];  
  90.         array[j] = temp;          
  91.     }  
  92.       
  93.     /// return the left child position  
  94.     public int left(int i)  
  95.     {  
  96.         return 2 * i + 1;  
  97.     }  
  98.     /// return the right child position  
  99.     public int right(int i)  
  100.     {  
  101.         return 2 * i + 2;  
  102.     }   
  103. }  
时间复杂度分析:

基于minheap方法 的时间复杂度是 O(lg K * N), 基于quicksort 方法的平均时间复杂度是 O(N),但是最差是O(N^2). 这也是为何基于quicksort 方法它的时间不稳定的原因。


这篇关于《算法导论》学习之关于如何利用排序算法,从1亿个数中,选出最大(小)的100个数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/993329

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

spoj705( 求不相同的子串个数)

题意:求串s的不同子串的个数 解题思路:任何子串都是某个后缀的前缀,对n个后缀排序,求某个后缀的前缀的个数,减去height[i](第i个后缀与第i-1 个后缀有相同的height[i]个前缀)。 代码如下: #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstrin