【数据结构与算法】选择算法 selection

2024-05-24 22:08

本文主要是介绍【数据结构与算法】选择算法 selection,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

选择算法指的是解决选出序列中第n大的元素。比如中位数。

方法如下:

1.使用priorityqueue,维持size为k,如果queue的size小于k,则直接加入,否则看最小的元素能否比得过,比得过就剔除最小元素,加入新元素,比不过就看后面的元素,最后返回堆顶元素即可。这里需要使用最小堆。

 

public int findKthMax(int[] array, int k){PriorityQueue<Integer> minHeap = new PriorityQueue<>();for(int i : array){if(minHeap.size() < k)minHeap.add(i);else if(minHeap.peek() < i){minHeap.poll();minHeap.add(i);}}return minHeap.peek();}

 

2.快速选择,使用了快排中的partition思想,每一次划分都是On复杂度。思路是选择一个轴元素pivot,把数组做一次划分,pivot左边都是小的等于pivot的,右边是大于pivot的,然后看pivot的位置,如果就是a.length - k,说明,pivot右侧有k-1个元素,那么pivot就是第k大的元素,否则如果位置小于a.length - k,那么应该在左半边寻找,否则在右半边寻找。

写这个算法有一个小技巧,在初始化的时候就直接把第k大转换成数组的索引位置,后面的所有比较都是基于索引位置的而不是第几大,写起来更简单。

这个算法的最坏复杂度是On2,每一次都恰好分为了个数为1的一组。最好是Onlogn。《算法导论》中指出,如果采用随机算法,即partition的pivot是随机选择的,那么平均复杂度是Onlogn,注意这是平均,最坏仍然是On2。

那么如何实现随机化的partition,很简单,原本我们是默认选第一个元素为pivot的,这时只需要随机选一个元素作为第一个元素即可,即先做一次随机的交换。

代码:

public int findKthLargest(int[] nums, int k) {return findKthSmallest(nums, nums.length - k, 0, nums.length - 1);}public int findKthSmallest(int[] nums, int k, int start, int end) {if (start > end) {return -1;}int index = partition(nums, start, end);if (index == k){return nums[index];} else if (index < k) {return findKthSmallest(nums, k, index + 1, end);} else {return findKthSmallest(nums, k, start, index - 1);}}private int partition(int[] nums, int start, int end){if (start > end){return -1;}int pivot = nums[start];int last = start;for (int i = start + 1; i <= end; i++) {if (nums[i] <= pivot) {swap(nums, i, ++last);}}swap(nums, start, last);return last;}private void swap(int[] nums, int i, int j) {int tmp = nums[i];nums[i] = nums[j];nums[j] = tmp;}

 

3. BFPTR算法,该名称来自五个发明者的名字,是对上述快速选择的改进,主要是对最差情况的改进,优化pivot的选择。可以证明最差是On。

 

(1)先把array分为每组包含5个元素的组,最后一组可能不满;找出每一组的中位数,并且移动至array的前面,方便后续寻找;这一步是特殊的case,用一个插入排序就可以实现。

(2)找出中位数的中位数,这一步是一次递归地调用;

(3)得到pivot以后,按照pivot来partition;然后分3个case,类似于快速选择。

下面是一些别人的实现:

http://noalgo.info/466.html

时间复杂度分析:(1)步需要On;(2)步需要T(n/5);(3)考虑最坏情况,那么就是没有找到,需要递归到高位或者地位去寻找,相当于递归调用了一次BFPTR算法。那么我们需要得到递归地元素个数。假设中位数的中位数是x,那么有一半的组中,至少含有3个元素大于x,即1/2 * n/5 * 3 = 3/10 * n。那么至多有n-3/10 * n = 7/10 * n 元素是大于x的。同理至多有7/10 * n小于x的。因此这一步至多需要T(7/10*n)。要注意,这里中位数的中位数并不是中位数,所以不是2/n,即一分为二。那么,总的复杂度是On。可以把上述式子展开等比数列计算,或者使用主定理。

 

 

这篇关于【数据结构与算法】选择算法 selection的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/999665

相关文章

Go语言中三种容器类型的数据结构详解

《Go语言中三种容器类型的数据结构详解》在Go语言中,有三种主要的容器类型用于存储和操作集合数据:本文主要介绍三者的使用与区别,感兴趣的小伙伴可以跟随小编一起学习一下... 目录基本概念1. 数组(Array)2. 切片(Slice)3. 映射(Map)对比总结注意事项基本概念在 Go 语言中,有三种主要

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

Python 中 requests 与 aiohttp 在实际项目中的选择策略详解

《Python中requests与aiohttp在实际项目中的选择策略详解》本文主要介绍了Python爬虫开发中常用的两个库requests和aiohttp的使用方法及其区别,通过实际项目案... 目录一、requests 库二、aiohttp 库三、requests 和 aiohttp 的比较四、requ

el-select下拉选择缓存的实现

《el-select下拉选择缓存的实现》本文主要介绍了在使用el-select实现下拉选择缓存时遇到的问题及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录项目场景:问题描述解决方案:项目场景:从左侧列表中选取字段填入右侧下拉多选框,用户可以对右侧

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

如何选择适合孤独症兄妹的学校?

在探索适合孤独症儿童教育的道路上,每一位家长都面临着前所未有的挑战与抉择。当这份责任落在拥有孤独症兄妹的家庭肩上时,选择一所能够同时满足两个孩子特殊需求的学校,更显得尤为关键。本文将探讨如何为这样的家庭做出明智的选择,并介绍星贝育园自闭症儿童寄宿制学校作为一个值得考虑的选项。 理解孤独症儿童的独特性 孤独症,这一复杂的神经发育障碍,影响着儿童的社交互动、沟通能力以及行为模式。对于拥有孤独症兄

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig