本文主要是介绍【数据结构与算法】选择算法 selection,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
选择算法指的是解决选出序列中第n大的元素。比如中位数。
方法如下:
1.使用priorityqueue,维持size为k,如果queue的size小于k,则直接加入,否则看最小的元素能否比得过,比得过就剔除最小元素,加入新元素,比不过就看后面的元素,最后返回堆顶元素即可。这里需要使用最小堆。
public int findKthMax(int[] array, int k){PriorityQueue<Integer> minHeap = new PriorityQueue<>();for(int i : array){if(minHeap.size() < k)minHeap.add(i);else if(minHeap.peek() < i){minHeap.poll();minHeap.add(i);}}return minHeap.peek();}
2.快速选择,使用了快排中的partition思想,每一次划分都是On复杂度。思路是选择一个轴元素pivot,把数组做一次划分,pivot左边都是小的等于pivot的,右边是大于pivot的,然后看pivot的位置,如果就是a.length - k,说明,pivot右侧有k-1个元素,那么pivot就是第k大的元素,否则如果位置小于a.length - k,那么应该在左半边寻找,否则在右半边寻找。
写这个算法有一个小技巧,在初始化的时候就直接把第k大转换成数组的索引位置,后面的所有比较都是基于索引位置的而不是第几大,写起来更简单。
这个算法的最坏复杂度是On2,每一次都恰好分为了个数为1的一组。最好是Onlogn。《算法导论》中指出,如果采用随机算法,即partition的pivot是随机选择的,那么平均复杂度是Onlogn,注意这是平均,最坏仍然是On2。
那么如何实现随机化的partition,很简单,原本我们是默认选第一个元素为pivot的,这时只需要随机选一个元素作为第一个元素即可,即先做一次随机的交换。
代码:
public int findKthLargest(int[] nums, int k) {return findKthSmallest(nums, nums.length - k, 0, nums.length - 1);}public int findKthSmallest(int[] nums, int k, int start, int end) {if (start > end) {return -1;}int index = partition(nums, start, end);if (index == k){return nums[index];} else if (index < k) {return findKthSmallest(nums, k, index + 1, end);} else {return findKthSmallest(nums, k, start, index - 1);}}private int partition(int[] nums, int start, int end){if (start > end){return -1;}int pivot = nums[start];int last = start;for (int i = start + 1; i <= end; i++) {if (nums[i] <= pivot) {swap(nums, i, ++last);}}swap(nums, start, last);return last;}private void swap(int[] nums, int i, int j) {int tmp = nums[i];nums[i] = nums[j];nums[j] = tmp;}
3. BFPTR算法,该名称来自五个发明者的名字,是对上述快速选择的改进,主要是对最差情况的改进,优化pivot的选择。可以证明最差是On。
(1)先把array分为每组包含5个元素的组,最后一组可能不满;找出每一组的中位数,并且移动至array的前面,方便后续寻找;这一步是特殊的case,用一个插入排序就可以实现。
(2)找出中位数的中位数,这一步是一次递归地调用;
(3)得到pivot以后,按照pivot来partition;然后分3个case,类似于快速选择。
下面是一些别人的实现:
http://noalgo.info/466.html
时间复杂度分析:(1)步需要On;(2)步需要T(n/5);(3)考虑最坏情况,那么就是没有找到,需要递归到高位或者地位去寻找,相当于递归调用了一次BFPTR算法。那么我们需要得到递归地元素个数。假设中位数的中位数是x,那么有一半的组中,至少含有3个元素大于x,即1/2 * n/5 * 3 = 3/10 * n。那么至多有n-3/10 * n = 7/10 * n 元素是大于x的。同理至多有7/10 * n小于x的。因此这一步至多需要T(7/10*n)。要注意,这里中位数的中位数并不是中位数,所以不是2/n,即一分为二。那么,总的复杂度是On。可以把上述式子展开等比数列计算,或者使用主定理。
这篇关于【数据结构与算法】选择算法 selection的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!