关于十大排序算法联系和递进关系的思考

2023-10-31 01:30

本文主要是介绍关于十大排序算法联系和递进关系的思考,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

备战秋招面试,微信搜索公众号【TechGuide】关注更多新鲜好文和互联网大厂的笔经面经。
作者@TechGuide【全网同名】
点赞再看,养成习惯,您动动手指对原创作者意义非凡🤝

文章目录

  • 前言
  • 排序算法
    • 冒泡排序
    • 插入排序
    • 希尔排序
    • 选择排序
    • 堆排序
    • 归并排序
    • 快速排序
    • 表排序
    • 桶排序
    • 基数排序
  • 总结


前言

小规模的数字排序是一件很容易的事情,学过算数的小盆友都可以轻松应对。但是当数据规模达到一定量级时,如何快速高效的排序就变成了一个富有趣味性的挑战了,往往在大数据量的应用场景中,排序算法才能充分发挥它的威力。
在这里插入图片描述
以下内容将会尽全力深入浅出地探讨所有的排序算法。首先,需要明确以下几点:

  • 没有任何一种排序算法在所有情况下都是最优的。
  • 本文只探讨基于比较的排序,无论是字符或是数字,需要有比较规则。
  • 稳定性是指,任意两个相等的数据,排序前后的相对位置不变

排序算法

冒泡排序

每次比较相邻的两个元素,根据比较规则执行交换,每次最大或最小的会换到一边,问题规模由n变为n-1。
在这里插入图片描述
以上代码比较简单,这里给出三点说明:

  1. flag的作用是为了判断再一趟冒泡排序中是否发生了交换,如果无交换,说明已经排好顺序,就不需要再继续剩下的循环判断了,可以直接结束。
  2. 时间复杂度: 最好—O(N) 一开始就已经排好序了,遍历一遍即完成。
    最坏–O(N^2) 完全反序,两次嵌套循环。
  3. 优点在于可以适用于链表结构,且稳定。

插入排序

在这里插入图片描述
插入排序可以理解为抓牌打牌的过程,对于新到手的牌我们总是一一比较最后找到合适位置,插入即可。同样的道理,插入排序就是这一检验抽象来的排序算法。
在这里插入图片描述
时间复杂度和稳定性同冒泡排序。

总结以上两种排序算法,首先给出一个“逆序对”的概念,对于下标i<j,如果A[i] > A[j],则(i,j)即是一对逆序对(inversion)。所以,无论选择排序还是插入排序,都是要消除逆序对的,冒泡排序的一次交换相邻元素刚好消去一个逆序对。插入排序中,如果一个序列基本有序,那么插入排序简单且高效。得出一个重要结论:任何仅以交换两元素来排序的算法,其平均时间复杂度为 Ω ( N 2 ) \Omega(N^2) Ω(N2),所以要赶紧算法,每次交换要消除大于一个逆序对。

希尔排序

既然想要一次交换能够消除更多的逆序对,那么我们可以尝试把这个交换的两数的范围增大,这样是可能会一次消除多个逆序对,从而带来更好的算法时间复杂度的,而且保留插入排序的简单性。在这里插入图片描述
原始希尔排序可以通过以下代码理解。
在这里插入图片描述
核心就是对等间隔取的子序列进行插入排序,并且这个间隔会按照增量序列递减直到1为止,这样可以确保完全有效。但是这样的时间复杂度仍然不够理想,如何改进呢?

改进增量序列!

之前一直是取半,这里给出各种(稀奇古怪的增量序列,有兴趣的可以去看看源论文)改进:
在这里插入图片描述

选择排序

选择排序的伪代码如下所示,很容易理解:
在这里插入图片描述

堆排序

在这里插入图片描述
注意,最后一部分代码是把额外空间中的temp值赋回原数组。

归并排序

关于归并排序,要把握住一个核心,即有序子列的归并
在这里插入图片描述
比如上图中A子列和B子列归并为一个大的有序子列,则需要不断移动指针并比较,因为每个元素都要扫一次,所以时间复杂度为 O ( N ) O(N) O(N)
代码实现思路是,设定两个指针分别指向左右两个待排子序列,比较小的那个可以先移入存放结果的数组,并且指针右移,直到两子序列中有一个全部元素都被扫完,另一个子序列剩余的部分直接移入结果数组即可。注意,最后一步赋值回原数组的小技巧是从右往左赋值,想想为什么不从左往右呢?
伪代码如下: 在这里插入图片描述
下面的问题是如何实现上述这种归并思想呢?

  1. 不难想到,第一种可以利用分治+递归的算法实现,即把原数组不断切分,处理他的子问题,代码实现如下,注意这里调用了我们上面写好的Merge函数。
    在这里插入图片描述
    时间复杂度可以通过分治经典的递推式推导得到,应该是很符合预期的数字。
    在这里插入图片描述
    可以自己手动推导一下,加深记忆。
    在这里插入图片描述
    注意,任何情况下他在任何情况下都是O(NlgN),并且是稳定的。(为什么呢?结合上面代码思考一下。)

  2. 非递归算法如何实现呢?

思路是每次归并两个长度为length的子序列,length从1开始递增,直到归并成一个结果序列。
请结合下图思考一下他的时间复杂度是多少呢?
在这里插入图片描述
实际这张图有一定的误导性,正确的答案是 O ( N ) O(N) O(N),因为只需要开出两个长度为N的数组,并且来回赋值即可,仔细思考一下这个过程。
代码实现如下图:
在这里插入图片描述
归并排序对外的接口如下:


注意红框的部分,实际上就是实现了结果数组的空间和临时数组的空间来回利用的过程。

这里我们就有一个总体感觉了,哎呀,归并不错呀,它的最坏和平均复杂度都是 O ( N l g N ) O(NlgN) O(NlgN),而且还是稳定的,这不是完美的排序算法吗?但事实是这样吗?对了,他需要一个额外的空间,并且需要数组之间来回复制,所以在内排序中并不常用,多用在外排序。

快速排序

接下来,就是现在最常用、公认最快的排序算法了,没错,就是快排了,关于快速排序,我用对话形式写过一篇比较生动的文章,请大家移步这里。他的思路可以参考下图,这样感觉并不是很复杂,但是他的实现过程中很多值的选取是要十分注意的,一不留神,性能就会大打折扣,具体请看我的那篇关于快排的文章。
在这里插入图片描述
这里再总结一下注意点:

  1. 这种快排的最好情况是每次正好选到中间的数(中分),时间复杂度为 O ( N l g N ) O(NlgN) O(NlgN)
  2. 如何选主元?可以直接选第一个元素作为pivot吗?这样最坏情况是什么呢?在这里插入图片描述
    不出预料,效果爆炸。如何改进呢?
    没错,这个问题早就有一堆人思考过了,目前最常用的选主元方法是,取头、中、尾三个数的中位数作为主元。代码如下(思考一下,随机取数可以吗?)
    在这里插入图片描述
    思考以上代码最后两行,他的想法是既然知道了中间数比right小了,我何不把它直接放到right的前一位,这样可以省去后续头、尾两个元素比较的开销。
  3. 如何做好子集划分呢?

在这里插入图片描述
快排的原理这里不再赘述,但是它的核心,也是相较于插入排序的优势就在于,他每次主元每次插入(交换)的位置都是它最终的位置,不需要再移动了,同时,数组被划分为子集。
那么,思考一个细节问题,也是面试官常考察深度的问题。
“ 如 果 在 排 序 过 程 中 , 正 好 有 元 素 等 于 主 元 p i v o t , 应 该 如 何 处 理 呢 ? ” {\color{red}“如果在排序过程中,正好有元素等于主元pivot,应该如何处理呢?”} pivot
这时候无非两种选择,停下来交换,或者不理睬。
对于第一种方法,考虑极端情况,如果所有数字相等,则会有很多无用的比较交换,但是好处是可以使主元停在中间,时间复杂度可以达到 O ( N l g N ) O(NlgN) O(NlgN)
对于第二种方法,极端情况避免了无效交换,但是时间复杂度 O ( N 2 ) O(N^2) O(N2).所以,emmm。。你懂的,我们还是选择第一种好了。
快速排序的缺点就在于,他是使用递归的,递归在大规模数据是不够友好的,所以在规模充分小的时候,可以调用简单排序解决问题,比如选择排序。
最后给出代码:

在这里插入图片描述

注意,这里的cutoff就是你设置的应该使用选择排序的数据规模阈值,红框中是外部调用的接口。

表排序

思路是,不移动数据(key)本身,而是移动指针(table下标)的排序,是一种间接排序。
在这里插入图片描述

桶排序

仅仅以基于比较大小交换元素的排序,最坏时间复杂度是 O ( N l g N ) O(NlgN) O(NlgN)。所以能不能交换的同时,做点其他的事情呢?(姥姥美颜暴击【笑cry】)
在这里插入图片描述

基数排序

基数排序是桶排序的改进版。
在这里插入图片描述
P是指扫描次数,为lg(N)级别,如果桶数足够小,可以接近线性时间内排序。

总结

说明:
选择排序不稳定的原因是,跳着交换是可能让相等数序列颠倒的,举个简单的例子,就知道它是否稳定…例如:(7) 2 5 9 3 4 [7] 1…当我们利用直接选择排序算法进行排序时候,(7)和1调换,(7)就跑到了[7]的后面了,原来的次序改变了,这样就不稳定了.。
希尔排序的d取值取决于增量序列的选择。
堆排序和归并排序的平均和最坏都是 O ( N l g N ) O(NlgN) O(NlgN),但是归并的缺点是需要一个额外的数组空间“倒腾“数组,归并的优点是稳定。
快速排序是不稳定的(跳着交换嘛,不赘述了),但是因为是递归的,所以需要额外的堆栈空间。

在这里插入图片描述


说明:
以上所有图片来自于浙大数据结构公开课课件ppt,源地址

这篇关于关于十大排序算法联系和递进关系的思考的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/311879

相关文章

关于Java内存访问重排序的研究

《关于Java内存访问重排序的研究》文章主要介绍了重排序现象及其在多线程编程中的影响,包括内存可见性问题和Java内存模型中对重排序的规则... 目录什么是重排序重排序图解重排序实验as-if-serial语义内存访问重排序与内存可见性内存访问重排序与Java内存模型重排序示意表内存屏障内存屏障示意表Int

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

usaco 1.3 Mixing Milk (结构体排序 qsort) and hdu 2020(sort)

到了这题学会了结构体排序 于是回去修改了 1.2 milking cows 的算法~ 结构体排序核心: 1.结构体定义 struct Milk{int price;int milks;}milk[5000]; 2.自定义的比较函数,若返回值为正,qsort 函数判定a>b ;为负,a<b;为0,a==b; int milkcmp(const void *va,c

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

hdu 1285(拓扑排序)

题意: 给各个队间的胜负关系,让排名次,名词相同按从小到大排。 解析: 拓扑排序是应用于有向无回路图(Direct Acyclic Graph,简称DAG)上的一种排序方式,对一个有向无回路图进行拓扑排序后,所有的顶点形成一个序列,对所有边(u,v),满足u 在v 的前面。该序列说明了顶点表示的事件或状态发生的整体顺序。比较经典的是在工程活动上,某些工程完成后,另一些工程才能继续,此时