算法回忆录——排序

2024-01-09 18:36
文章标签 算法 排序 回忆录

本文主要是介绍算法回忆录——排序,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 1. 插入排序
  • 2. 选择排序
  • 3. 冒泡排序
  • 4. 希尔排序
  • 5. 归并排序
  • 6. 快速排序
  • 7. 堆排序
  • 8. 计数排序
  • 9. 桶排序
  • 10. 基数排序

1. 插入排序

分为两个序列,前面一个序列是排好序的,后面一个序列是未排好的。未排好的序列的第一个元素(a)从后往前去和排好序的序列的元素(b)挨个比较。若a<b,就需将b往后移一位(需要提前用一个变量存储a的值)。然后继续比较,那么就会有两种情况:1. 比较到a>b时停止,此时a停留的下标就在b的后一个,也就是a要占据的位置。2. 比较到最后也没有比a小的b,此时a就应该占据该有序序列的第一个位置。

a = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]for i in range(1, len(a)):# i表示未排好的序列的第一个元素的下标# j表示已排好的序列的最后一个元素的下标j = i - 1# 开始将a[i]与已排好的序列进行比较while j >= 0:# 如果小于if a[i] < a[j]:# 下标减一继续往前比较j -= 1else:# 如果a[i] > a[j],则可以终止循环了break# 循环结束时的j表示a[i]>a[j]的那个j,所以a[i]要放入的位置应该在a[j]的后面# 或者说循环结束时一直没有找到比a[i]小的a[j],此时j为-1,应当放入最前面j += 1# 将a[i]存储起来b = a[i]# 然后将已排好的序列从j的位置开始,整体往后移一位for n in range(i, j, -1):a[n] = a[n - 1]# 最后再在j处放上a[i]a[j] = bprint(a)

改进:可以不用在找到插入位置的时候再挨个往后移,可以先将a[i]存储起来,在与排好的序列挨个比较时就开始往后移。

a = [21, 3, 10, 33, 9, 22, 34, 18, 26, 15, 100, 2, 11, 31, 100, 52]for i in range(0, len(a) - 1):# 排好序列的最后一个元素的下标end = i# 存储好当前未排元素wait = a[end + 1]# 将该未排元素开始依次从后往前与排好的元素比较while end >= 0:# 如果该未排元素小于当前已排好的元素,就将当前已排好元素往后移if wait < a[end]:a[end + 1] = a[end]end -= 1else:breaka[end + 1] = waitprint(a)

2. 选择排序

先找到最小的元素,与原序列第一个元素交换,然后再去排除第一个元素的序列中找到最小的,与原序列中第二个元素交换…

a = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]def select_sort(a, n):# 依次从未排序的序列中找到最小的元素的下标for i in range(n):pos = i# 用原序列第一个元素去跟剩下元素比较,找到最小的元素,然后记录下标for j in range(i + 1, n):if a[j] < a[pos]:pos = j# 此时已经找到最小元素的下标,与原序列第一个元素交换位置a[i], a[pos] = a[pos], a[i]return a
print(select_sort(a, len(a)))

3. 冒泡排序

冒泡排序就是将一个数与其它数挨个比较,在比较的过程中,始终是小的数在前面,大的数在后面,这样不断比较和交换,大的数就挨个排到后面去了。

a = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]def bubble_sort(a, n):for i in range(n):for j in range(n - 1):if a[j + 1] < a[j]:a[j], a[j + 1] = a[j + 1], a[j]return a
print(bubble_sort(a, len(a)))

4. 希尔排序

希尔排序也算是一种插入排序,不过它是按照某种规则进行分组后,在每个组内进行插入排序。

分组主要就是靠**“增量”**来划分。增量的取值又很多种,普遍简单的是以第一个增量为,数组长度的一半(向下取整),第二个增量取第一个增量的一半…最后一个增量一定是1。

那么是如何按照增量分组的呢?

如果以取半的方式来获得增量,那么有增量是多少,就分多少组。

image-20240107163348776

image-20240107163822321

image-20240107164058388

a = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]def hill_sort(a, n):# 先取增量为数组长度gap = n# 循环结束的条件,gap=1就是最后一次分组,此时gap/2=0,循环就结束了while gap > 0:# 每次gap取半gap = int(gap / 2)# 增量是多少就有几个组,所以我们需要对每个组进行插入排序for i in range(0, gap):# 对其中一组进行插入排序for j in range(i, n, gap):end = j# 这里需要判断下标是否超出了原数组的长度,其它的操作都是和插入排序一样的if end + gap >= n:breakwait = a[end + gap]while end >= 0:if wait < a[end]:a[end + gap] = a[end]end -= gapelse:breaka[end + gap] = waitreturn aprint(hill_sort(a, len(a)))

下面的代码少了一个循环,就是单独都每个组进行插入排序的那个循环。

a = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]def hill_sort(a, n):gap = nwhile gap > 0:gap = int(gap / 2)for i in range(0, n):end = iif end + gap >= n:continuewait = a[end + gap]while end >= 0:if wait < a[end]:a[end + gap] = a[end]end -= gapelse:breaka[end + gap] = waitreturn aprint(hill_sort(a, len(a)))

5. 归并排序

归并排序采用分治策略,即将一个序列拆分成许多小序列进行排序,就是将排好序的小序列合起来再进行排序。

在这里插入图片描述

有两种实现方式:递归和迭代

  • 递归:实现递归的时候不要多想,假设递归一次就成功。
a = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]def merge_sort(a):# 数组长度n = len(a)# 递归终止条件。当数组不断被拆分,直至只剩一个元素时,递归就终止,开始一层一层地从里往外计算。if n <= 1:return a# 向下取整,如果数组是奇数大小,那么左边部分一定比右边部分小1mid = int(n / 2)# 拆分后将左边和右边部分分别进行递归# 其实就只有这里需要递归,所以这里写好后就不要去考虑一层一层嵌套的问题了left = merge_sort(a[:mid])right = merge_sort(a[mid:])# 用来存放“治”后的数组,也就是将两个数组中的元素按从小到大的顺序依次放入sort中sort = []i, j = len(left), len(right)# 这里是假设两个数组都有元素的情况,若其中一个数组元素被弹完了,循环终止while i and j:if left[0] <= right[0]:# 将小的一个添加到sort数组中sort.append(left[0])# 并将这个元素从原数组中弹出left.pop(0)i -= 1else:sort.append(right[0])right.pop(0)j -= 1# 当上面循环结束后只有两种情况:# 1. 两个数组元素都弹完# 2. 一个数组弹完,剩下一个数组未弹完# 那么我就需要将未弹完元素的数组弹尽,同时挨个添加到sort数组中while i:sort.append(left[0])left.pop(0)i -= 1while j:sort.append(right[0])right.pop(0)j -= 1return sortprint(merge_sort(a))
  • 迭代(不会,2024.1.7)

6. 快速排序

快速排序跟冒泡排序很像,都是通过交换两元素位置来排序的。

快速排序需要一个基准元素(通常取数组的第一个元素)和left、right两个左右指针。它就是通过不断将元素与基准元素比较,比基准元素小就放在它的左边,比基准元素大就放在它的右边,然后再让基准元素左边那一段和右边那一段分别进行递归。

left指针一定指向的是数组的左边界(不一定是0)

right指针一定指向的是数组的有边界(不一定是数组的长度-1)

步骤:

  • 判断递归结束的条件
  • 用i和j来代替left和right,边界是固定的,是为了继续向下递归
  • 定义基准元素
  • 开始执行循环比较:
    • 若右指针指向的元素>=基准元素:右指针左移
    • 若右指针指向的元素<=基准元素:右指针指向的元素和左指针指向的元素交换
    • 若左指针指向的元素<=基准元素:左指针右移
    • 若左指针指向的元素>=基准元素:左指针指向的元素和右指针指向的元素交换
arr = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]def quick_sort(arr, left, right):# 递归结束条件if left >= right:return# 用i和j分别作为左、右指针来进行移动过# 不能直接用left和right来当作指针,它们是用来当作边界的# left用来规定一段递归的起点,right用来规定另一段递归的终点i = leftj = right# 基准数base = arr[i]# 当左指针始终小于右指针的时候,不断地移动指针和交换指针所指向的元素while i < j:# 如果右指针指向的元素>基准数,右指针左移while i < j and arr[j] >= base:j -= 1# 当上面循环结束时,表示右指针指向的元素小于基准数,将右指针指向的元素与左指针指向的元素交换(只是元素交换位置)arr[j], arr[i] = arr[i], arr[j]# 如果左指针指向的元素<基准数,左指针右移while i < j and arr[i] <= base:i += 1# 当上面循环结束时,表示左指针指向的元素大于基准数,将左指针指向的元素与右指针指向的元素交换arr[i], arr[j] = arr[j], arr[i]# 当上面循环结束后,左指针和右指针一定是相等的quick_sort(arr, left, i - 1)quick_sort(arr, i + 1, right)quick_sort(arr, 0, len(arr) - 1)
print(arr)

7. 堆排序

堆排序本质上还是对数组排序,只是将数组中的元素按树结构的方式排序。

堆本质上也是一棵二叉树。分为大顶堆和小顶堆。大顶堆就是每个根节点的值一定大于等于其左右子节点的值,小顶堆类同。

如何将数组排列成一个堆?

  • 将数组元素依次从上到下,从左到右排列

堆排序一共分为两大步:

  • 将数组排列成一个大顶堆,其中每个根节点都应该满足大顶堆的要求
  • 将堆顶元素与堆中最后一个元素交换,然后将最后一个元素排除在堆外,再重新对这个堆进行大顶堆化。直到排除掉最后一个元素为止

避坑:

  • 最后一个非叶子节点一定是处于length / 2 - 1的位置,它前面的节点也一定有子节点
代码参考:
https://www.hello-algo.com/chapter_sorting/heap_sort/#1171
https://zq99299.github.io/dsalg-tutorial/dsalg-java-hsp/11/01.html#%E5%AE%8C%E6%95%B4%E5%AE%9E%E7%8E%B0
arr = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]# 调整堆结构(保持大顶堆)
def adjust_heap(arr, pos, length):"""Args:arr: 要调整的堆(数组)pos: 调整的起始位置(非叶子节点)如果是创建大顶堆,则pos表示的是最下层最右边的那个非叶子节点length: 堆的长度- 如果是创建堆,则length不变- 如果是将根节点元素与堆尾元素交换,则每执行一次length-1Returns:"""while True:# 左子节点的位置l = pos * 2 + 1# 右子节点的位置r = pos * 2 + 2# max表示值最大的节点的位置,在调整之前,假定是根节点的位置max = pos# 如果左子节点的位置(下标)在堆长度范围内且左子节点元素的值大于它的父节点的值if l < length and arr[l] > arr[max]:# max表示的就是左子节点的位置(值更大元素的位置)max = l# 如果右子节点的位置在堆长度范围内且右子节点元素的值大于它的父节点的值if r < length and arr[r] > arr[max]:# max表示的就是右子节点的位置max = r# 如果左右子节点都不大于根节点,max就表示的是根节点的位置,而pos始终都表示根节点的位置,此时就退出循环if max == pos:break# 如果左右子节点有一个大于根节点,则交换两个元素arr[pos], arr[max] = arr[max], arr[pos]# 然后又将交换的那个子节点作为根节点,对它下面的堆继续调整# 因为如果该子节点也是一个堆,它是堆中最大的元素# 但当它的父节点比它小,从而它和父节点交换,此时它的值在它的堆中就不一定是最大的# 另一个子节点自然不用考虑,它肯定是它堆中最大的pos = maxdef heap_sort(arr):# 将数组创建为一个大顶堆for i in range(int(len(arr) / 2) - 1, -1, -1):adjust_heap(arr, i, len(arr))# 交换堆顶元素与堆最后一个元素,然后将最后一个元素排除堆# 将交换后的堆又调整成为一个大顶堆for i in range(len(arr) - 1, 0, -1):arr[0], arr[i] = arr[i], arr[0]adjust_heap(arr, 0, i)heap_sort(arr)
print(arr)

8. 计数排序

计数排序顾名思义就是通过计算arr数组中元素的出现次数来进行排序。

需要额外一个数组来计算arr数组中元素的出现次数。

计数数组的长度为arr数组中最大值(max)-最小值(min)+1。

计数数组的下标区间:[0, max-min+1),当下标区间都加上一个min后:[min, max+1)

右边是开区间是因为数组长度为max-min+1,而数组的下标是从0开始的。

arr = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]def counting_sort(arr):# 先获取数组中的最大值和最小值min = arr[0]max = arr[0]for i in range(1, len(arr)):if arr[i] <= min:min = arr[i]if arr[i] >= max:max = arr[i]# 计数用的数组,数组的大小为arr中最大值-最小值+1,该数组的下标就用来表示min到max之间的数counter = [0] * (max - min + 1)# 统计arr数组中每个元素出现的次数for i in range(len(arr)):# counter的下标相当于在一个区间[0, max-min+1],当它的下标加上一个min就表示[min,max]之间的所有数# max-min“+1”是因为下标是从0开始的counter[arr[i] - min] += 1# n用来表示arr中元素的下标n = 0for j in range(len(counter)):# counter数组中的值,就表示它的下标加上min的值这个数出现的次数while counter[j] != 0:arr[n] = j + mincounter[j] -= 1n += 1counting_sort(arr)
print(arr)

9. 桶排序

桶排序就是先确定几个桶,然后将数组中的元素按照某种规则放入桶中,分别对每个桶中的元素进行排序,然后再依次从第一个桶开始将元素拿出来。(后一个桶中的元素的值一定大于前一个桶中元素的值)。

  • 一个桶放几个元素(bucketSize):人为规定或使用默认值
  • 桶数量的确定(bukcetNum):arr数组中的(max - min + 1)/ bucketSize
  • 确定元素放入哪个桶:bucket[(arr[i] - min) / bucketSize]
arr = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]def bucket_sort(arr, bucketSize=5):"""Args:arr:bucketSize: 每个桶的容量Returns:"""# 找出arr数组中最大值和最小值max = arr[0]min = arr[0]for i in range(len(arr)):if max < arr[i]:max = arr[i]if min > arr[i]:min = arr[i]# 区间【min,max】一共有max-min+1个数,一个桶装bucketSize个数,所以相除就得到了桶的数量# 最后再加个1是防止前面被除数小于除数,结果就为0个桶,显然是不行的bucketNum = int((max - min + 1) / bucketSize + 1)# 初始化桶bucket = []for j in range(bucketNum):bucket.append([])# 将arr数组中的元素按照范围放入桶中# 可以看到前面桶的数量的定义,要确定放入哪个桶,(arr[i]-min)/bucketSize就能确定桶号for k in range(len(arr)):bucket[int((arr[k] - min) / bucketSize)].append(arr[k])# 桶内进行排序,各种排序方式都行for i in range(len(bucket)):# 这里使用的是前面的快速排序quick_sort(bucket[i], 0, len(bucket[i]) - 1)# 将桶内元素排完序后,从第一个桶开始,依次将桶内元素替换掉arr数组中的元素n = 0for i in range(len(bucket)):if bucket[i]:for j in range(len(bucket[i])):arr[n] = bucket[i][j]n += 1bucket_sort(arr)
print(arr)

10. 基数排序

基数排序是桶排序的拓展,假如排序的数是十进制的,那么每一个数的每一位有10种表示,那么就创建10个桶。

从个位开始,每个数的个位是多少,就放入哪个桶。全部放完后再从第一个桶开始取出来挨个放入原数组,先放进去的先取。

然后从十位开始…

当排序到最后一轮的时候,再取出来放入原数组,这时原数组就有序了。

arr = [21,3,10,33,9,22,34,18,26,15,100,2,11,31,52]def radix_sort(arr):# 找出arr数组中最大的元素max = arr[0]for i in range(len(arr)):if max < arr[i]:max = arr[i]# 得到它的位数sortNum = len(str(max))# 因为是十进制的排序,所以十个桶就行了bucketNum = 10# 初始化桶bucket = []for i in range(bucketNum):bucket.append([])# n是用来辅助求得个位上的数,例如123 / n % 10 = 3      int(123 / (n * 10)) % 10 = 2....n = 1# 最大元素有几位就要进行几次排序for i in range(sortNum):# 初始化桶的计数数组,记录每个桶有多少个元素counter = [0 for j in range(bucketNum)]# 将元素按照它们个位个位、十位等等的数分别放入桶中for k in range(len(arr)):# 得到个位或十位等等上的数d = int(arr[k] / n) % 10# 放入相应的桶中bucket[d].append(arr[k])# 放入一个就加1counter[d] += 1# 指示arr数组元素的位置index = 0# 开始依次将每个桶中的元素取出,从第一个桶开始,先放进去的先出来for m in range(len(counter)):while counter[m] != 0:arr[index] = bucket[m].pop(0)index += 1counter[m] -= 1# 这里一定要记得n *= 10
radix_sort(arr)
print(arr)

这篇关于算法回忆录——排序的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/588053

相关文章

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

Python中lambda排序的六种方法

《Python中lambda排序的六种方法》本文主要介绍了Python中使用lambda函数进行排序的六种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录1.对单个变量进行排序2. 对多个变量进行排序3. 降序排列4. 单独降序1.对单个变量进行排序

关于Java内存访问重排序的研究

《关于Java内存访问重排序的研究》文章主要介绍了重排序现象及其在多线程编程中的影响,包括内存可见性问题和Java内存模型中对重排序的规则... 目录什么是重排序重排序图解重排序实验as-if-serial语义内存访问重排序与内存可见性内存访问重排序与Java内存模型重排序示意表内存屏障内存屏障示意表Int

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

usaco 1.3 Mixing Milk (结构体排序 qsort) and hdu 2020(sort)

到了这题学会了结构体排序 于是回去修改了 1.2 milking cows 的算法~ 结构体排序核心: 1.结构体定义 struct Milk{int price;int milks;}milk[5000]; 2.自定义的比较函数,若返回值为正,qsort 函数判定a>b ;为负,a<b;为0,a==b; int milkcmp(const void *va,c

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO