麻省理工公开课算法导论(二):Insertion Sort and Merge Sort

2023-12-20 05:59

本文主要是介绍麻省理工公开课算法导论(二):Insertion Sort and Merge Sort,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • Introduction
  • Insertion Sort and Merge Sort
    • Why Sorting?
    • Insertion Sort
    • Binary Insertion Sort
    • Merge Sort
    • Code Implements
  • Summary

Introduction

本篇来自于笔者学习MIT的公开课算法导论的学习笔记,仅仅是我个人接受课程教育后,进行的学习笔记,可能理解并不到位,仅供参考。

课程视频地址:
Lecture 3: Insertion Sort and Merge Sort

Insertion Sort and Merge Sort

Why Sorting?

首先让我们思考一个问题,为什么我们需要排序?

在日常生活中的很多场景,例如管理MP3的歌曲列表、维护手机通讯录等等,针对这些场景,排序可以将问题变得更加的简单。

Insertion Sort

接下来我们介绍一种排序算法,叫做插入排序(Insertion Sort)

假定给定有序数组A[1…j-1],我们希望将元素A[j]插入有序数组数组中,如下图:

simple insert sort

当然,这是非常理想的情况,我们只需要遍历数组,通过前后元素大小比较,找到A[j]应该插入到的位置,在该种情况下,时间复杂度为O(n)

但是情况往往不可能会这么好,假定给定数组A[1…j-1],其中元素是乱序,我们希望将元素A[j]插入有序数组数组中,如下图:

unsorted array

最简单的思路,我们随机选定一个位置的元素,然后进行两两比较,比较前后元素的大小,如果前面元素大于自身,那么将前面的元素与自身交换,以此类推:

unsorted array
unsorted array

unsorted array

unsorted array

unsorted array
unsorted array

unsorted array
unsorted array
unsorted array

这就是最基本的插入排序算法,但是我们可以看出来,这种方式是非常的“看运气”,时间复杂度取决于原有的数组的元素排列顺序,时间复杂度非常不稳定,最差时间复杂度为T = O( n 2 n ^ 2 n2) + O( n 2 n ^ 2 n2),需要 n 2 n ^ 2 n2次比较和 n 2 n ^ 2 n2次交换。
插入算法时间复杂度
OK,这显然并不是一个非常棒的解决方案,那么是否可以对其进行优化呢,答案是可以的。

Binary Insertion Sort

二分法查找是一个非常经典的查找算法,我们在上一章中也介绍过二分法查找,该种算法的时间复杂度为O( log ⁡ 2 ( n ) \log_2(n) log2(n)),我们可以尝试将二分法查找引入插入排序算法,即二分插入排序。

结合上面的步骤,插入排序算法中需要将被插入元素与其他元素进行比较,需要 n 2 n ^ 2 n2次比较,我们可以将该步操作改为二分法,即需要 log ⁡ 2 ( n ) \log_2(n) log2(n)次比较, n 2 n ^ 2 n2次交换。

因此二分查找算法的时间复杂度为T = O( log ⁡ 2 ( n ) \log_2(n) log2(n)) + O( n 2 n ^ 2 n2),需要 log ⁡ 2 ( n ) \log_2(n) log2(n)次比较和 n 2 n ^ 2 n2次交换。
二分插入算法时间复杂度
引入二分法后,我们取得了一定的性能提升,但是这仍不是一个特别出色性能的算法,我们希望寻找一个O( log ⁡ 2 ( n ) \log_2(n) log2(n))的排序算法来解决排序问题。

Merge Sort

我们延续上面的思路,引入二分法查找是一个正确的选择,那么在此之上,我们再进一步,同时加入递归方法,这就是归并排序(Merge Sort)

merge sort

归并排序思想如下:

给定数组A[1…n],那么:

1、如果n = 1,结束;

2、否则,以数组中点为界分割成两个数组,递归排序A[1…n/2]与A[n/2 + 1…n];

3、合并两个排序好的数组。
merge sort
排序示意图如下:
merge sort
merge sort
merge sort
merge sort
merge sort
merge sort
merge sort
merge sort
merge sort
merge sort
merge sort
merge sort
merge sort
merge sort

上图完整展示了整个排序的过程,通过该种方式,可以看出性能会高于插入排序算法,时间复杂度为:

T(n) = C1 + 2T(n/2) + O(n) + Cn 其中C>0 C为常数。

时间复杂度为O(n log ⁡ 2 ( n ) \log_2(n) log2(n))

Code Implements

这里给出Java版本的代码实现参考:

public class MergeSort {/*** Merges two subarrays of arr[].* First subarray is arr[l..m]* Second subarray is arr[m+1..r]* @param arr* @param l* @param m* @param r*/private void merge(int arr[], int l, int m, int r) {// Find sizes of two subarrays to be mergedint n1 = m - l + 1;int n2 = r - m;/* Create temp arrays */int L[] = new int[n1];int R[] = new int[n2];/*Copy data to temp arrays*/for (int i = 0; i < n1; ++i) {L[i] = arr[l + i];}for (int j = 0; j < n2; ++j) {R[j] = arr[m + 1 + j];}/* Merge the temp arrays */// Initial indexes of first and second subarraysint i = 0, j = 0;// Initial index of merged subarry arrayint k = l;while (i < n1 && j < n2) {if (L[i] <= R[j]) {arr[k] = L[i];i++;} else {arr[k] = R[j];j++;}k++;}/* Copy remaining elements of L[] if any */while (i < n1) {arr[k] = L[i];i++;k++;}/* Copy remaining elements of R[] if any */while (j < n2) {arr[k] = R[j];j++;k++;}}/*** Main function that sorts arr[l..r] using* merge()** @param arr* @param l* @param r*/private void sort(int arr[], int l, int r) {if (l < r) {// Find the middle pointint m = (l + r) / 2;// Sort first and second halvessort(arr, l, m);sort(arr, m + 1, r);// Merge the sorted halvesmerge(arr, l, m, r);}}/*** A utility function to print array of size n** @param arr*/private static void printArray(int[] arr) {int n = arr.length;for (int i = 0; i < n; ++i) {System.out.print(arr[i] + " ");}System.out.println();}/*** Driver method** @param args*/public static void main(String args[]) {int[] arr = {12, 11, 13, 5, 6, 7};System.out.println("Given Array");printArray(arr);MergeSort ob = new MergeSort();ob.sort(arr, 0, arr.length - 1);System.out.println("\nSorted array");printArray(arr);}
}

Summary

本篇我们介绍了两种排序算法——插入排序与归并排序,可以看到,两种排序的核心思想都依赖于二分法查找,对比一下两种算法的性能:

PythonC
插入排序0.2 n 2 n^2 n20.1 n 2 n^2 n2
归并排序2.2n log ⁡ 2 ( n ) \log_2(n) log2(n)

当n>4000时,归并排序的性能会远远大于插入排序的性能,因此也是给我们一定的启示,当选择算法时,尽可能的要去选择时间复杂度为log函数的算法。

更多精彩文章, 请关注我的个人公众号:老宣说
让我们一起共同学习成长!
感谢您的支持!
老宣说

这篇关于麻省理工公开课算法导论(二):Insertion Sort and Merge Sort的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/514970

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

usaco 1.3 Mixing Milk (结构体排序 qsort) and hdu 2020(sort)

到了这题学会了结构体排序 于是回去修改了 1.2 milking cows 的算法~ 结构体排序核心: 1.结构体定义 struct Milk{int price;int milks;}milk[5000]; 2.自定义的比较函数,若返回值为正,qsort 函数判定a>b ;为负,a<b;为0,a==b; int milkcmp(const void *va,c

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

dp算法练习题【8】

不同二叉搜索树 96. 不同的二叉搜索树 给你一个整数 n ,求恰由 n 个节点组成且节点值从 1 到 n 互不相同的 二叉搜索树 有多少种?返回满足题意的二叉搜索树的种数。 示例 1: 输入:n = 3输出:5 示例 2: 输入:n = 1输出:1 class Solution {public int numTrees(int n) {int[] dp = new int

Codeforces Round #240 (Div. 2) E分治算法探究1

Codeforces Round #240 (Div. 2) E  http://codeforces.com/contest/415/problem/E 2^n个数,每次操作将其分成2^q份,对于每一份内部的数进行翻转(逆序),每次操作完后输出操作后新序列的逆序对数。 图一:  划分子问题。 图二: 分而治之,=>  合并 。 图三: 回溯: