本文主要是介绍算法导论随笔(一): 操作计数与复杂度Big(O),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
最近有点空闲时间,准备开一个新坑来纪录自己读《算法导论》的一些读书笔记,有时间的话也讨论一些有趣的算法。首先来谈谈程序的操作计数与算法的复杂度计算,也就是我们常听说的大O。对于新手程序员来说,“算法”这个概念可能看上去比较高深,尤其是“复杂度”这个概念,有时会让人一头雾水。不过看了这篇文章后,相信大家对算法和复杂度的概念会有一个更直观的了解, 即使是只会初中数学,也完全可以看懂。
1. 复杂度的概念
对算法有一定了解的朋友们都知道,判断一个算法好坏的方法是看一个算法的复杂度。这里我们所说的复杂度主要是指时间复杂度(Time complexity)。复杂度越低,代表这个算法越好;相反复杂度越高,代表算法越一般。比如准备面试时可能经常会提到的排序算法,举两个例子来说,最经典的冒泡排序(Bubble sort)的复杂度是
O ( n 2 ) O(n^2) O(n2)
而《算法导论》里提到的归并排序(Merge Sort)的复杂度是
O ( n l o g n ) O(nlogn) O(nlogn)
我们可以看出,两个算法的复杂度不一样。从复杂度的角度来看,归并排序的复杂度低于冒泡排序的复杂度,因此归并排序的算法要好于冒泡排序的算法。也许有人要问,这个大写的字母O是什么意思,为什么通过比较这两个表达式就确定归并排序要好于冒泡排序呢?别急,往下看。 对于一个算法,或者一段程序,我们是有办法计算出它的复杂度的,而大O就是这段计算的一个标准。在介绍大O之前,我们先引入一个概念,叫做Operation Counting,翻译成中文就是“操作计数”。
2. 操作计数(Operation Counting)
直观上来讲,判断一个算法的好坏很简单,就是去看这个算法的执行时间就好了,对于同样的输入,计算出正确结果的时间越短,代表算法更好。一个计算机的每个CPU或内存操作都会耗费一定时间,这些操作(读内存,写内存等等)的时间并不是固定的,计算机的性能越好,操作的时间就越短。那么就存在一个问题,如何在判断算法好坏的时候排除这些变量因素。这也就是为什么要有操作计数这个概念。对于任何一个程序,我们把这个程序里的基本操作(primitive operation)分成以下几个类型:
翻译:
- 赋值给一个变量。比如:int x = 1;
- 调用一个函数。比如我们有一个函数int sum(){return x + y;}, 那么sum(2, 3); 这条语句就是调用了一个函数。
- 进行一个算术运算,比如 x + y;
- 比较两个数字, 比如 (x > y);
- 调用数组下标,比如array[0];
- 获取一个对象的引用
- 从函数(或方法)中返回
对于以上的所有7种基本操作,我们认为它们消耗一个单位的运行时间。也就是说,对于int x=1;我们为这行代码计数1。对于int x = y + z;我们为这行代码计数2,因为它既进行了算术运算,又把结果赋值给了变量x,所以有两个基本操作,即为消耗2个单位的时间。
有了以上的7个基本操作,我们就可以计算出一个程序运行需要消耗的单位时间。比如下面这段代码,它求出了给定数组中的最大值:
int arrayMax(int []A){int max = A[0];for(int i=1; i<A.length; i++){if(max < A[i])max = A[i];} return max;
}
我们可以计算一下这段程序最多需要消耗多少个单位的运行时间。在最坏的情况下,数组是从小到大排列好的,这样第5行中的max = A[i]每走一次循环时都要被执行到。我们假设数组A中有n个元素,那么第三行中的for循环的条件i<A.length要执行多少次呢?答案是要执行n次。例如,当n=5时,i的数值为1, 2, 3, 4, 5。当i等于5时,程序跳出循环。因此,for循环里面的代码要执行(n-1)次。我们把程序稍微修改一下,就可以直观地看出程序一共需要消耗的操作。
int arrayMax(int []A){int max = A[0]; //count = 2int i = 1; //count = 1for(;i<A.length;){ //count = 1 * n if(max < A[i]) //count = 2 * (n - 1)max = A[i]; //count = 2 * (n - 1)i++;//别忘了当前循环结束后,i自增的操作,i = i + 1, 消耗时间为2//count = 2 * (n - 1)
这篇关于算法导论随笔(一): 操作计数与复杂度Big(O)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!