本文主要是介绍二分查找之谜题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、前言
二分查找本身是个简单的算法,但是正是因为其简单,更容易写错。甚至于在二分查找算法刚出现的时候,也是存在bug的(溢出的bug),这个bug直到几十年后才修复(见《编程珠玑》)。本文打算对二分查找算法进行总结,并对由二分查找引申出来的问题进行分析和汇总。若有错误,请不吝赐教。
二、二分查找是这样的
相信大家都知道二分查找的基本算法,如下所示,这就是二分查找算法:
int bisearch(int a[], int n, int t) //数组a有序,长度为n, 待查找的值为t
{int l = 0, u = n - 1;while (l <= u) {int m = l + (u - l) / 2; //同(l+u)/ 2,这里是为了溢出if (t > a[m])l = m + 1;else if (t < a[m])u = m - 1;elsereturn m;}return -(l+1);
}
算法的思想就是:从数组中间开始,每次排除一半的数据,时间复杂度为O(lgN)。 这依赖于数组有序这个性质。如果t存在数组中,则返回t在数组的位置;否则,不存在则返回-(l+1)。
这里需要解释下为什么t不存在数组中时不是返回-1而要返回-(l+1)。首先我们可以观察l的值,如果查找不成功,则l的值恰好是t应该在数组中插入的位置。
举个例子,假定有序数组a={1, 3, 4, 7, 8}, 那么如果t=0,则显然t不在数组中,则二分查找算法最终会使得l=0 > u=-1 退出循环;如果t=9,则t也不在数组中,则最后l=5 > u=4退出循环。如果t=5,则最后l=3 > u=2退出循环。因此在一些算法中,比如DHT(一致性哈希)中,就需要这个返回值来使得新加入的节点可以插入到合适的位置中,在求最长递增子序列的NlgN算法中,也用到了这一点,参见博文 最长递增子序列算法。
还有一个小点就是之所以返回-(l+1)而不是直接返回-l是因为l可能为0,如果直接返回-l就无法判断是正常返回位置0还是查找不成功返回的0。
三、二分查找数字第一次出现的位置
现在考虑一个稍微复杂点的问题,如果有序数组中有重复数字,比如数组a={1, 2, 3, 3, 5, 7, 8},需要在其中找出3第一次出现的位置。这里3第一次出现位置为2。这个问题在《编程珠玑》第九章有很好的分析,这里就直接用了。算法的精髓在于循环不变式的巧妙设计,代码如下:
int bsearch_first(int a[], int n, int t)
{int l = -1, u = n;while (l + 1 != u) {/*循环不变式a[l]<t<=a[u] &
这篇关于二分查找之谜题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!