细探baidu 搜索提示框

2024-01-27 23:08
文章标签 搜索 提示框 baidu 细探

本文主要是介绍细探baidu 搜索提示框,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

我记得我在上大学的第一堂数据库的时候,老师告诉我们,索引在数据库里面是一个非常重要的东西,用好了数据库索引,会让觉得事半功倍的效果,用不好数据索引,往往是吃力不讨好。所以在出来工作的三四年的时间里面,一直都在关键的字段上面建索引来提高查找速度,当然这个也得看情况,如果是需要快速插入的地方,建立索引的过程又往往是性能消耗很大。但是又一次的一个项目,确让引发了我对索引的重新理解。
具体的要求是这样,对某个字段进行模糊查询,数据类型为vchar2(100),数据量在100W左右,要求查询相关记录的时间为1秒左右,当时我觉得这个是一个很好做的事情,我就想提高速度那我就在这个字段上面建立索引吧,这样速度应该就会很快的。很快索引建立起来,程序写好了,当时当真正测试的时候,发现速度根本就没有我想象的那么快,是不是索引用的不对,按照常理,100W的数据,用索引查找应该就在1秒之内完成呀。后来查看了mysql的官网才知道 ,在对整形数据建立索引,速度是超快的,对vchar2建立索引,如果你采用%##%来进行查询,索引是不起作用的,也就是全表遍历。只是在##%的查询的时候,索引才有效的。 后来把搜索条件该为##%,果然速度超快。
在这里突然想到,百度的搜索提示框,当你在百度搜索框里面输入某个字符的时候,你可以看到出来的下拉框提示信息都是以你输入的这个字符开头的,为什么会这样,这样符合逻辑吗? 其实不然。但是没有办法,如果出现不是这个字符开头的话,那么你必须采用%##%来进行查找,这样相当于全表扫描,速度肯定是无法接接受,所你看百度的提示搜索框都是以你输入的那个字符为开头的提示信息,就是可以用##%为搜索条件,来进行索引查询的。
那么有没有%##%这样查找的解决方案呢?Lucene就是专门应对这样的情况,我在建立自己的网站 bushere.com的时候,开始的时候也是采用mysq4.0l的%##%来进行搜索条件,发现速度根本就没有办法接受,因为有100W的数据,你在里这么多数据集查找某个线路的信息,速度肯定无法接受,后来采用lucene来改进,当然也花费了不少的时间来学习,效果不错。100W的数据 在查找起点和终点的线路信息时候,基本是在1秒之内,速度很快。当然用户体验也就自然上去了。
所以我想说。有的时候,正理也会有不适合的场景,是自己的理解错误还是其他的,需要自己实践才能知晓。困难时时都会遇到,但是肯定有解决之道。

这篇关于细探baidu 搜索提示框的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/651758

相关文章

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

hdu1240、hdu1253(三维搜索题)

1、从后往前输入,(x,y,z); 2、从下往上输入,(y , z, x); 3、从左往右输入,(z,x,y); hdu1240代码如下: #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#inc

hdu 4517 floyd+记忆化搜索

题意: 有n(100)个景点,m(1000)条路,时间限制为t(300),起点s,终点e。 访问每个景点需要时间cost_i,每个景点的访问价值为value_i。 点与点之间行走需要花费的时间为g[ i ] [ j ] 。注意点间可能有多条边。 走到一个点时可以选择访问或者不访问,并且当前点的访问价值应该严格大于前一个访问的点。 现在求,从起点出发,到达终点,在时间限制内,能得到的最大

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close

hdu4277搜索

给你n个有长度的线段,问如果用上所有的线段来拼1个三角形,最多能拼出多少种不同的? import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;

浙大数据结构:04-树7 二叉搜索树的操作集

这道题答案都在PPT上,所以先学会再写的话并不难。 1、BinTree Insert( BinTree BST, ElementType X ) 递归实现,小就进左子树,大就进右子树。 为空就新建结点插入。 BinTree Insert( BinTree BST, ElementType X ){if(!BST){BST=(BinTree)malloc(sizeof(struct TNo

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.

记忆化搜索【下】

375. 猜数字大小II 题目分析 题目链接:375. 猜数字大小 II - 力扣(LeetCode) 题目比较长,大致意思就是给一个数,比如说10,定的数字是7,让我们在[1, 10]这个区间猜。 如果猜大或猜小都会说明是大了还是小了,此外,我们还需要支付猜错数字对应的现金。 现在就是让我们定制一个猜测策略,确保准备最少的钱能猜对 如果采用二分查找,只能确保最小次数,题目要求的

2014暑假集训搜索专题

A - 漫步校园 Time Limit:1000MS Memory Limit:32768KB 64bit IO Format:%I64d & %I64u Submit Status Description LL最近沉迷于AC不能自拔,每天寝室、机房两点一线。由于长时间坐在电脑边,缺乏运动。他决定充分利用每次从寝室到机房的时间,在校园里散散步。整个HDU校园呈方形布局,可划

百度之星初赛1002(二分搜索)

序列变换    Accepts: 816    Submissions: 3578  Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Problem Description 给定序列 A={A1,A2,...,An} , 要求改变序列A中