建立SQL全文索引提升搜索速度

2024-02-29 14:58

本文主要是介绍建立SQL全文索引提升搜索速度,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

建立SQL全文索引提升搜索速度

2012-12-10 10:27 by swarb, ... 阅读, ... 评论, 收藏, 编辑

要实现搜索引擎的模糊查找功能,使用SQL的关键字LIKE来实现模式匹配。

    现在我们有一个数据库,表名叫T1,有记录数一万条。Title字段是文本字段,长度为255,Body为备注字段。看下面的SQL语句:

Select * From T1 Where Title Like '%迅雷%'

    则这句话就是要返回Table1表中Title字段里包含‘迅雷’的所有记录。由于Title是文本字段,长度也不大,故其查找速度还可以接受。

    现在我们要返回Title或Body字段中包含‘迅雷’的所有记录:

Select * From T1 Where Title Like '%迅雷%' Or Body Like '%迅雷%'    速度慢了许多倍,这样的速度用于Web搜索,用户会有这个耐心去等待吗?

    如何解决在模糊查找中的速度问题,这就是我们今天要引出的全文索引的话题。

    关于全文索引,一个能说明问题的例子就是:

    给你一本你没看过的书,指定书里面存在的一句话让你去查找,而且不能看目录(索引),那么你只能一页一页的翻书本去查找了,想一想,你对这本书的内容也不了解,这样的查找速度会快吗?

    如果允许看目录(索引),根据目录(索引)的指引,你也许会更快的找到(如果这个索引和要查找的话关联性大)。另外,我们再假如你很喜欢这本书,并且每天阅读,过一段时间,你已经对书本的内容了如指掌,这个时候,让你再找一段话,你是不是一下子便能知道这句话大概的位置?然后根据大概位置在附近查找,然后很快定位搜索结果。这其实可以说是你已经在你的脑子里为这本书建立了全文索引。

    SQL全文索引就是将数据库的记录按词语做了事先的索引,以便在模糊查找的时候能提升速度。这些索引的词语,对于英文,每两个单词之间有一个空格,可中文不一样了,这涉及到中文分词技术。我们在使用数据库引擎的时候,引擎的全文索引其实已经使用了分词的技术,当然这并不能从表面所看到。

    我们以MS SQL Server 2000为例,说明如何建立全文索引。

    1、启动全文索引。在Microsoft SQL Server >> SQL Server 组 >> (LOCAL) (Windows NT) >> 支持服务 >> 全文检索 >> 右键菜单元 >> 启动;

    2、对数据库建立全文目录。在Microsoft SQL Server >> SQL Server 组 >> (LOCAL) (Windows NT) >> 数据库 >> 全文目录 >> 右建菜单 >> 新建全文目录;

    3、对所要建立全文索引的表建立全文索引。在Microsoft SQL Server >> SQL Server 组 >> (LOCAL) (Windows NT) >> 数据库 >> 你的数据库名 >> 表 >> 双击 >> 在右侧列表中选择要建立全文索引的数据表 >> 右建菜单 >> 全文索引表 >> 在表上定义全文索引 , 按向导,选择要建立全文索引的字段和全文目录,完成操作。注意,你的数据表必须有主键,否则会出现如下错误提示:“所选表中没有在不允许 NULL 的列上的唯一单个列索引”。

    4、对上一步建立全文索引时选择的全文目录进行填充。在Microsoft SQL Server >> SQL Server 组 >> (LOCAL) (Windows NT) >> 数据库 >> 全文目录 >> 双击 >> 在右侧列表中选择全文目录 >> 右建菜单 >> 启动完全填充。注意,填充是需要时间的。

    这样,给数据表建立全文索引之后我们就可以使用CONTAINS来检索了:

Select * From T1 Where Title Like '%迅雷%' OR CONTAINS(Body, '%迅雷%')    试一试查询速度,第一次查询速度还是很慢,当查询驻入内存之后,查询就快了。已免强可以接受。但第一次查询速度慢的问题还需要解决,并且以后的查询离百度搜索速度还有很大距离。就是说还有很多地方可以完善的

这篇关于建立SQL全文索引提升搜索速度的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/759194

相关文章

mysql索引四(组合索引)

单列索引,即一个索引只包含单个列,一个表可以有多个单列索引,但这不是组合索引;组合索引,即一个索引包含多个列。 因为有事,下面内容全部转自:https://www.cnblogs.com/farmer-cabbage/p/5793589.html 为了形象地对比单列索引和组合索引,为表添加多个字段:    CREATE TABLE mytable( ID INT NOT NULL, use

mysql索引三(全文索引)

前面分别介绍了mysql索引一(普通索引)、mysql索引二(唯一索引)。 本文学习mysql全文索引。 全文索引(也称全文检索)是目前搜索引擎使用的一种关键技术。它能够利用【分词技术】等多种算法智能分析出文本文字中关键词的频率和重要性,然后按照一定的算法规则智能地筛选出我们想要的搜索结果。 在MySql中,创建全文索引相对比较简单。例如:我们有一个文章表(article),其中有主键ID(

mysql索引二(唯一索引)

前文中介绍了MySQL中普通索引用法,和没有索引的区别。mysql索引一(普通索引) 下面学习一下唯一索引。 创建唯一索引的目的不是为了提高访问速度,而只是为了避免数据出现重复。唯一索引可以有多个但索引列的值必须唯一,索引列的值允许有空值。如果能确定某个数据列将只包含彼此各不相同的值,在为这个数据列创建索引的时候就应该使用关键字UNIQUE,把它定义为一个唯一索引。 添加数据库唯一索引的几种

mysql索引一(普通索引)

mysql的索引分为两大类,聚簇索引、非聚簇索引。聚簇索引是按照数据存放的物理位置为顺序的,而非聚簇索引则不同。聚簇索引能够提高多行检索的速度、非聚簇索引则对单行检索的速度很快。         在这两大类的索引类型下,还可以降索引分为4个小类型:         1,普通索引:最基本的索引,没有任何限制,是我们经常使用到的索引。         2,唯一索引:与普通索引

【服务器运维】MySQL数据存储至数据盘

查看磁盘及分区 [root@MySQL tmp]# fdisk -lDisk /dev/sda: 21.5 GB, 21474836480 bytes255 heads, 63 sectors/track, 2610 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesSector size (logical/physical)

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

SQL Server中,always on服务器的相关操作

在SQL Server中,建立了always on服务,可用于数据库的同步备份,当数据库出现问题后,always on服务会自动切换主从服务器。 例如192.168.1.10为主服务器,12为从服务器,当主服务器出现问题后,always on自动将主服务器切换为12,保证数据库正常访问。 对于always on服务器有如下操作: 1、切换主从服务器:假如需要手动切换主从服务器时(如果两个服务

SQL Server中,isnull()函数以及null的用法

SQL Serve中的isnull()函数:          isnull(value1,value2)         1、value1与value2的数据类型必须一致。         2、如果value1的值不为null,结果返回value1。         3、如果value1为null,结果返回vaule2的值。vaule2是你设定的值。        如

SQL Server中,添加数据库到AlwaysOn高可用性组条件

1、将数据添加到AlwaysOn高可用性组,需要满足以下条件: 2、更多具体AlwaysOn设置,参考:https://msdn.microsoft.com/zh-cn/library/windows/apps/ff878487(v=sql.120).aspx 注:上述资源来自MSDN。

SQL Server中,用Restore DataBase把数据库还原到指定的路径

restore database 数据库名 from disk='备份文件路径' with move '数据库文件名' to '数据库文件放置路径', move '日志文件名' to '日志文件存放置路径' Go 如: restore database EaseWe from disk='H:\EaseWe.bak' with move 'Ease