全文索引的使用(二)

2024-02-27 20:18
文章标签 使用 全文索引

本文主要是介绍全文索引的使用(二),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

http://blog.csdn.net/HEROWANG/archive/2009/08/11/4436623.aspx

 

/***************************************************
 
          作者:herowang(让你望见影子的墙)
 
    日期:2009.8.11
 
          注:    转载请保留此信息
 
    更多内容,请访问我的博客:blog.csdn.net/herowang
 
****************************************************/

 

 
 

 


在上例中,执行
 
select * from tb
 
where contains(title,'上海')
 
结果:
 
id     title  detail
 
6     姚明:没把上海当投资项目 乐得生意做了好人当了     “姚蜜”说:不缺广告效应的姚明收购濒临绝境的上海东方篮球俱乐部,说明他是真的想为曾经的母队做点事情。
 
但是执行:
 
select * from tb
 
where contains(title,'上')
 
结果为空集。
 
原因:在进行全文索引查询的时候,“上”为简体中文的干扰词,即查询的时候会忽略掉;另外建立全文索引的时候一般会以一个词组作为一个索引项,而不是单个词。
 
 
 
如果还要进行此查询,想查出第一个查询的结果,可以修改全文索引的同义词库。
 
 
 
干扰词与同义词文件存在的路径:
 
D:/Program Files/Microsoft SQL Server2005/MSSQL.1/MSSQL/FTData,每一个文件名应该很好辨别。
 
简单介绍下修改同义词库的方法:
 
1、  使用记事本打开tschs.xml,这是简体中文的同义词库
 

 

view plaincopy to clipboardprint?
01.<XML ID="Microsoft Search Thesaurus"> 
02. 
03.<!--  Commented out 
04. 
05.    <thesaurus xmlns="x-schema:tsSchema.xml"> 
06. 
07.       <diacritics_sensitive>0</diacritics_sensitive> 
08. 
09.        <expansion> 
10. 
11.            <sub>Internet Explorer</sub> 
12. 
13.            <sub>IE</sub> 
14. 
15.            <sub>IE5</sub> 
16. 
17.        </expansion> 
18. 
19.        <replacement> 
20. 
21.            <pat>NT5</pat> 
22. 
23.            <pat>W2K</pat> 
24. 
25.            <sub>Windows 2000</sub> 
26. 
27.        </replacement> 
28. 
29.        <expansion> 
30. 
31.            <sub>run</sub> 
32. 
33.            <sub>jog</sub> 
34. 
35.        </expansion> 
36. 
37.    </thesaurus> 
38. 
39.--> 
40. 
41.</XML> 
 解释:
 
<replacement>
 
<pat>NT5</pat>
 
   <pat>W2K</pat>
 
   <sub>Windows 2000</sub>
 
</replacement>
 
为替代词,即查询W2K时,会自动替换为Windows 2000进行查询
 
<expansion>
 
   <sub>run</sub>
 
   <sub>jog</sub>
 
</expansion>
 
为同义词库,即查询run的时候也会查询jog
 
在本例中添加:
 
<expansion>
 
<sub>上</sub>
 
   <sub>上海</sub>
 
</expansion>
 
2、  去掉开始于末尾的注释行:
 
    <!--  Commented out
 
-->
 
3、最终形成的结果为:
 
  


view plaincopy to clipboardprint?
01.<XML ID="Microsoft Search Thesaurus"> 
02. 
03.    <thesaurus xmlns="x-schema:tsSchema.xml"> 
04. 
05.       <diacritics_sensitive>0</diacritics_sensitive> 
06. 
07.        <expansion> 
08. 
09.            <sub>Internet Explorer</sub> 
10. 
11.            <sub>IE</sub> 
12. 
13.            <sub>IE5</sub> 
14. 
15.        </expansion> 
16. 
17.        <replacement> 
18. 
19.            <pat>NT5</pat> 
20. 
21.            <pat>W2K</pat> 
22. 
23.            <sub>Windows 2000</sub> 
24. 
25.        </replacement> 
26. 
27.        <expansion> 
28. 
29.            <sub>run</sub> 
30. 
31.            <sub>jog</sub> 
32. 
33.        </expansion> 
34. 
35.       <expansion> 
36. 
37.            <sub>上</sub> 
38. 
39.            <sub>上海</sub> 
40. 
41.        </expansion> 
42. 
43.    </thesaurus> 
44. 
45.</XML> 
 

4、  执行查询语句:
 
select * from tb
 
where contains(title,'formsof(thesaurus,上)')
 
即可看到查询结果与contains(title,'上海')相同


本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/HEROWANG/archive/2009/08/11/4436623.aspx

这篇关于全文索引的使用(二)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/753495

相关文章

C语言中联合体union的使用

本文编辑整理自: http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=179471 一、前言 “联合体”(union)与“结构体”(struct)有一些相似之处。但两者有本质上的不同。在结构体中,各成员有各自的内存空间, 一个结构变量的总长度是各成员长度之和。而在“联合”中,各成员共享一段内存空间, 一个联合变量

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

Vim使用基础篇

本文内容大部分来自 vimtutor,自带的教程的总结。在终端输入vimtutor 即可进入教程。 先总结一下,然后再分别介绍正常模式,插入模式,和可视模式三种模式下的命令。 目录 看完以后的汇总 1.正常模式(Normal模式) 1.移动光标 2.删除 3.【:】输入符 4.撤销 5.替换 6.重复命令【. ; ,】 7.复制粘贴 8.缩进 2.插入模式 INSERT

mysql索引三(全文索引)

前面分别介绍了mysql索引一(普通索引)、mysql索引二(唯一索引)。 本文学习mysql全文索引。 全文索引(也称全文检索)是目前搜索引擎使用的一种关键技术。它能够利用【分词技术】等多种算法智能分析出文本文字中关键词的频率和重要性,然后按照一定的算法规则智能地筛选出我们想要的搜索结果。 在MySql中,创建全文索引相对比较简单。例如:我们有一个文章表(article),其中有主键ID(

Lipowerline5.0 雷达电力应用软件下载使用

1.配网数据处理分析 针对配网线路点云数据,优化了分类算法,支持杆塔、导线、交跨线、建筑物、地面点和其他线路的自动分类;一键生成危险点报告和交跨报告;还能生成点云数据采集航线和自主巡检航线。 获取软件安装包联系邮箱:2895356150@qq.com,资源源于网络,本介绍用于学习使用,如有侵权请您联系删除! 2.新增快速版,简洁易上手 支持快速版和专业版切换使用,快速版界面简洁,保留主

如何免费的去使用connectedpapers?

免费使用connectedpapers 1. 打开谷歌浏览器2. 按住ctrl+shift+N,进入无痕模式3. 不需要登录(也就是访客模式)4. 两次用完,关闭无痕模式(继续重复步骤 2 - 4) 1. 打开谷歌浏览器 2. 按住ctrl+shift+N,进入无痕模式 输入网址:https://www.connectedpapers.com/ 3. 不需要登录(也就是

Toolbar+DrawerLayout使用详情结合网络各大神

最近也想搞下toolbar+drawerlayout的使用。结合网络上各大神的杰作,我把大部分的内容效果都完成了遍。现在记录下各个功能效果的实现以及一些细节注意点。 这图弹出两个菜单内容都是仿QQ界面的选项。左边一个是drawerlayout的弹窗。右边是toolbar的popup弹窗。 开始实现步骤详情: 1.创建toolbar布局跟drawerlayout布局 <?xml vers

C#中,decimal类型使用

在Microsoft SQL Server中numeric类型,在C#中使用的时候,需要用decimal类型与其对应,不能使用int等类型。 SQL:numeric C#:decimal

探索Elastic Search:强大的开源搜索引擎,详解及使用

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选,相信大家多多少少的都听说过它。它可以快速地储存、搜索和分析海量数据。就连维基百科、Stack Overflow、

flask 中使用 装饰器

因为要完成毕业设计,我用到fountain code做数据恢复。 于是在github上下载了fountain code的python原代码。 github上的作者用flask做了fountain code的demo。 flask是面向python的一个网站框架。 里面有用到装饰器。 今天笔试的时候,我也被问到了python的装饰器。