mysql必知必会--学习笔记(11)--全文本搜索FULLTEXT,Match,Against,布尔全文搜索

本文主要是介绍mysql必知必会--学习笔记(11)--全文本搜索FULLTEXT,Match,Against,布尔全文搜索,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、mysql的引擎中MYISAM支持全文本搜索,而InnoDB不支持文本搜索。

2、为了进行全文本搜索,必须索引被搜索的列,而且要随着数据的改变不断地重新索引。

一般在创建表时启用全文本搜索。 CREATE TABLE 语句接受 FULLTEXT 子句,它给出被索引列的一个逗号分隔的列表。

在定义之后,MySQL自动维护该索引。在增加、更新或删除行时,索引随之自动更新。

3、在索引之后,使用两个函数 Match() 和 Against() 执行全文本搜索,其中 Match() 指定被搜索的列, Against() 指定要使用的搜索表达式。

使用完整的 Match() 说明:传递给 Match() 的值必须与FULLTEXT() 定义中的相同。如果指定多个列,则必须列出它们(而且次序正确)。

搜索不区分大小写 :除非使用 BINARY 方式(本章中没有介绍),否则全文本搜索不区分大小写。

4、在 SELECT 而不是 WHERE 子句中使用 Match() 和 Against() 。这使所有行都被返回。此列包含全文本搜索计算出的等级

值。等级由MySQL根据行中词的数目、唯一词的数目、整个索引中词的总数以及包含该词的行的数目计算出来。

5、全文本搜索的结果   (排除那些等级为0的行)  (按等级以降序排序)。

6、使用查询扩展  

 首先,进行一个基本的全文本搜索,找出与搜索条件匹配的所有
行;
 其次,MySQL检查这些匹配行并选择所有有用的词(我们将会简
要地解释MySQL如何断定什么有用,什么无用)。
 再其次,MySQL再次进行全文本搜索,这次不仅使用原来的条件,

而且还使用所有有用的词。

7、查询扩展实例

SELECT note_text FROM productnotes WHERE Match(note_text) AGAINST('heavy' WITH QUERY EXPANSION);

8、布尔文本搜索

即使没有 FULLTEXT 索引也可以使用,但效率非常低下

9、关键字 IN BOOLEAN MODE的作用演示

SELECT note_text FROM productnotes WHERE Match(note_text) AGAINST('heavy' IN BOOLEAN MODE);
 10、为了匹配包含 heavy 但不包含任意以 rope 开始的词的行,可使用以下

查询:

SELECT note_text 
FROM productnotes
WHERE Match(note_text) 
AGAINST('heavy -rope*' IN BOOLEAN MODE);

11、全文本布尔操作符

全文本布尔操作符
+包含,词必须存在
-排除,词必须不出现
>包含,而且增加等级值
<包含,且减少等级值
()把词组成子表达式(允许这些子表达式作为一个组被包含、排除、排列等)
~                         取消一个词的排序值
*词尾的通配符
""定义一个短语(与单个词的列表不一样,它匹配整个短语以便包含或排除这个短语)
  

排列而不排序 在布尔方式中,不按等级值降序排序返回的行

12、知识点:

许多词出现的频率很高,搜索它们没有用处(返回太多的结果)。
因此,MySQL规定了一条50%规则,如果一个词出现在50%以上
的行中,则将它作为一个非用词忽略。50%规则不用于 IN BOOLEAN
MODE 。
 如果表中的行数少于3行,则全文本搜索不返回结果(因为每个词
或者不出现,或者至少出现在50%的行中)。
 忽略词中的单引号。例如, don't 索引为 dont 。
 不具有词分隔符(包括日语和汉语)的语言不能恰当地返回全文
本搜索结果。

这篇关于mysql必知必会--学习笔记(11)--全文本搜索FULLTEXT,Match,Against,布尔全文搜索的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/887548

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

hdu1240、hdu1253(三维搜索题)

1、从后往前输入,(x,y,z); 2、从下往上输入,(y , z, x); 3、从左往右输入,(z,x,y); hdu1240代码如下: #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#inc

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置