创新实训(45)——使用ElasticSearch的Suggest实现搜索提示的学习

本文主要是介绍创新实训(45)——使用ElasticSearch的Suggest实现搜索提示的学习,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

昨天实现了句子的搜索,并且简单的更换了分词器,优化一下查询的结果,今天准备学习一下搜索提示的实现,并且设计一下如何使用java api实现搜索提示。

Suggest的学习

在查看官方文档之后,发现ElasticSearch的Suggest总共有四种类型

文档链接:http://doc.codingdict.com/elasticsearch/123/

  • Term Suggester
  • Phrase Suggester
  • Completion Suggester
  • Context Suggester
    然后我就一一了解了一下
    (1)Term suggester
    term 词项建议器,对给入的文本进行分词,为每个词进行模糊查询提供词项建议。对于在索引中存在词默认不提供建议词,不存在的词则根据模糊查询结果进行排序后取一定数量的建议词。
    常用的建议选项:
    在这里插入图片描述
    (2)phrase suggester
    phrase 短语建议,在term的基础上,会考量多个term之间的关系,比如是否同时出现在索引的原文里,相邻程度,以及词频等
    (3)Completion Suggester
    针对自动补全场景而设计的建议器。此场景下用户每输入一个字符的时候,就需要即时发送一次查询请求到后端查找匹配项,在用户输入速度较高的情况下对后端响应速度要求比较苛刻。因此实现上它和其他Suggester采用了不同的数据结构,索引并非通过倒排来完成,而是将analyze过的数据编码成FST和索引一起存放。对于一个open状态的索引,FST会被ES整个装载到内存里的,进行前缀查找速度极快。但是FST只能用于前缀查找,这也是Completion Suggester的局限所在。
    这个是我准备重点使用的Suggester
    注意:使用这个需要在被搜索的字段中设置type为completion,analyzer按情况设置分析器。才能实现自动的补全
    (4)Context Suggester
    好像能通过设置字段,实现上下文的映射。 有两种类型: category 和 geo 。 上下文映射在字段映射中的 contexts 参数下配置。看了半天文档没看明白,好像是能实现:设置地理位置的上下文然后进行地理映射
    具体文档http://doc.codingdict.com/elasticsearch/124/

设计

通过简单的了解,感觉使用ES实现搜索框的补全/纠错功能应该以如下的方式设计:
(1)在用户刚开始输入的过程中,使用Completion Suggester进行关键词前缀匹配,刚开始匹配项会比较多,随着用户输入字符增多,匹配项越来越少。如果用户输入比较精准,可能Completion Suggester的结果已经够好,用户已经可以看到理想的备选项了。
(2)如果Completion Suggester已经到了零匹配,那么可以猜测是否用户有输入错误,这时候可以尝试一下Phrase Suggester。
(3)如果Phrase Suggester没有找到任何option,开始尝试term Suggester。
最后一个Context Suggester,还是不知道该怎么用。。。。。

Completion Suggester的尝试

了解到如果使用 Completion Suggester的话,需要在建立索引的时候,设置field重的suggest的type和analyzer,所以打算找一个demo先学习一下。

参考链接:https://zq99299.github.io/note-book/elasticsearch-senior/es-high/76-completion-suggest.html#什么是-completion-suggest-?

(1)新建索引

PUT /news_website
{"mappings": {"news" : {"properties" : {"title" : {"type": "text","analyzer": "ik_max_word","fields": {"suggest" : {"type" : "completion","analyzer": "ik_max_word"}}},"content": {"type": "text","analyzer": "ik_max_word"}}}}
}

在这里插入图片描述
发现关键的配置是:
在这里插入图片描述
有了这个才能实现自动补全
(2)插入测试数据

PUT /news_website/news/1
{"title": "大话西游电影","content": "大话西游的电影时隔20年即将在2017年4月重映"
}
PUT /news_website/news/2
{"title": "大话西游小说","content": "某知名网络小说作家已经完成了大话西游同名小说的出版"
}
PUT /news_website/news/3
{"title": "大话西游手游","content": "网易游戏近日出品了大话西游经典IP的手游,正在火爆内测中"
}

在这里插入图片描述
(3)尝试进行搜索

GET /news_website/news/_search
{"suggest": {"my-suggest" : {"prefix" : "大话西游","completion" : {"field" : "title.suggest"}}}
}

在这里插入图片描述
注意到结果自动匹配到了三条数据
并且发现搜索的field也有讲究:
在这里插入图片描述

总结

在学习了Suggester之后,我发现自己需要重新按Completion Suggester的要求建立索引,最终才能实现搜索提示。

这篇关于创新实训(45)——使用ElasticSearch的Suggest实现搜索提示的学习的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/685445

相关文章

Java实现MD5加密的四种方式

《Java实现MD5加密的四种方式》MD5是一种广泛使用的哈希算法,其输出结果是一个128位的二进制数,通常以32位十六进制数的形式表示,MD5的底层实现涉及多个复杂的步骤和算法,本文给大家介绍了Ja... 目录MD5介绍Java 中实现 MD5 加密方式方法一:使用 MessageDigest方法二:使用

mysql删除无用用户的方法实现

《mysql删除无用用户的方法实现》本文主要介绍了mysql删除无用用户的方法实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 1、删除不用的账户(1) 查看当前已存在账户mysql> select user,host,pa

Nginx配置location+rewrite实现隐性域名配置

《Nginx配置location+rewrite实现隐性域名配置》本文主要介绍了Nginx配置location+rewrite实现隐性域名配置,包括基于根目录、条件和反向代理+rewrite配置的隐性... 目录1、配置基于根目录的隐性域名(就是nginx反向代理)2、配置基于条件的隐性域名2.1、基于条件

Linux配置IP地址的三种实现方式

《Linux配置IP地址的三种实现方式》:本文主要介绍Linux配置IP地址的三种实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录环境RedHat9第一种安装 直接配置网卡文件第二种方式 nmcli(Networkmanager command-line

Java中Runnable和Callable的区别和联系及使用场景

《Java中Runnable和Callable的区别和联系及使用场景》Java多线程有两个重要的接口,Runnable和Callable,分别提供一个run方法和call方法,二者是有较大差异的,本文... 目录一、Runnable使用场景二、Callable的使用场景三、关于Future和FutureTa

电脑提示msvcp90.dll缺少怎么办? MSVCP90.dll文件丢失的修复方法

《电脑提示msvcp90.dll缺少怎么办?MSVCP90.dll文件丢失的修复方法》今天我想和大家分享的主题是关于在使用软件时遇到的一个问题——msvcp90.dll丢失,相信很多老师在使用电脑时... 在计算机使用过程中,可能会遇到 MSVCP90.dll 丢失的问题。MSVCP90.dll 是 Mic

Java实现将Markdown转换为纯文本

《Java实现将Markdown转换为纯文本》这篇文章主要为大家详细介绍了两种在Java中实现Markdown转纯文本的主流方法,文中的示例代码讲解详细,大家可以根据需求选择适合的方案... 目录方法一:使用正则表达式(轻量级方案)方法二:使用 Flexmark-Java 库(专业方案)1. 添加依赖(Ma

使用EasyExcel实现简单的Excel表格解析操作

《使用EasyExcel实现简单的Excel表格解析操作》:本文主要介绍如何使用EasyExcel完成简单的表格解析操作,同时实现了大量数据情况下数据的分次批量入库,并记录每条数据入库的状态,感兴... 目录前言固定模板及表数据格式的解析实现Excel模板内容对应的实体类实现AnalysisEventLis

使用国内镜像源优化pip install下载的方法步骤

《使用国内镜像源优化pipinstall下载的方法步骤》在Python开发中,pip是一个不可或缺的工具,用于安装和管理Python包,然而,由于默认的PyPI服务器位于国外,国内用户在安装依赖时可... 目录引言1. 为什么需要国内镜像源?2. 常用的国内镜像源3. 临时使用国内镜像源4. 永久配置国内镜

Mybatis从3.4.0版本到3.5.7版本的迭代方法实现

《Mybatis从3.4.0版本到3.5.7版本的迭代方法实现》本文主要介绍了Mybatis从3.4.0版本到3.5.7版本的迭代方法实现,包括主要的功能增强、不兼容的更改和修复的错误,具有一定的参考... 目录一、3.4.01、主要的功能增强2、selectCursor example3、不兼容的更改二、