ES升级--03-- IK分词器

2024-06-19 01:12
文章标签 es 03 ik 分词器 升级

本文主要是介绍ES升级--03-- IK分词器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • IK分词器
    • 1. IK分词器 下载
        • https://github.com/infinilabs/analysis-ik/releases
    • 2. 创建文件夹 analysis-ik
    • 3.把zip包放至该目录下 解压
    • 4. 删除zip包
    • 5、重启Elasticsearch, 观察日志
  • 使用kibana测试
    • 1、细粒度的拆分
    • 2、粗粒度的拆分


IK分词器

elasticsearch默认提供了standard分词器,但对中文的分词效果不尽人意

1. IK分词器 下载

  • IK中文分词器-Github地址
https://github.com/infinilabs/analysis-ik/releases

在这里插入图片描述

2. 创建文件夹 analysis-ik

创建文件夹 analysis-ik,在/data/es/elasticsearch-7.9.1/plugins/下

3.把zip包放至该目录下 解压

在这里插入图片描述

unzip elasticsearch-analysis-ik-7.9.1.zip 

在这里插入图片描述

4. 删除zip包

rm -rf  elasticsearch-analysis-ik-7.9.1.zip 

5、重启Elasticsearch, 观察日志

在这里插入图片描述
在这里插入图片描述

使用kibana测试

IK提供两种分词算法:ik_smart 和 ik_max_word

  • ik_smart : 最粗粒度的拆分
  • ik_max_word : 最细粒度的拆分

1、细粒度的拆分

POST _analyze
{"analyzer": "ik_max_word","text": ["中华人民共和国万岁"]
}

在这里插入图片描述

2、粗粒度的拆分

POST _analyze
{"analyzer": "ik_smart","text": ["中华人民共和国万岁"]
}

在这里插入图片描述

这篇关于ES升级--03-- IK分词器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1073590

相关文章

【文末附gpt升级秘笈】腾讯元宝AI搜索解析能力升级:千万字超长文处理的新里程碑

腾讯元宝AI搜索解析能力升级:千万字超长文处理的新里程碑 一、引言 随着人工智能技术的飞速发展,自然语言处理(NLP)和机器学习(ML)在各行各业的应用日益广泛。其中,AI搜索解析能力作为信息检索和知识抽取的核心技术,受到了广泛的关注和研究。腾讯作为互联网行业的领军企业,其在AI领域的探索和创新一直走在前列。近日,腾讯旗下的AI大模型应用——腾讯元宝,迎来了1.1.7版本的升级,新版本在AI搜

图形编辑器基于Paper.js教程03:认识Paper.js中的所有类

先来认一下Paper的资源对象,小弟有哪些,有个整体的认识。认个脸。 在Paper.js的 官方文档中类大致有如下这些: 基类: ProjectViewItemPointToolSizeSegmentRectangleCurveCurveLocationMatrixColorStyleTweenToolEventGradientGradientStopEvent 二级或三级类 继承Ite

java同步锁以及级别升级的理解

首先简单说下先偏向锁、轻量级锁、重量级锁三者各自的应用场景: 偏向锁:只有一个线程进入临界区;轻量级锁:多个线程交替进入临界区;重量级锁:多个线程同时进入临界区。 还要明确的是,偏向锁、轻量级锁都是JVM引入的锁优化手段,目的是降低线程同步的开销。比如以下的同步代码块:   synchronized (lockObject) { // do something } 上述同步代码块

es安装教程

环境介绍# 软件版本:ElasticSearch7.0.0 Kibana7.0.0 系统环境:mac 环境 安装过程# 官网下载 ElasticSearch7.0.0 版本,下载后解压即可 进入es安装目录 cd elasticsearch-7.0.0bin/elasticsearch 如果报错的话直接给整个目录增加读写权限 在页面中访问 http://localhost:920

Android自定义View学习笔记03

Android自定义View学习笔记03 参考gitHub上面的开源项目CircleImageView 预备知识 BitMap类 BitMap位图类,其中有一个嵌套类叫Bitmap.Config,内部有四个枚举值。这个类的作用是定义位图存储质量,即存储一个像素的位数,以及是否能显示透明、半透明颜色(Possible bitmap configurations. A bitmap co

软考初级网络管理员_03_硬件单选题

1.CPU是一块超大规模的集成电路,其主要部件有()。 运算器、控制器和系统总线 运算器、寄存器组和内存储器 控制器、存储器和寄存器组 运算器、控制器和寄存器组 2.(请作答此空)是指CPU一次可以处理的二进制的位数,它直接关系到计算机的计算精度、速度等指标:运算速度是指计算机每秒能执行的指令条数,通常以()为单位来描述。 宽带 主频 字长 存储容量 3.CPU执行指令时,先根

Python pip升级及升级失败解决方案 pip 20.2.2升级20.2.3教程

Python pip升级及升级失败解决方案 本教程用于Python  pip升级及失败解决方案 首先查看脚本 pip show pip 我已经升级到了最新的版本 安装其他模块过程中出现下面提示,便说明你需要升级pip You are using pip version 18.1.1, however version 19.0.1 is available. 你的版本为18.1

两个基因相关性细胞系(CCLE)(升级)

目录 单基因CCLE数据 ①细胞系转录组CCLE数据下载 ②单基因泛癌表达 CCLE两个基因相关性 ①进行数据整理 ②相关性分析 单基因CCLE数据 ①细胞系转录组CCLE数据下载 基因在各个细胞系表达情况_ccle expression 23q4-CSDN博客 rm(list = ls())library(tidyverse)library(ggpubr)rt

03 TensorFlow 2.0:TOPK Accuracy实战

这江山风雨 岁月山河 刀光剑影 美了多少世间传说 且看他口若悬河 衣上有风尘 却原来是一位江湖说书人                                                                                                                                 《说书人》 在分类问题中会遇到TO

「Debug R」如何不需要重新启动R/Rstudio就可以升级已经加载的R包

当我们已经加载了一个R包,例如ggplot2时,然后此时你发现ggplot2目前出最新版了,你心血来潮想要升级它,于是你输入了install.packages("ggplot2"), 结果弹出了下面这个界面 一个神奇的界面 它强烈建议你重启一下Rstudio,并且说到Rstudio会非常智能的重启并继续你的任务。但是根据我多年踩坑的经验,它通常没有那么智能。即便它有它说的那么智