使用MeiliSearch搜索老苏的博客

2023-12-09 16:20

本文主要是介绍使用MeiliSearch搜索老苏的博客,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

去年年初,老苏折腾过 Meilisearch,当时遗留下一个问题,怎么用 Meilisearch 来对老苏的博客进行全文检索,不过很可惜没有成功

文章传送门:开源全文搜索引擎MeiliSearch

帅哥 初冬 最近在部署公司开源项目的帮助文档,老苏发现文档搜索居然采用了 Meilisearch,一番请教之后,老苏决定换个思路,既然自己不会改博文索引,就试试 Meilisearch 官方提供的爬虫 docs-scraper,通过爬虫来生成的博文索引,说干就干。

安装

在群晖上以 Docker 方式安装。

安装 Meilisearch

如果你已经安装过了 Meilisearch ,可以跳到下一个章节

# 新建文件夹 meilisearch 和 子目录
mkdir -p /volume1/docker/meilisearch/data# 进入 meilisearch 目录
cd /volume1/docker/meilisearch# 运行容器
# Launch Meilisearch in development mode with a master key
docker run -d \--restart unless-stopped \--name meilisearch \-p 7700:7700 \-v $(pwd)/data:/meili_data \-e MEILI_ENV='development' \-e MEILI_MASTER_KEY='27bb9198372f81f8b95fb75d0252912de061fb6fa90d0ad6eb347cc051f0abe3' \getmeili/meilisearch:latest

latest 对应的版本为 v1.3.5

  • MEILI_ENV:指定为 development 模式;
  • MEILI_MASTER_KEY:指定 master key,至少 16 字节的 UTF-8 字符串,老苏一般是用 Vaultwarden 的密码生成器来生成,这是为了保护 Meil​​isearch 实例免遭未经授权的使用,所以必须在启动时提供主密钥;

创建 API Key

实例受到保护后,要访问任何 API 端点,必须向您的请求添加具有适当权限的安全密钥。

而实际上,当您第一次启动实例时,Meilisearch 已经自动生成了两个 API 密钥:Default Search API KeyDefault Admin API Key

其中:

  • Default Search API Key :只能用于访问搜索路径;
  • Default Admin API Key :可以访问除 /keys 之外的所有 API 路由。您应该避免在可公开访问的代码中公开默认的管理密钥。

接下来我们需要做的就是获取到这两个 API Key

v0.24 及以下版本使用X-MEILI-API-KEY: apiKey, v0.25 及以上版本使用Authorization: Bearer apiKey

# 获取不同权限的 API Key
curl \-H "Authorization: Bearer 27bb9198372f81f8b95fb75d0252912de061fb6fa90d0ad6eb347cc051f0abe3" \-X GET 'http://192.168.0.197:7700/keys'

在这里插入图片描述

返回的结果在 https://www.json.cn 格式化之后

{  "results":[  {  "name":"Default Search API Key",  "description":"Use it to search from the frontend",  "key":"04c633b21ec1e6723dcf9215455c68ac321d85a3c11fc7429c2dd806f84c9e28",  "uid":"3129fff7-e093-4a4a-b62e-3c68dfb41790",  "actions":[  "search"  ],  "indexes":[  "*"  ],  "expiresAt":null,  "createdAt":"2023-09-20T13:08:33.768044056Z",  "updatedAt":"2023-09-20T13:08:33.768044056Z"  },  {  "name":"Default Admin API Key",  "description":"Use it for anything that is not a search operation. Caution! Do not expose it on a public frontend",  "key":"3dc38a7f9f012f3c22c7e568755c93d7b5112e10732ba4305cbb8229288e50ea",  "uid":"5b00b4d7-ea88-473e-9f6b-229b04d73f6f",  "actions":[  "*"  ],  "indexes":[  "*"  ],  "expiresAt":null,  "createdAt":"2023-09-20T13:08:33.58142974Z",  "updatedAt":"2023-09-20T13:08:33.58142974Z"  }  ],  "offset":0,  "limit":20,  "total":2  
}

创建 config.json

scraper 工具需要一个配置文件来了解您想要抓取的内容。这是通过提供选择器(例如,HTML标记)来实现的。

将下面的文件保存为 config.json,并将其上传到 meilisearch 根目录

{"index_uid": "blog","start_urls": ["https://laosu.cf"],"sitemap_urls": ["https://laosu.cf/sitemap.xml"],"stop_urls": [],"selectors": {"lvl0": {"selector": "h1.post-title","global": true,"default_value": "Documentation"},"lvl1": {"selector": ".post-body h1","global": true,"default_value": "Chapter"},"lvl2": ".post-body h2","lvl3": ".post-body h3","lvl4": ".post-body h4","text": ".post-body p, .post-body li, .post-body figure, .post-body table"}
}

运行 docs-scraper

docs-scraperMeilisearch 提供并维护的一个抓取工具,可以自动读取您网站的内容,并将其存储在 Meilisearch 的索引中。

现在可以开始抓取了

# 运行容器
docker run -it --rm \--name meilisearch-scraper \-v $(pwd)/config.json:/docs-scraper/config.json \-e MEILISEARCH_HOST_URL='http://192.168.0.197:7700' \-e MEILISEARCH_API_KEY='27bb9198372f81f8b95fb75d0252912de061fb6fa90d0ad6eb347cc051f0abe3' \getmeili/docs-scraper:latest pipenv run ./docs_scraper config.json
  • MEILISEARCH_HOST_URL:指定 meilisearchurl 地址;
  • MEILISEARCH_API_KEY:老苏用了 master key

在这里插入图片描述

在抓取过程中, CPU 可能会飙升

如果网站发布了新的文章,需要重新抓取一次,这样能保持最新的索引

运行

抓取完成后,在浏览器中输入 http://群晖IP:7700 就能看到 Meilisearch 的主界面

输入 Admin API Key 后就可以开始使用了

搜索 admin@shinobi.video,很快就返回了结果,点链接可以直接打开文章

搜索条

在台式机上新建一个 search-bar.html 文件,内容如下:

<!DOCTYPE html>
<html><head><link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/docs-searchbar.js@latest/dist/cdn/docs-searchbar.min.css" /></head><body><input type="search" id="search-bar-input"><script src="https://cdn.jsdelivr.net/npm/docs-searchbar.js@latest/dist/cdn/docs-searchbar.min.js"></script><script>docsSearchBar({hostUrl: 'http://192.168.0.197:7700',apiKey: '04c633b21ec1e6723dcf9215455c68ac321d85a3c11fc7429c2dd806f84c9e28',indexUid: 'blog',inputSelector: '#search-bar-input',debug: true // Set debug to true if you want to inspect the dropdown});</script></body>
</html>
  • hostUrl: 是 Meilisearch 的访问地址,如果远程访问的话可以反代成域名;
  • apiKey:用前面获取的 Default Search API Key
  • indexUid:就是在 config.json 中设置的 index_uid 的值;

直接在浏览器中打开 search-bar.html 文件,只会在左上角看个一个文本框

继续搜索 admin@shinobi.video

当然,如果你熟悉 html 的话,完全可以把上面这段 html 嵌入到你自己的页面中

参考文档

meilisearch/docs-scraper: Scrape documentation into Meilisearch
地址:https://github.com/meilisearch/docs-scraper

Meilisearch Documentation
地址:https://www.meilisearch.com/docs/learn/cookbooks/search_bar_for_docs#scrape-your-content

使用MeiliSearch实现Hugo博客搜索 | Jefferywang的烂笔头
地址:https://blog.wangjunfeng.com/post/hugo-meilisearch/

这篇关于使用MeiliSearch搜索老苏的博客的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/474339

相关文章

C++使用栈实现括号匹配的代码详解

《C++使用栈实现括号匹配的代码详解》在编程中,括号匹配是一个常见问题,尤其是在处理数学表达式、编译器解析等任务时,栈是一种非常适合处理此类问题的数据结构,能够精确地管理括号的匹配问题,本文将通过C+... 目录引言问题描述代码讲解代码解析栈的状态表示测试总结引言在编程中,括号匹配是一个常见问题,尤其是在

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

C++ Primer 多维数组的使用

《C++Primer多维数组的使用》本文主要介绍了多维数组在C++语言中的定义、初始化、下标引用以及使用范围for语句处理多维数组的方法,具有一定的参考价值,感兴趣的可以了解一下... 目录多维数组多维数组的初始化多维数组的下标引用使用范围for语句处理多维数组指针和多维数组多维数组严格来说,C++语言没

在 Spring Boot 中使用 @Autowired和 @Bean注解的示例详解

《在SpringBoot中使用@Autowired和@Bean注解的示例详解》本文通过一个示例演示了如何在SpringBoot中使用@Autowired和@Bean注解进行依赖注入和Bean... 目录在 Spring Boot 中使用 @Autowired 和 @Bean 注解示例背景1. 定义 Stud