本文主要是介绍OpenSearch使用scroll滚动搜索实战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文章目录
- 前言
- 当前环境
- 实战
- 遇到的问题
前言
起源和开源性质:
Elasticsearch:Elasticsearch最初由Elastic公司开发,后来开源,但采用了Elastic License,这是一种有限制的许可协议。
OpenSearch:OpenSearch是从Elasticsearch的分支项目发展而来,以满足更广泛的开源社区需求,它采用了Apache License 2.0,这是一种较为开放的许可协议。
https://opensearch.org/docs/latest/api-reference/scroll/
正常search查询:结果hits.total.value=10000,得知会有限制,使用scroll来解决限制
查询结果深处的页面可能会对性能产生重大影响,因此 OpenSearch 将此方法限制为 10000 个结果。
所以需要使用scroll来解决10000以后的数据
当前环境
php8.1、hyperf3.0框架、OpenSearch7.10.2
composer包引入
"hyperf/elasticsearch": "3.0.*",
"opensearch-project/opensearch-php": "^2.2",
实战
// 创建 Elasticsearch 客户端
$client = $clientBuilder->setIndex('your_index')->getClient();// 定义滚动查询的初始搜索条件
$searchParams = ['scroll' => '1m', // 设置滚动时间'size' => 1000, // 设置每次滚动查询返回的文档数'body' => ['query' => ['match' => ['field' => 'value',],],],
];// 执行初始滚动查询
$response = $client->scroll($searchParams);// 获取第一批结果
$scrollId = $response['_scroll_id'];
$results = new Collection($response['hits']['hits']);// 处理第一批结果
foreach ($results as $result) {// 处理结果echo $result['_id'] . ": " . $result['_source']['field'] . "\n";
}// 开始滚动查询
while (true) {// 使用滚动 ID 获取下一批结果$scrollParams = ['scroll_id' => $scrollId,'scroll' => '1m', // 设置滚动时间,必须与初始查询保持一致];$response = $client->scroll($scrollParams);if (count($response['hits']['hits']) === 0) {// 所有结果已经获取完毕break;}// 获取下一批结果$results = new Collection($response['hits']['hits']);// 处理下一批结果foreach ($results as $result) {// 处理结果echo $result['_id'] . ": " . $result['_source']['field'] . "\n";}
}// 清除滚动查询
$client->clearScroll(['scroll_id' => [$scrollId]]);
遇到的问题
如果不及时清除滚动,数据量过大会遇到以下报错,需要重启OpenSearch
{ Error: [exception] Trying to create too many scroll contexts. Must be less than or equal to: [500]. This limit can be set by changing the [search.max_open_scroll_context] setting.
这篇关于OpenSearch使用scroll滚动搜索实战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!