Elasticsearch:Bucket script 聚合

2023-11-24 22:59

本文主要是介绍Elasticsearch:Bucket script 聚合,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 Bucket script 聚合是一个父管道(parent pipeline)聚合,它执行一个脚本,该脚本可以对父多桶聚合中的指定指标执行每个桶的计算。 指定的指标必须是数字,并且脚本必须返回一个数值。有关 pipeline 聚合的内容,你可以阅读文章 “Elasticsearch:pipeline aggregation 介绍”。

Bucket script 聚合

用法

单独的 bucket_script 聚合看起来像这样:

{"bucket_script": {"buckets_path": {"my_var1": "the_sum",                     "my_var2": "the_value_count"},"script": "params.my_var1 / params.my_var2"}
}

这里,my_var1 是要在脚本中使用的存储桶路径的变量名称,the_sum 是要用于该变量的指标的路径。

Bucket_script 参数说明
参数名称描述强制要求默认值
script为此聚合运行的脚本。 该脚本可以是内联的、文件的或索引的。 (有关详细信息,请参阅脚本)必须
buckets_path脚本变量的映射及其到我们希望用于变量的存储桶的关联路径(有关更多详细信息,请参见 buckets_path 语法)必须
gap_policy在数据中发现差距时应用的策略(有关详细信息,请参阅处理数据中的差距)可选skip
format输出值的 DecimalFormat 模式。 如果指定,则在聚合的 value_as_string 属性中返回格式化的值可选null

在以下的展示中,我使用 Elastic Stack 8.4.3 来进行展示。

示例

为了说明问题的方便,我们来使用一个示例来进行详细说明。我将使用 Kibana 自带的 eCommerce 索引进行展示。我们的目的是:找出每天销售的 Men's Clothing 这个类别的销售额在总体销售额中的比例

在本练习中,我们使用 Kibana 自带的一个例子来进行展示:

这样我能就在 Elasticsearch 中创建了一个叫做 kibana_sample_data_ecommerce 的索引。这个一个 eCommerce 的数据。我们可以在 Discover 中进行查看:

如上所示,上面的数据展示的是从 10 月 20 号到 10 月 31 号的数据。

我们可以使用 Lens 来展示每天的文档数:

如上所示,每天都有一定数量的文档。上面的聚合相当于如下的命令:

GET kibana_sample_data_ecommerce/_search
{"size": 0,"aggs": {"sales_per_day": {"date_histogram": {"field": "order_date","calendar_interval": "day"}}}
}

 上面的聚合返回如下的数据:

我们可以通过如下的命令来得到每天的总销售额:

GET kibana_sample_data_ecommerce/_search?filter_path=aggregations
{"size": 0,"aggs": {"sales_per_day": {"date_histogram": {"field": "order_date","calendar_interval": "day"},"aggs": {"total_sales": {"sum": {"field": "products.base_price"}}}}}
}

如上所示,我们求出了每天销售的总额。为了能够求出每天卖出的 Men's clothing 这个类别的总额,我们可以使用另外一个叫做 filter 的聚合: 

GET kibana_sample_data_ecommerce/_search?filter_path=aggregations
{"size": 0,"aggs": {"sales_per_day": {"date_histogram": {"field": "order_date","calendar_interval": "day"},"aggs": {"total_sales": {"sum": {"field": "products.base_price"}},"man's_clothing": {"filter": {"term": {"category.keyword": "Men's Clothing"}},"aggs": {"sales": {"sum": {"field": "products.base_price"}}}}}}}
}

如上所示,我们至此求出了 Men's Clothing 这个类别的每天的销售总额。

我们接下来使用 bucket script 聚合来求出每天的 Men's Clothing 这个类别的总额和当天销售总额的百分比:

GET kibana_sample_data_ecommerce/_search?filter_path=aggregations
{"size": 0,"aggs": {"sales_per_day": {"date_histogram": {"field": "order_date","calendar_interval": "day"},"aggs": {"total_sales": {"sum": {"field": "products.base_price"}},"man's_clothing": {"filter": {"term": {"category.keyword": "Men's Clothing"}},"aggs": {"sales": {"sum": {"field": "products.base_price"}}}},"man's_clothing_percentage": {"bucket_script": {"buckets_path": {"mans_clothing": "man's_clothing>sales","total_sales": "total_sales"},"script": "params.mans_clothing / params.total_sales * 100"}}}}}
}

在上面的 man's_clothing_percentage 聚合中,它使用了其它聚合的结果并算出新的聚合的值。这种聚合被称之为 pipeline 聚合。 特别需要指出的是 man's_clothing>sales 不是布尔比较大小的算式,而是引用聚合值的路径。

如上所示,我们可以看到每天的 Men's Clothing 的销售额的百分比。

这篇关于Elasticsearch:Bucket script 聚合的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/422696

相关文章

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

javascript中break与continue的区别

在javascript中,break是结束整个循环,break下面的语句不再执行了 for(let i=1;i<=5;i++){if(i===3){break}document.write(i) } 上面的代码中,当i=1时,执行打印输出语句,当i=2时,执行打印输出语句,当i=3时,遇到break了,整个循环就结束了。 执行结果是12 continue语句是停止当前循环,返回从头开始。

【JavaScript】LeetCode:16-20

文章目录 16 无重复字符的最长字串17 找到字符串中所有字母异位词18 和为K的子数组19 滑动窗口最大值20 最小覆盖字串 16 无重复字符的最长字串 滑动窗口 + 哈希表这里用哈希集合Set()实现。左指针i,右指针j,从头遍历数组,若j指针指向的元素不在set中,则加入该元素,否则更新结果res,删除集合中i指针指向的元素,进入下一轮循环。 /*** @param

Jenkins构建Maven聚合工程,指定构建子模块

一、设置单独编译构建子模块 配置: 1、Root POM指向父pom.xml 2、Goals and options指定构建模块的参数: mvn -pl project1/project1-son -am clean package 单独构建project1-son项目以及它所依赖的其它项目。 说明: mvn clean package -pl 父级模块名/子模块名 -am参数

script中的src

<script src="http://www.somewhere.com/afile.js"></script> 浏览器在解析这个资源时,会向 src 属性指定的路径发送一个 GET 请求,以取得相应资源,假定 是一个 JavaScript 文件。这个初始的请求不受浏览器同源策略限制,但返回并被执行的 JavaScript 则受限制。 当然,这个请求仍然受父页面 HTTP/HTTPS

深入探讨:ECMAScript与JavaScript的区别

在前端开发的世界中,JavaScript无疑是最受欢迎的编程语言之一。然而,很多开发者在使用JavaScript时,可能并不清楚ECMAScript与JavaScript之间的关系和区别。本文将深入探讨这两者的不同之处,并通过案例帮助大家更好地理解。 一、什么是ECMAScript? ECMAScript(简称ES)是一种脚本语言的标准,由ECMA国际组织制定。它定义了语言的语法、类型、语句、

JavaScript整理笔记

JavaScript笔记 JavaScriptJavaScript简介快速入门JavaScript用法基础语法注释关键字显示数据输出innerHTML innerText属性返回值的区别调试 数据类型和变量数据类型数字(Number)字符串(String)布尔值(Boolean)null(空值)和undefined(未定义)数组(Array)对象(Object)函数(Function) 变量

JavaScript中document.cookie

“某些 Web 站点在您的硬盘上用很小的文本文件存储了一些信息,这些文件就称为 Cookie。”—— MSIE 帮助。一般来说,Cookies 是 CGI 或类似,比 HTML 高级的文件、程序等创建的,但是 javascript 也提供了对 Cookies 的很全面的访问权利。       每个 Cookie 都是这样的:<cookie名>=<值>   <cookie名>的限制与 javasc

javascript实现ajax

什么是 ajax ajax 即“Asynchronous JavaScript and XML”(异步 JavaScript 和 XML),也就是无刷新数据读取。 http 请求 首先需要了解 http 请求的方法(GET 和 POST)。 GET 用于获取数据。GET 是在 URL 中传递数据,它的安全性低,容量低。 POST 用于上传数据。POST 安全性一般,容量几乎无限。 aj

【JavaScript】LeetCode:21-25

文章目录 21 最大子数组和22 合并区间23 轮转数组24 除自身以外数组的乘积25 缺失的第一个正数 21 最大子数组和 贪心 / 动态规划贪心:连续和(count)< 0时,放弃当前起点的连续和,将下一个数作为新起点,这里提供使用贪心算法解决本题的代码。动态规划:dp[i]:以nums[i]为结尾的最长连续子序列(子数组)和。 dp[i] = max(dp[i - 1]