Clickhouse中物化视图和位图和索引的用法

2024-05-08 20:52

本文主要是介绍Clickhouse中物化视图和位图和索引的用法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 聚合函数
  • 表引擎AggregatingMergeTree
  • 物化视图
  • 位图
  • Clickhouse实现数据的有限更新
  • 索引

聚合函数

例如 max(val) , argMax(arg,val)
如果在聚合函数后面加入后缀if,则是
maxIf(val,UInt8)
argMaxIf(arg,val,UInt8)
也就是当满足某个条件时候,才会对这一行数据进行函数处理。
例如:
字段:is_deleted AggregateFunction(argMaxIf, Int32, Int64, UInt8)
该字段插入数据:

insert into table A
slect 
argMaxIfState(is_deleted, event_behavior_timestamp, isNotNull(is_deleted)) AS is_deleted
from B

表引擎AggregatingMergeTree

该引擎继承自MergeTree,改变了数据部分合并的逻辑。ClickHouse将所有具有相同主键的行替换为存储聚合函数状态组合的单行。
您可以使用AggregatingMergeTree表进行增量数据聚合,包括聚合的物化视图。
使用该引擎的表中,除了主键外其余使用 AggregateFunction、SimpleAggregateFunction数据类型

AggregateFunction 是数据类型,第一个参数是使用的聚合函数名称,后面多个参数是聚合函数传入参数的类型。如果加入if后缀,则多出一个参数类型UInt8

聚合函数可以具有实现定义的中间状态,该状态可以序列化为AggregateFunction(…)数据类型,并通常通过物化视图存储在表中。生成聚合函数状态的常用方法是调用带有-State后缀的聚合函数。要在将来获得聚合的最终结果,必须使用带- mergessuffix的相同聚合函数。

CREATE TABLE test.agg_visits (StartDate DateTime64 NOT NULL,CounterID UInt64,Visits AggregateFunction(sum, Nullable(Int32)),Users AggregateFunction(uniq, Nullable(Int32))
)
ENGINE = AggregatingMergeTree() ORDER BY (StartDate, CounterID);

向表agg_visits 插入数据,根据group by进行聚合,聚合表存储聚合函数列的状态值,需要在对应的聚合函数上加入后缀State,例如sumState

insert into table test.agg_visits
SELECTStartDate,CounterID,sumState(Sign) AS Visits,uniqState(UserID) AS Users
FROM test.visits
GROUP BY StartDate, CounterID;

查看 test.agg_visits表数据,对应的聚合数据要儒后缀 Merge,例如sumMerge

SELECTStartDate,sumMerge(Visits) AS Visits,uniqMerge(Users) AS Users
FROM test.agg_visits
GROUP BY StartDate
ORDER BY StartDate;
-- 因为存储的是聚合函数的中间状态,所以不加group by的时候,是全局聚合。当插入数据的时候,存储的是以StartDate, CounterID分组下聚合函数的状态值,在查询的时候使用group by StartDate,则会对聚合函数状态下的值进行按照StartDate分组进行聚合函数。
-- 如果查询时使用group by StartDate,CounterID,aa 那么查出的时候也是按照StartDate,CounterID分组的,而不是StartDate,CounterID,aa。
-- 因为聚合表在建表的时候已经决定了存储主键相同下的聚合函数的中间状态值
SELECTsumMerge(Visits) AS Visits,uniqMerge(Users) AS Users
FROM test.agg_visits

物化视图

创建物化视图,物化视图和普通视图区别是,物化视图是存储数据得,并且可以动态得监听底表数据变化,并将变化得数据写入物化视图中。而普通视图是不存储数据的

CREATE MATERIALIZED VIEW test.visits_mv TO test.agg_visits
AS SELECTStartDate,CounterID,sumState(Sign) AS Visits,uniqState(UserID) AS Users
FROM test.visits
GROUP BY StartDate, CounterID;

视图visits_mv 是基于表agg_visits之上建立的,并将数据插入agg_visits和视图visits_mv。
底表是visits,当底表数据变化时候,agg_visits和visits_mv 会进行自动更新数据。
当直接向agg_visits插入数据,那么当底表visits插入了一条新数据时候,只能手动去更新agg_visits表数据,不能主动识别

生产例子

CREATE MATERIALIZED VIEW app.app_eap_entity_member_de_153578 TO app.app_eap_entity_member_aggregate_de_153578
AS
SELECTaliuid_info_final AS aliuid_info,aliuid_info_value_timestamp,birthday_final AS birthday,birthday_value_timestamp,cre_date_final AS cre_date,cre_date_value_timestamp,creator_final AS creator,creator_value_timestamp,creator_name_final AS creator_name,creator_name_value_timestamp,creator_store_final AS creator_store,creator_store_value_timestamp,data_trace_id_final AS data_trace_id,data_trace_id_value_timestamp,wechat_type_final AS wechat_type,wechat_type_value_timestamp,dt_final AS dt,version_timestamp_final AS version_timestamp,version,is_deleted_final AS is_deleted
FROM 
(SELECTargMaxIfState(event_behavior_timestamp, event_behavior_timestamp, isNotNull(aliuid_info)) AS aliuid_info_value_timestamp,argMaxIfState(aliuid_info, event_behavior_timestamp, isNotNull(aliuid_info)) AS aliuid_info_final,argMaxIfState(event_behavior_timestamp, event_behavior_timestamp, isNotNull(manager_name)) AS manager_name_value_timestamp,argMaxIfState(manager_name, event_behavior_timestamp, isNotNull(manager_name)) AS manager_name_final,argMaxIfState(event_behavior_timestamp, event_behavior_timestamp, isNotNull(member_creator)) AS member_creator_value_timestamp,argMaxIfState(member_creator, event_behavior_timestamp, isNotNull(member_creator)) AS member_creator_final,pguid AS pguid,argMaxIfState(event_behavior_timestamp, event_behavior_timestamp, isNotNull(wechat_type)) AS wechat_type_value_timestamp,argMaxIfState(wechat_type, event_behavior_timestamp, isNotNull(wechat_type)) AS wechat_type_final,argMaxIfState(dt, event_behavior_timestamp, isNotNull(dt)) AS dt_final,argMaxIfState(version_timestamp, event_behavior_timestamp, isNotNull(version_timestamp)) AS version_timestamp_final,maxState(event_behavior_timestamp) AS version,argMaxIfState(is_deleted, event_behavior_timestamp, isNotNull(is_deleted)) AS is_deleted_finalFROM app.app_eap_entity_member_log_de_153578GROUP BY pguid
)
CREATE TABLE app.app_eap_entity_member_aggregate_de_153578
(`aliuid_info` AggregateFunction(argMaxIf, Nullable(String), Int64, UInt8),`aliuid_info_value_timestamp` AggregateFunction(argMaxIf, Int64, Int64, UInt8),`birthday` AggregateFunction(argMaxIf, Nullable(String), Int64, UInt8),`pguid` Int64,`wechat_type` AggregateFunction(argMaxIf, Nullable(Int32), Int64, UInt8),`wechat_type_value_timestamp` AggregateFunction(argMaxIf, Int64, Int64, UInt8),`dt` AggregateFunction(argMaxIf, String, Int64, UInt8),`version_timestamp` AggregateFunction(argMaxIf, Int64, Int64, UInt8),`version` AggregateFunction(max, Int64),`is_deleted` AggregateFunction(argMaxIf, Int32, Int64, UInt8)
)
ENGINE = ReplicatedAggregatingMergeTree('/clickhouse/tables/{shard}/app/app_eap_entity_member_aggregate_de_153578', '{replica}')
PARTITION BY xxHash64(pguid) % 10
ORDER BY pguid
SETTINGS index_granularity = 8192, only_allow_select_statement = 0
CREATE TABLE app.app_eap_entity_member_log_de_153578
(`event_data_id` String,`aliuid_info` Nullable(String),`birthday` Nullable(String),`cre_date` Nullable(Int64),`creator` Nullable(String),`creator_name` Nullable(String),`pguid` Int64,`takeover_time` Nullable(Int64),`version_timestamp` Int64,`is_deleted` Int32 DEFAULT 0,`dt` String
)
ENGINE = ReplicatedMergeTree('/clickhouse/tables/{shard}/app/app_eap_entity_member_log_de_153578', '{replica}')
PARTITION BY (tenant_channel, substring(dt, 1, 4))
ORDER BY (event_behavior_id, event_data_id)
SETTINGS index_granularity = 8192, only_allow_select_statement = 0

位图

https://blog.csdn.net/weixin_39025362/article/details/110390251

Clickhouse实现数据的有限更新

https://www.modb.pro/db/61195

selectarrayJoin(bitmapToArray(groupBitmapAndState(pguid))) as pguid,'user_tag_huiyuan','L0','${start_date2}','all','all'from (select  bitmapBuild(groupArray(toUInt64(pguid))) as pguidfrom(select pguid from app.app_eap_entity_member_aggregate_degroup by pguidhaving argMaxIfMerge(user_status) in (  0  )and argMaxIfMerge(is_deleted) =  0))

索引

京东零售解决方案

既然有了ES,为何还用ClickHouse——从原理万字总结ClickHouse为何这么快

Clickhouse 索引原理

这篇关于Clickhouse中物化视图和位图和索引的用法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/971406

相关文章

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

bytes.split的用法和注意事项

当然,我很乐意详细介绍 bytes.Split 的用法和注意事项。这个函数是 Go 标准库中 bytes 包的一个重要组成部分,用于分割字节切片。 基本用法 bytes.Split 的函数签名如下: func Split(s, sep []byte) [][]byte s 是要分割的字节切片sep 是用作分隔符的字节切片返回值是一个二维字节切片,包含分割后的结果 基本使用示例: pa

数据视图(AngularJS)

<!DOCTYPE html><html ng-app="home.controller"><head><meta charset="utf-8"><title>数据视图</title><link href="page/common/css/bootstrap.min.css" rel="stylesheet"><script src="page/common/js/angular.js"></

【Go】go连接clickhouse使用TCP协议

离开你是傻是对是错 是看破是软弱 这结果是爱是恨或者是什么 如果是种解脱 怎么会还有眷恋在我心窝 那么爱你为什么                      🎵 黄品源/莫文蔚《那么爱你为什么》 package mainimport ("context""fmt""log""time""github.com/ClickHouse/clickhouse-go/v2")func main(

UVM:callback机制的意义和用法

1. 作用         Callback机制在UVM验证平台,最大用处就是为了提高验证平台的可重用性。在不创建复杂的OOP层次结构前提下,针对组件中的某些行为,在其之前后之后,内置一些函数,增加或者修改UVM组件的操作,增加新的功能,从而实现一个环境多个用例。此外还可以通过Callback机制构建异常的测试用例。 2. 使用步骤         (1)在UVM组件中内嵌callback函

哈希表的封装和位图

文章目录 2 封装2.1 基础框架2.2 迭代器(1)2.3 迭代器(2) 3. 位图3.1 问题引入3.2 左移和右移?3.3 位图的实现3.4 位图的题目3.5 位图的应用 2 封装 2.1 基础框架 文章 有了前面map和set封装的经验,容易写出下面的代码 // UnorderedSet.h#pragma once#include "HashTable.h"

这些ES6用法你都会吗?

一 关于取值 取值在程序中非常常见,比如从对象obj中取值 const obj = {a:1b:2c:3d:4} 吐槽: const a = obj.a;const b = obj.b;const c = obj.c;//或者const f = obj.a + obj.b;const g = obj.c + obj.d; 改进:用ES6解构赋值

贝壳面试:什么是回表?什么是索引下推?

尼恩说在前面 在40岁老架构师 尼恩的读者交流群(50+)中,最近有小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、希音、百度、网易、美团的面试资格,遇到很多很重要的面试题: 1.谈谈你对MySQL 索引下推 的认识? 2.在MySQL中,索引下推 是如何实现的?请简述其工作原理。 3、说说什么是 回表,什么是 索引下推 ? 最近有小伙伴在面试 贝壳、soul,又遇到了相关的

Mysql高级篇(中)——索引介绍

Mysql高级篇(中)——索引介绍 一、索引本质二、索引优缺点三、索引分类(1)按数据结构分类(2)按功能分类(3) 按存储引擎分类(4) 按存储方式分类(5) 按使用方式分类 四、 索引基本语法(1)创建索引(2)查看索引(3)删除索引(4)ALTER 关键字创建/删除索引 五、适合创建索引的情况思考题 六、不适合创建索引的情况 一、索引本质 索引本质 是 一种数据结构,它用

2021-8-14 react笔记-2 创建组件 基本用法

1、目录解析 public中的index.html为入口文件 src目录中文件很乱,先整理文件夹。 新建components 放组件 新建assets放资源   ->/images      ->/css 把乱的文件放进去  修改App.js 根组件和index.js入口文件中的引入路径 2、新建组件 在components文件夹中新建[Name].js文件 //组件名首字母大写