ClickHousez中如何定时清理过期数据库?

2024-09-02 07:12

本文主要是介绍ClickHousez中如何定时清理过期数据库?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、脚本清理

要在ClickHouse中自动删除过期的数据库,你可以使用ClickHouse的SQL命令结合外部脚本(如Shell脚本)和计划任务(如cron)来实现。下面是一个示例,展示如何创建一个Shell脚本来检查数据库的创建时间,并根据设定的时间阈值来删除过期的数据库。

步骤 1: 创建 Shell 脚本
首先,创建一个Shell脚本,用于检查ClickHouse中的数据库,并根据创建时间来删除过期的数据库。

示例脚本
创建一个名为 delete_expired_databases.sh 的文件,并添加以下内容:

#!/bin/bash

设置要检查的数据库前缀

DATABASE_PREFIX=my_database_

设置过期时间(天)

EXPIRATION_DAYS=30

获取当前时间戳

CURRENT_TIME=$(date +%s)

获取所有符合前缀的数据库

DATABASES= ( c l i c k h o u s e − c l i e n t − − q u e r y " S E L E C T n a m e F R O M s y s t e m . d a t a b a s e s W H E R E n a m e L I K E ′ (clickhouse-client --query "SELECT name FROM system.databases WHERE name LIKE ' (clickhouseclientquery"SELECTnameFROMsystem.databasesWHEREnameLIKEDATABASE_PREFIX%'")

遍历数据库

for DB in KaTeX parse error: Expected 'EOF', got '#' at position 19: …ABASES; do #̲ 获取数据库的创建时间 …(clickhouse-client --query “SELECT created_at FROM system.databases WHERE name = ‘$DB’”)

# 计算时间差
TIME_DIFF=$(( ($CURRENT_TIME - $(date -d "$CREATE_TIME" +%s)) / 86400 ))# 检查是否过期
if [ $TIME_DIFF -gt $EXPIRATION_DAYS ]; thenecho "Database $DB is expired. Deleting..."clickhouse-client --query "DROP DATABASE IF EXISTS $DB"
fi

done
步骤 2: 给脚本添加执行权限
确保脚本具有执行权限:

chmod +x delete_expired_databases.sh
步骤 3: 定期执行脚本
你可以使用Linux的cron来定期执行这个脚本。例如,如果你想每天凌晨2点执行这个脚本,可以将以下行添加到crontab:

用crontab -e 来编辑文件

检查是否安装了crontab命令
rpm -qa | grep crontab
如果提示未安装请自行安装,crontab安装包在系统光盘里面的pacekage文件夹crontabs安装包。执行命令,如下图所示,表示安装了crontab命令

第一次要选择linux编辑crontab方式,一般选择第二个

root@iZuf682dbngh2ck4cq9kluZ:/home/yulei# crontab -e
no crontab for root - using an empty one

Select an editor. To change later, run ‘select-editor’.

  1. /bin/nano <---- easiest
  2. /usr/bin/vim.basic
  3. /usr/bin/vim.tiny
  4. /bin/ed

Choose 1-4 [1]: 2
crontab: installing new crontab
添加cron定时任务
0 2 * * * /path/to/delete_expired_databases.sh

二、JAVA代码定时任务清理机制

1、查询过期的数据库

     Class.forName("ru.yandex.clickhouse.ClickHouseDriver");//一开始必须填一个已经存在的数据库String jdbcUrl = "jdbc:clickhouse://ip:8123/default";ClickHouseProperties properties = new ClickHouseProperties();properties.setUser("default");properties.setPassword("");properties.setSocketTimeout(30000);ClickHouseDataSource dataSou = new ClickHouseDataSource(jdbcUrl, properties);//这是官方给的创建方式ClickHouseConnection conn = dataSou.getConnection();ClickHouseStatement stat = conn.createStatement();ResultSet rs= stat.executeQuery("SELECT name FROM system.databases WHERE name LIKE 'webfunny_db_%'");while(rs.next()) {String dbName = rs.getString("name");if(dbName.contains("_")){String dbNameNew = dbName.substring((dbName.lastIndexOf("_") + 1), dbName.length());//20240222152127819String thirdDaysDate = DateUtil.getTimeStampByDays(30);if (FebsUtil.match("\\-?\\d+", dbNameNew) && Long.parseLong(dbNameNew) < Long.parseLong(thirdDaysDate)){deleteCHDbNameList.add(dbName);}}}//打开创建的数据库stat.close();conn.close();

2、清理过期的数据库

     Class.forName("ru.yandex.clickhouse.ClickHouseDriver");//一开始必须填一个已经存在的数据库String jdbcUrl = "jdbc:clickhouse://ip:8123/default";ClickHouseProperties properties = new ClickHouseProperties();properties.setUser("default");properties.setPassword("");properties.setSocketTimeout(30000);ClickHouseDataSource dataSou = new ClickHouseDataSource(jdbcUrl, properties);//这是官方给的创建方式ClickHouseConnection conn = dataSou.getConnection();ClickHouseStatement stat = conn.createStatement();for (String dbName : deleteCHDbNameList) {stat.execute("DROP DATABASE IF EXISTS " + dbName);}//打开创建的数据库stat.close();conn.close();

注意事项
备份数据:在执行任何删除操作之前,请确保你已经备份了重要数据。
测试脚本:在生产环境中执行任何脚本之前,请务必在测试环境中彻底测试。
权限管理:确保执行脚本的用户有足够的权限来删除数据库。
监控和日志:设置适当的监控和日志记录,以便追踪删除操作的状态和结果。

好了感兴趣的同学可以直接访问webfunny进行实践操作
在这里插入图片描述

这篇关于ClickHousez中如何定时清理过期数据库?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1129342

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

深入理解数据库的 4NF:多值依赖与消除数据异常

在数据库设计中, "范式" 是一个常常被提到的重要概念。许多初学者在学习数据库设计时,经常听到第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及 BCNF(Boyce-Codd范式)。这些范式都旨在通过消除数据冗余和异常来优化数据库结构。然而,当我们谈到 4NF(第四范式)时,事情变得更加复杂。本文将带你深入了解 多值依赖 和 4NF,帮助你在数据库设计中消除更高级别的异常。 什么是

DM8数据库安装后配置

1 前言 在上篇文章中,我们已经成功将库装好。在安装完成后,为了能够更好地满足应用需求和保障系统的安全稳定运行,通常需要进行一些基本的配置。下面是一些常见的配置项: 数据库服务注册:默认包含14个功能模块,将这些模块注册成服务后,可以更好的启动和管理这些功能;基本的实例参数配置:契合应用场景和发挥系统的最大性能;备份:有备无患;… 2 注册实例服务 注册了实例服务后,可以使用系统服务管理,

速了解MySQL 数据库不同存储引擎

快速了解MySQL 数据库不同存储引擎 MySQL 提供了多种存储引擎,每种存储引擎都有其特定的特性和适用场景。了解这些存储引擎的特性,有助于在设计数据库时做出合理的选择。以下是 MySQL 中几种常用存储引擎的详细介绍。 1. InnoDB 特点: 事务支持:InnoDB 是一个支持 ACID(原子性、一致性、隔离性、持久性)事务的存储引擎。行级锁:使用行级锁来提高并发性,减少锁竞争

开源分布式数据库中间件

转自:https://www.csdn.net/article/2015-07-16/2825228 MyCat:开源分布式数据库中间件 为什么需要MyCat? 虽然云计算时代,传统数据库存在着先天性的弊端,但是NoSQL数据库又无法将其替代。如果传统数据易于扩展,可切分,就可以避免单机(单库)的性能缺陷。 MyCat的目标就是:低成本地将现有的单机数据库和应用平滑迁移到“云”端

ORACLE 11g 创建数据库时 Enterprise Manager配置失败的解决办法 无法打开OEM的解决办法

在win7 64位系统下安装oracle11g,在使用Database configuration Assistant创建数据库时,在创建到85%的时候报错,错误如下: 解决办法: 在listener.ora中增加对BlueAeri-PC或ip地址的侦听,具体步骤如下: 1.启动Net Manager,在“监听程序”--Listener下添加一个地址,主机名写计

ActiveMQ—消息特性(延迟和定时消息投递)

ActiveMQ消息特性:延迟和定时消息投递(Delay and Schedule Message Delivery) 转自:http://blog.csdn.net/kimmking/article/details/8443872 有时候我们不希望消息马上被broker投递出去,而是想要消息60秒以后发给消费者,或者我们想让消息没隔一定时间投递一次,一共投递指定的次数。。。 类似

MyBatis 切换不同的类型数据库方案

下属案例例当前结合SpringBoot 配置进行讲解。 背景: 实现一个工程里面在部署阶段支持切换不同类型数据库支持。 方案一 数据源配置 关键代码(是什么数据库,该怎么配就怎么配) spring:datasource:name: test# 使用druid数据源type: com.alibaba.druid.pool.DruidDataSource# @需要修改 数据库连接及驱动u