Databend 的安装配置和使用

2024-01-06 09:44
文章标签 配置 安装 使用 databend

本文主要是介绍Databend 的安装配置和使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

介绍

Databend 是一个内置在 Rust 中的开源、弹性和工作负载感知的云数据仓库,为 Snowflake 提供了具有成本效益的替代方案,专门对最大的数据集进行复杂分析而设计。

性能

  • 在存储对象上,能快速进行数据分析。
  • 没有索引和分区,但也能快速查询。
  • 利用数据级并行和指令级并行技术实现最佳性能。

数据操作

  • 支持原子操作,如SELECTINSERTDELETEUPDATEREPLACECOPYMERGE
  • 提供高级功能,如时间旅行和多目录(Apache Hive / Apache Iceberg)。
  • 支持以 CSV、JSON 和 Parquet 等各种格式。
  • 支持半结构化数据类型,如 ARRAY、MAP 和 JSON 。
  • 支持类似 Git 的 MVCC 存储,以便于查询、克隆和恢复历史数据。

对象存储

  • Amazon S3
  • Azure Blob Storage
  • Google Cloud Storage
  • MinIO
  • Ceph
  • Wasabi
  • SeaweedFS
  • Cloudflare R2
  • Tencent COS
  • Alibaba OSS
  • QingCloud QingStor

Databend 的高级架构由meta-service layerquery layerstorage layer组成。

meta-service layer(元服务层)有效地支持多个租户,该层在系统中发挥着至关重要的作用:

  • 元数据管理:处理数据库、表、集群、事务等的元数据。
  • 安全性:管理安全环境的用户身份验证和授权。

query layer(查询层)处理查询计算,由多个集群组成,每个集群包含多个节点。每个节点是查询层中的核心单元,由以下部分组成:

  • 规划师:使用来自的元素为SQL语句制定执行计划关系代数,结合了投影、滤波器和限位等运算符。
  • 优化器:基于规则的优化器应用预定义规则,如“谓词下推”和“未使用列的修剪”,以优化查询执行。
  • 处理器:遵循 Pull & Push 方法,根据规划师指令构建查询执行管道。处理器相互连接,形成一个可以分布在节点之间的管道,以提高性能。

storage layer采用开源柱状格式 Parquet ,并引入了自己的表格格式,以提高查询性能。主要功能包括:

  • 二级索引:加快各种分析维度的数据位置和访问速度。
  • 复杂数据类型索引:旨在加快半结构化数据等复杂类型的数据处理和分析。
  • :Databend 有效地将数据组织成段,提高数据管理和检索效率。
  • 集群:在段内使用用户定义的集群密钥来简化数据扫描。

安装和配置

Databend 官网:https://databend.rs/doc/integrations/access-tool/mysql

Databend 下载:https://databend.rs/download

本地部署,使用 JDBC 驱动程序连接 Databend 步骤如下:

  1. 根据官网下载地址,选择与自己电脑版本对应的,下载解压后可以看到以下系列文件。
    在这里插入图片描述

  2. 将文件 databend-query.toml 中的以下部分注释取消。
    在这里插入图片描述

  3. 在文件夹脚本中运行脚本**start.sh,打开进入该文件目录中终端执行 ./scripts/start.sh

  4. 在DBeaver中,选择数据库>驱动程序管理器以打开驱动程序管理器,然后单击新建以创建新驱动程序。

在这里插入图片描述
根据上图片,添加设置相关信息如下图:

在这里插入图片描述

  1. 在“”选项卡上,单击“添加工件”,然后将以下内容复制并粘贴到“**依赖项声明”**文本框中,点击确定即可。
<dependency><groupId>com.databend</groupId><artifactId>databend-jdbc</artifactId><version>0.0.8</version>
</dependency>

在这里插入图片描述

  1. 使用前面添加的驱动,连接本地的 Databend 。
    在这里插入图片描述

相关扩展

Databend支持的工具、平台和编程语言如下:

在这里插入图片描述

可以查看对应的工具和编程语言,了解更多用法。

参考资料

  • Databend 官网
  • Databend 下载
  • Docker和本地部署
  • 通过JDBC连接到Databend
  • Databend生态系统

这篇关于Databend 的安装配置和使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/575945

相关文章

Zookeeper安装和配置说明

一、Zookeeper的搭建方式 Zookeeper安装方式有三种,单机模式和集群模式以及伪集群模式。 ■ 单机模式:Zookeeper只运行在一台服务器上,适合测试环境; ■ 伪集群模式:就是在一台物理机上运行多个Zookeeper 实例; ■ 集群模式:Zookeeper运行于一个集群上,适合生产环境,这个计算机集群被称为一个“集合体”(ensemble) Zookeeper通过复制来实现

CentOS7安装配置mysql5.7 tar免安装版

一、CentOS7.4系统自带mariadb # 查看系统自带的Mariadb[root@localhost~]# rpm -qa|grep mariadbmariadb-libs-5.5.44-2.el7.centos.x86_64# 卸载系统自带的Mariadb[root@localhost ~]# rpm -e --nodeps mariadb-libs-5.5.44-2.el7

Centos7安装Mongodb4

1、下载源码包 curl -O https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-4.2.1.tgz 2、解压 放到 /usr/local/ 目录下 tar -zxvf mongodb-linux-x86_64-rhel70-4.2.1.tgzmv mongodb-linux-x86_64-rhel70-4.2.1/

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

hadoop开启回收站配置

开启回收站功能,可以将删除的文件在不超时的情况下,恢复原数据,起到防止误删除、备份等作用。 开启回收站功能参数说明 (1)默认值fs.trash.interval = 0,0表示禁用回收站;其他值表示设置文件的存活时间。 (2)默认值fs.trash.checkpoint.interval = 0,检查回收站的间隔时间。如果该值为0,则该值设置和fs.trash.interval的参数值相等。

NameNode内存生产配置

Hadoop2.x 系列,配置 NameNode 内存 NameNode 内存默认 2000m ,如果服务器内存 4G , NameNode 内存可以配置 3g 。在 hadoop-env.sh 文件中配置如下。 HADOOP_NAMENODE_OPTS=-Xmx3072m Hadoop3.x 系列,配置 Nam

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传