Databend 的安装配置和使用

2024-01-06 09:44

文章标签 配置安装使用 databend

本文主要是介绍Databend 的安装配置和使用，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

介绍

Databend 是一个内置在 Rust 中的开源、弹性和工作负载感知的云数据仓库，为 Snowflake 提供了具有成本效益的替代方案，专门对最大的数据集进行复杂分析而设计。

性能：

在存储对象上，能快速进行数据分析。
没有索引和分区，但也能快速查询。
利用数据级并行和指令级并行技术实现最佳性能。

数据操作：

支持原子操作，如SELECT、INSERT、DELETE、UPDATE、REPLACE、COPY和MERGE。
提供高级功能，如时间旅行和多目录（Apache Hive / Apache Iceberg）。
支持以 CSV、JSON 和 Parquet 等各种格式。
支持半结构化数据类型，如 ARRAY、MAP 和 JSON 。
支持类似 Git 的 MVCC 存储，以便于查询、克隆和恢复历史数据。

对象存储：

Amazon S3
Azure Blob Storage
Google Cloud Storage
MinIO
Ceph
Wasabi
SeaweedFS
Cloudflare R2
Tencent COS
Alibaba OSS
QingCloud QingStor

Databend 的高级架构由meta-service layer、query layer和storage layer组成。

meta-service layer(元服务层)有效地支持多个租户，该层在系统中发挥着至关重要的作用：

元数据管理：处理数据库、表、集群、事务等的元数据。
安全性：管理安全环境的用户身份验证和授权。

query layer(查询层)处理查询计算，由多个集群组成，每个集群包含多个节点。每个节点是查询层中的核心单元，由以下部分组成：

规划师：使用来自的元素为SQL语句制定执行计划关系代数，结合了投影、滤波器和限位等运算符。
优化器：基于规则的优化器应用预定义规则，如“谓词下推”和“未使用列的修剪”，以优化查询执行。
处理器：遵循 Pull & Push 方法，根据规划师指令构建查询执行管道。处理器相互连接，形成一个可以分布在节点之间的管道，以提高性能。

storage layer采用开源柱状格式 Parquet ，并引入了自己的表格格式，以提高查询性能。主要功能包括：

二级索引：加快各种分析维度的数据位置和访问速度。
复杂数据类型索引：旨在加快半结构化数据等复杂类型的数据处理和分析。
段：Databend 有效地将数据组织成段，提高数据管理和检索效率。
集群：在段内使用用户定义的集群密钥来简化数据扫描。

安装和配置

Databend 官网：https://databend.rs/doc/integrations/access-tool/mysql

Databend 下载：https://databend.rs/download

本地部署，使用 JDBC 驱动程序连接 Databend 步骤如下：

根据官网下载地址，选择与自己电脑版本对应的，下载解压后可以看到以下系列文件。
将文件 databend-query.toml 中的以下部分注释取消。
在文件夹脚本中运行脚本**start.sh，打开进入该文件目录中终端执行 ./scripts/start.sh。
在DBeaver中，选择数据库>驱动程序管理器以打开驱动程序管理器，然后单击新建以创建新驱动程序。

在这里插入图片描述
根据上图片，添加设置相关信息如下图：

在这里插入图片描述

在“库”选项卡上，单击“添加工件”，然后将以下内容复制并粘贴到“**依赖项声明”**文本框中，点击确定即可。

<dependency><groupId>com.databend</groupId><artifactId>databend-jdbc</artifactId><version>0.0.8</version>
</dependency>

在这里插入图片描述

使用前面添加的驱动，连接本地的 Databend 。

相关扩展

Databend支持的工具、平台和编程语言如下：

在这里插入图片描述

可以查看对应的工具和编程语言，了解更多用法。

参考资料

Databend 官网
Databend 下载
Docker和本地部署
通过JDBC连接到Databend
Databend生态系统

这篇关于Databend 的安装配置和使用的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/575945。 23002807@qq.com

相关文章

解决Maven项目idea找不到本地仓库jar包问题以及使用mvn install:install-file

解决Maven项目idea找不到本地仓库jar包问题以及使用mvn install:install-file

《解决Maven项目idea找不到本地仓库jar包问题以及使用mvninstall:install-file》：本文主要介绍解决Maven项目idea找不到本地仓库jar包问题以及使用mvnin... 目录Maven项目idea找不到本地仓库jar包以及使用mvn install:install-file基

阅读更多...

如何为Yarn配置国内源的详细教程

如何为Yarn配置国内源的详细教程

《如何为Yarn配置国内源的详细教程》在使用Yarn进行项目开发时,由于网络原因,直接使用官方源可能会导致下载速度慢或连接失败,配置国内源可以显著提高包的下载速度和稳定性,本文将详细介绍如何为Yarn... 目录一、查询当前使用的镜像源二、设置国内源1. 设置为淘宝镜像源2. 设置为其他国内源三、还原为官方

阅读更多...

最详细安装 PostgreSQL方法及常见问题解决

最详细安装 PostgreSQL方法及常见问题解决

《最详细安装PostgreSQL方法及常见问题解决》：本文主要介绍最详细安装PostgreSQL方法及常见问题解决,介绍了在Windows系统上安装PostgreSQL及Linux系统上安装Po... 目录一、在 Windows 系统上安装 PostgreSQL1. 下载 PostgreSQL 安装包2.

阅读更多...

Python使用getopt处理命令行参数示例解析(最佳实践)

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数？getopt模块基础实际应用示例与其他参数处理方式的比较常见问http

阅读更多...

C 语言中enum枚举的定义和使用小结

C 语言中enum枚举的定义和使用小结

《C语言中enum枚举的定义和使用小结》在C语言里,enum（枚举）是一种用户自定义的数据类型,它能够让你创建一组具名的整数常量,下面我会从定义、使用、特性等方面详细介绍enum,感兴趣的朋友一起看... 目录1、引言2、基本定义3、定义枚举变量4、自定义枚举常量的值5、枚举与switch语句结合使用6、枚

阅读更多...

使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)

使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)

《使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)》PPT是一种高效的信息展示工具,广泛应用于教育、商务和设计等多个领域,PPT文档中常常包含丰富的图片内容,这些图片不仅提升了... 目录一、引言二、环境与工具三、python 提取PPT背景图片3.1 提取幻灯片背景图片3.2 提取

阅读更多...

Maven如何手动安装依赖到本地仓库

Maven如何手动安装依赖到本地仓库

《Maven如何手动安装依赖到本地仓库》：本文主要介绍Maven如何手动安装依赖到本地仓库问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、下载依赖二、安装 JAR 文件到本地仓库三、验证安装四、在项目中使用该依赖1、注意事项2、额外提示总结一、下载依赖登

阅读更多...

CentOS7更改默认SSH端口与配置指南

CentOS7更改默认SSH端口与配置指南

《CentOS7更改默认SSH端口与配置指南》SSH是Linux服务器远程管理的核心工具,其默认监听端口为22,由于端口22众所周知,这也使得服务器容易受到自动化扫描和暴力破解攻击,本文将系统性地介绍... 目录引言为什么要更改 SSH 默认端口？步骤详解：如何更改 Centos 7 的 SSH 默认端口1

阅读更多...

使用Python实现图像LBP特征提取的操作方法

使用Python实现图像LBP特征提取的操作方法

《使用Python实现图像LBP特征提取的操作方法》LBP特征叫做局部二值模式,常用于纹理特征提取,并在纹理分类中具有较强的区分能力,本文给大家介绍了如何使用Python实现图像LBP特征提取的操作方... 目录一、LBP特征介绍二、LBP特征描述三、一些改进版本的LBP1.圆形LBP算子2.旋转不变的LB

阅读更多...

Maven的使用和配置国内源的保姆级教程

Maven的使用和配置国内源的保姆级教程

《Maven的使用和配置国内源的保姆级教程》Maven是⼀个项目管理工具,基于POM(ProjectObjectModel,项目对象模型)的概念,Maven可以通过一小段描述信息来管理项目的构建,报告... 目录1. 什么是Maven?2.创建⼀个Maven项目3.Maven 核心功能4.使用Maven H

阅读更多...