StarRocks 巧用 Storage Volume,强大又便捷

2024-08-28 11:44

本文主要是介绍StarRocks 巧用 Storage Volume,强大又便捷,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

StarRocks 存算分离支持使用各种外部独立存储系统来存储业务数据。在早期 3.0 版本中,用户需要在 fe.conf 中配置存储相关信息(如 endpoint 等),这种静态配置模式也给用户使用带来了很多的不便性。

为此,StarRocks 存算分离从 3.1.0 版本后推出了 Storage Volume 能力,支持用户动态地为集群创建存储资源。需要说明的是,Storage Volume 仅限于在存算分离集群中使用。


解释

Storage Volume 代表的是存储资源,例如在 S3 兼容类存储系统上可以是一个 Bucket,在 HDFS 上可以是一个存储目录。


基本用法

创建 Storage Volume

具体可以参考文档

CREATE STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/CREATE_STORAGE_VOLUME/

删除 Storage Volume

具体可以参考文档

DROP STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/DROP_STORAGE_VOLUME/

显示所有 Storage Volume

可参考下面链接的命令来展示系统中所有的 Storage Volumes

SHOW STORAGE VOLUMES | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/SHOW_STORAGE_VOLUMES/

展示 Storage Volume 属性

具体可以参考文档

DESC STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/DESC_STORAGE_VOLUME/

修改 Storage Volume 属性

具体可以参考文档

ALTER STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/ALTER_STORAGE_VOLUME/

创建表

我们可以为存算分离表每个表指定特定的 Storage Volume,可以在建表时通过属性设置,具体可参考文档 https://docs.starrocks.io/zh/docs/sql-reference/sql-statements/data-definition/CREATE_TABLE/。

具体的写法如下:

CREATE TABLE table_name (column_1, column_2, ...) PROPERTIES ("storage_volume" = "<volume_name>" )

设置默认 Storage Volume

我们可以为系统创建一个 Storage Volume 并将其设置为系统默认值,避免需要每次建表时指定,如果我们建表时不指定,就使用该默认 Volume 存储数据。具体可参考文档

SET DEFAULT STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/SET_DEFAULT_STORAGE_VOLUME/

关于 builtin_storage_volume

Storage Volume 概念从 3.1 版本开始引入,在 3.0 版本中并没有,为了处理升级兼容性问题,如果用户从 3.0 升级至 3.1 版本,且在 fe.conf 中配置了 enable_load_volume_from_conf 为 true,系统会兼容 3.0 行为,根据 fe.conf 里配置的存储信息自动创建一个 builtin_storage_volume,且该 volume 会自动被设置为 default。

基于 AWS S3 部署 | StarRocksdocs.starrocks.io/zh/docs/deployment/shared_data/s3/#enable_load_volume_from_conf


举个例子,如果 fe.conf 里配置了如下内容:

cloud_native_storage_type = S3 


 # 例如 testbucket/subpath 

aws_s3_path = <s3_path> 


 # 例如 us-west-2 

aws_s3_region = <region> 


 # 例如 https://s3.us-west-2.amazonaws.com 

aws_s3_endpoint = <endpoint_url> 


 enable_load_volume_from_conf = true

系统会使用上面的配置信息自动创建一个 S3 类型的 builtin_storage_volume。需要注意的是,该配置只会第一次加载。


优势

灵活使用 Storage Volume,可以给我们带来以下好处:

  1. 无需提前配置,随配随用,使用起来更方便

  2. 如果发现 Storage Volume 配置错误,可以随时使用命令修改,无需停服,可用性更高

  3. 可以在单个集群内创建多个 Storage Volume(数量无限制),且为不同的表指定不同的 Storage Volume,这样不同的表数据可以存储在不同的地方,可带来更好的数据隔离性

  4. 不同的 Storage Volume 还可以使用不同的存储系统(如 Volume A 使用 S3,Volume B 使用 HDFS),带来更多的灵活性


注意事项

  1. 强烈建议不要在 fe.conf 中配置存储信息,均通过 Storage Volume 来配置系统的存储资源,后续我们也会将静态配置的方式禁用

  2. 删除 Storage Volume 前需要将引用它的 Table 或者 Database 先删除(注意使用 drop table xxx force)

  3. 为某个表切换 Storage Volume 的功能不支持,这涉及数据迁移

这篇关于StarRocks 巧用 Storage Volume,强大又便捷的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1114672

相关文章

IntelliJ IDEA - 强大的编程工具

哪个编程工具让你的工作效率翻倍? 在日益繁忙的工作环境中,选择合适的编程工具已成为提升开发者工作效率的关键。不同的工具能够帮助我们简化代码编写、自动化任务、提升调试速度,甚至让团队协作更加顺畅。那么,哪款编程工具让你的工作效率翻倍?是智能的代码编辑器,强大的版本控制工具,还是那些让你事半功倍的自动化脚本?在这里我推荐一款好用的编程工具:IntelliJ IDEA。 方向一:工具介绍 Int

MongoDB学习—(1)安装时出现The default storage engine 'wiredTiger' is not available问题解决

MongoDB是NoSql类型的一种基于分布式文件存储的数据库,其存储方式与关系型数据库不同。其详细解释可见于[百科]。安装文件可从官网下载,官网:http://mongodb.org 我将下载的解压文件放到D盘的mongodb文件夹下,

最强虚拟机,内置强大插件,绝!

哈喽,各位小伙伴们好,我是给大家带来各类黑科技与前沿资讯的小武。 天给大家安利两款移动端的虚拟机软件,均支持超级权限、Xposed框架和谷歌服务,而其中一款可谓称得上最强虚拟机,不仅含有虚拟机的基本功能,还能多开分身、模拟器以及强大的插件社区,能实现的功能超乎你的想象,一起来看看吧! X8沙箱(安卓) 软件介绍 X8沙箱(手机版的安卓模拟器、虚拟机、多开分身、游戏双开多开挂机)是一款极简、

推荐一款强大的OCR软件,请低调使用!

今天给大家分享一款开源的OCR识别软件,可以提升大家的办公效率——Umi-OCR,支持window​和Linux系统。 Umi-OCR支持提取一张图片或者多张图片的信息,只需通过右边的功能页选择相应的功能。 点击左边的“截图OCR”进入页面 点击“截图”按钮选取截图区域,直接在右边的记录中​提取出截图中的信息。 批量OCR功能也一样,点击左边菜单的“批量OCR”菜单

CleanClip: Mac上最强大的剪贴板管理工具

嘿,Mac用户们!你是否经常因为系统默认的单条剪贴板记录而感到困扰?别担心,今天我们来介绍一款革命性的剪贴板管理工具 - CleanClip! 系统级体验:无缝融入你的工作流 首先,让我们来看看CleanClip最与众不同的特点 - 它的系统级体验。 使用方法超简单: 在任何应用中复制内容按下快捷键 "⌘ + ;"CleanClip的列表会直接显示在你的光标位置! 这种设计让你

浏览器百科:网页存储篇-Session storage应用实例(九)

1.引言 在前面的文章中,我们详细介绍了如何在 Chrome 浏览器中打开并使用 Session storage 窗格,进行数据的查看、编辑和管理。作为网页存储技术的重要组成部分,sessionStorage在提升用户体验和数据管理能力方面发挥了重要作用。在本篇《浏览器百科:网页存储篇-Session storage应用实例(九)》中,我们将深入探讨sessionStorage的实际应用场景,通

某PO手机市场竞争分析,巧用波特五力分析法找出核心竞争力!

某PO手机主要从事手机的生产与销售,最近推出了新款 Reno 系列 5G 手机。当前,苹果占据了高端市场,华为占据了中高端市场,而某 PO 手机则在剩余市场中与某 VO 和某米竞争。近年来,某 PO手机凭借中端 R 系列逐步取得市场份额。在这样的背景下,我们运用波特五力模型来分析某 PO 手机的外部环境。 1、波特五力模型案例分析:某PO手机 1.1 新进入者的威胁 由于电子产品市场竞争激烈

浏览器百科:网页存储篇-Session storage介绍(七)

1.引言 在上一篇文章中,我们详细探讨了 localStorage 的各种应用实例和使用方法。本篇文章将继续网页存储系列,聚焦于 Session storage。Session storage 与 localStorage 类似,都用于在客户端存储数据,但它们之间存在一些关键差异。通过了解 Session storage 的特性和应用场景,开发者可以更灵活地选择和运用网页存储技术,提升网页应用的

【Antd】Form.List的强大之处,Form.List使用方式细微讲解

设想场景 有时候我们会遇到一些复杂的需求,需要用Table嵌套Form.List,逐层嵌套渲染表格表单列表,填写完毕后提交的复杂需求。 由于表单项分布在数据的各个层级里,因此,如何回填表单值就成了一个比较棘手的问题,处理不好,很容易引发一些逻辑bug(例如表单重置后,数据回填异常等) 如何处理数据 其实,antd的form实例对象很强,只需要提供给它指定的field和索引i组成的formN

Easy Voice Toolkit - 简易语音工具箱,一款强大的语音识别、转录、转换工具 本地一键整合包下载

Easy Voice Toolkit 是一个基于开源语音项目实现的简易语音工具箱,提供了包括语音模型训练在内的多种自动化音频工具,集成了GUI,无需配置,解压即用。 工具箱包括 audio-slicer、VoiceprintRecognition、whisper、SRT - to - CSV - and - audio - split、vits 和 GPT - SoVITS 等。这些优秀