解锁云原生虚拟数仓 PieCloudDB Database 『第一期』

2023-12-17 03:59

本文主要是介绍解锁云原生虚拟数仓 PieCloudDB Database 『第一期』,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

拓数派旗下旗舰产品 PieCloudDB ,采用领先的数仓虚拟化技术,为企业构建高安全,高可靠,高在线「坚如磐石」的云原生虚拟数仓。本系列文章将为大家介绍 PieCloudDB Database 最新动态和全新功能。

相关视频:链接

产品试用:https://app.pieclouddb.com

随着计算资源和网络资源的丰富,计算平台经历了从大型机年代,PC 机年代,到如今的云时代的三代平台变更。在第三次变革中,服务器虚拟化技术的突破引领了云计算时代的到来。 

三代计算平台变更 

为了充分利用云带来的红利,拓数派打造了一款全新的云时代的数据库管理平台:PieCloudDB。PieCloudDB 将用户数据,元数据和计算引擎三个逻辑核心组件进行拆解并在云上重组。这种存储和计算分离的架构带来了云上的高弹性,并具备了软硬分离的高容错和高在线能力。用户可以根据自身需求,按需进行存储或计算资源的弹性扩展。

数仓云原生虚拟化技术突破引领数据计算时代到来 

自2022年10月24日以来,拓数派陆续发布了 PieCloudDB 社区版和企业版,以及一体机版本。在3月14日 πDay,拓数派发布 PieCloudDB 全新版本:云上云版。至此,PieCloudDB 完成了对裸硬件,私有云,和公有云三种部署方式的全面支持。  

PieCloudDB 的多种部署方式 

在新版本中,PieCloudDB 全面实现数据仓库上云虚拟化。云原生数仓虚拟化突破了传统 MPP 数据库的众多瓶颈,实现了云上 eMPP 全新架构,做到多个云原生虚拟数仓并发执行。从而获得云上新架构提供的众多红利,包括打破数据孤岛,秒级扩缩容,动态调配资源,按需付费等。

PieCloudDB 实现云上eMPP架构 

新的版本实现了众多全新功能,带来了性能和稳定全方位的提升,让 PieCloudDB 做到了真正的「unbreakable」坚如磐石,包括: 

  • 聚集下推功能得到增强 

在数据库的分析型场景下往往存在大量的聚集运算。PieCloudDB 实现的聚集下推功能通过把聚集操作下推到连接操作之前去执行,可以大大减少链接操作需要处理的数据量,让查询性能显著提升。 

经测试,聚集下推让 PieCloudDB 在某些复杂查询的应用场景下得到了近百倍甚至千倍的提升。 

 

聚集下推功能 

  • Block File Skipping 优化

PieCloudDB 的用户数据以行列混存的数据格式被存储在对象存储中。 同时,PieCloudDB 以 block 文件为存储单位。Block 文件按列存储,从而获得高效的压缩,节省存储空间; PieCloudDB 在全新版本中实现的 Block File Skipping 的优化机制  在数据库运行查询语句时,通过预计算每个 block 文件中列聚集信息 ,在执行期间跳过非必要的数据块,从而减少数据读取量,提高查询性能。 

PieCloudDB 行列混存 

  • 实现极速 Analyze 

“Analyze” 操作可以分析数据库表的内容,收集有关每个表的每一列中值分布的统计信息。数据库查询引擎会利用这些统计信息生成最佳查询计划。 

对于大部分的数据库系统,Analyze 往往是手动执行,或由 AUTO VACUUM 自动执行,对于数据量较大的大表的查询,时间过长。 

在全新版本中,PieCloudDB 实现极速Analyze,可以在数据发生变化时自动完成Analyze,及时生成更为准确的查询规划统计信息。

  • 全新的缓存机制 

针对元数据,PieCloudDB 实现了元数据层全新的缓存机制,有效减少了访问元数据服务器带来的网络通信开销和元数据服务器的负载,提高元数据访问的速度。  

  • 支持快速 ETL/ELT、和外部数据源的查询 

PieCloudDB 在全新版本中,原生支持 Kafka 流数据导入。copy 操作由原先的单节点优化至整个集群,性能得到大幅提升,与集群尺寸成正比。 

此外,在全新版本中,PieCloudDB 支持 foreign-data wrapper 模块,使用户可以访问包括但不限于 HDFS、MySQL 等数据源。同时 PieCloudDB 支持用户自行开发模块来访问新的存储数据源。 

除了这五项重大优化,PieCloudDB 全新版本内核还实现了 

  • 可观测性增强
  • Vacuum 优化
  • 在 HDFS/NAS 系统上支持原生存储格式
  • 对 开源优化器 Orca 的支持
  • 对开源机器学习库 Madlib 的支持
  • 支持超大数据量字段

…. 

等多项优化。

PieCloudDB 打造了全新的存储引擎简墨(JANM) 。简墨出自”竹简墨书”,形象的描述了 PieCloudDB 行列混存的存储形式。 

在 PieCloudDB 的全新版本中,存储引擎 JANM 实现了: 

  • JANM 分布式处理的增强 
  • JANM 动态分配读取文件,增强 dispatch 性能 
  • JANM 异常处理的优化 

…. 

等多个功能。

PieCloudDB 云原生管控平台完成了包括: 

  • 用户权限优化 
  • 注册选项增加 
  • 数据洞察优化 
  • 数据导入优化 
  • 外部接入支持更多类型 

…. 

等多项优化。

PieCloudDB 将不断迭代,继续前行,欢迎大家前往https://app.pieclouddb.com 试用云上云版本。也期待大家扫码加入我们的技术社区,与我们携手共进!

这篇关于解锁云原生虚拟数仓 PieCloudDB Database 『第一期』的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/502990

相关文章

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

MySQL高性能优化规范

前言:      笔者最近上班途中突然想丰富下自己的数据库优化技能。于是在查阅了多篇文章后,总结出了这篇! 数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 临时库表必须以tmp_为前缀并以日期为后缀,备份

90、k8s之secret+configMap

一、secret配置管理 配置管理: 加密配置:保存密码,token,其他敏感信息的k8s资源 应用配置:我们需要定制化的给应用进行配置,我们需要把定制好的配置文件同步到pod当中容器 1.1、加密配置: secret: [root@master01 ~]# kubectl get secrets ##查看加密配置[root@master01 ~]# kubectl get se

[MySQL表的增删改查-进阶]

🌈个人主页:努力学编程’ ⛅个人推荐: c语言从初阶到进阶 JavaEE详解 数据结构 ⚡学好数据结构,刷题刻不容缓:点击一起刷题 🌙心灵鸡汤:总有人要赢,为什么不能是我呢 💻💻💻数据库约束 🔭🔭🔭约束类型 not null: 指示某列不能存储 NULL 值unique: 保证某列的每行必须有唯一的值default: 规定没有给列赋值时的默认值.primary key:

K8S(Kubernetes)开源的容器编排平台安装步骤详解

K8S(Kubernetes)是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。以下是K8S容器编排平台的安装步骤、使用方式及特点的概述: 安装步骤: 安装Docker:K8S需要基于Docker来运行容器化应用程序。首先要在所有节点上安装Docker引擎。 安装Kubernetes Master:在集群中选择一台主机作为Master节点,安装K8S的控制平面组件,如AP

MySQL-CRUD入门1

文章目录 认识配置文件client节点mysql节点mysqld节点 数据的添加(Create)添加一行数据添加多行数据两种添加数据的效率对比 数据的查询(Retrieve)全列查询指定列查询查询中带有表达式关于字面量关于as重命名 临时表引入distinct去重order by 排序关于NULL 认识配置文件 在我们的MySQL服务安装好了之后, 会有一个配置文件, 也就