本文主要是介绍oracle和greenplum的比较,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Oracle RAC是Oracle Real Application Cluster的简写,官方中文文档一般翻译为“真正应用集群”,它一般有两台或者两台以上同构计算机及共享存储设备构成,可提供强大的数据库处理能力,现在是Oracle 10g Grid应用的重要组成部分。RAC(Race Game)指竞速类游戏
oracle虽然可以搭建集群 但是当数据量达到一定限度之后查询处理速度会变得很慢 且对机器性能要求很高
其实这两个东西不是同类 hadoop是一个分布式云处理架构,倾向于数据计算 而oracle是一个关系型数据库,倾向于 数据存储。要说比较可以比较hbase与oracle。
hbase是一种 nosql数据库,列式数据库,支持 海量数据存储,支持列的扩展,但是查询操作较复杂,不如oracle这类关系型数据库简单,且只支持一个索引,但是Hbase在表结构设置合理情况下,查询速度跟数据量大小没有太大关系,即数据量的大小不会影响到查询速度,顺便说句Hbase查询速度可以达到ms级
gp是master节点和segment节点的mpp架构
hadoop是master node,data node的mapreduce模式,
两者原理都是在多台机器并行跑
hadoop在节点大于某个阀值后,优势会显现出来,
但是greenplum的数据库机制很完备
其实一直搞不清MySQL收不收费,似乎大家都在用,也没有收费的担心。
2 GreenPlum除了本身这种MPP的架构外,有没有其它的高可用性方法?
比如做数据的异地复制和备份,Oracle可以用Stream来做, SQL Server可以用“复制”。
3 GreenPlum可以当作在线生产库来用么,还是只是做为数据苍库,做分析处理的
Greenplum DB 号称是世界上第一个开源的大规模并行数据仓库,最初是基于 PostgreSQL,现在已经添加了大量数据库方面的创新。Greenplum 提供 PD 级别数据量的强大和快速分析能力,特别是面向大数据方面的分析能力,支持大数据的超高性能分析查询。
GreenPlum 主要特性:
-
大规模并行处理架构
-
高性能加载,使用 MPP 技术,提供 Petabyte 级别数据量的加载性能
-
大数据工作流查询优化
-
多态数据存储和执行
-
基于 Apache MADLib 的高级机器学习功能
Greenplum 采用 Apache 协议开源之后,加上之前的 HAWQ,PostgreSQL 以及 PostGIS,完全可以构建一体化的 PostgreSQL 企业数据架构。
Greenplum的架构采用了MPP(大规模并行处理)。在 MPP 系统中,每个 SMP 节点也可以运行自己的操作系统、数据库等。换言之,每个节点内的 CPU 不能访问另一个节点的内存。节点之间的信息交互是通过节点互联网络实现的,这个过程一般称为数据重分配(Data Redistribution) 。与传统的SMP架构明显不同,通常情况下,MPP系统因为要在不同处理单元之间传送信息,所以它的效率要比SMP要差一点,但是这也不是绝对的,因为 MPP系统不共享资源,因此对它而言,资源比SMP要多,当需要处理的事务达到一定规模时,MPP的效率要比SMP好。这就是看通信时间占用计算时间的比例而定,如果通信时间比较多,那MPP系统就不占优势了,相反,如果通信时间比较少,那MPP系统可以充分发挥资源的优势,达到高效率。当前使用的 OTLP程序中,用户访问一个中心数据库,如果采用SMP系统结构,它的效率要比采用MPP结构要快得多。而MPP系统在决策支持和数据挖掘方面显示了优势,可以这样说,如果操作相互之间没有什么关系,处理单元之间需要进行的通信比较少,那采用MPP系统就要好,相反就不合适了。
这篇关于oracle和greenplum的比较的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!