这家“丧心病狂”的IT公司，竟然出了6款数据库~

本文主要是介绍这家“丧心病狂”的IT公司，竟然出了6款数据库~，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

在谈这家丧心病狂的公司之前，先说说“正常”的IT公司是怎样的：

一家IT公司，一般只会有一款数据库产品。

我们众所周知的Oracle, Microsoft(SQL), MongoDB等等都是这样。

（像Oracle买了拥有MySQL的Sun这样的，不能算了，毕竟MySQL不是Oracle最开始自主研发的。）

为什么会这样呢？原因主要有2个：

1. 如果一家公司，能有一款拿得出手的数据库产品，就可以在整个IT业界立足了，实在没有必要开发第二款数据库。

2. 数据库系统的开发成本也比较高，投入很大，很少有公司有能力去开发多款数据库。

所以，反过来说，如果一家IT公司，它开发了很多款不同类型的数据库，那它一定有2个特质：

1. 有野心：一款数据库，不足以实现它独霸整个DBaaS（数据库即服务）的野心，所以它要开发6款；

2. 有钱：数据库的开发不像软件开发，人才很少，重金买人，才能开发数据库。

看来，“丧心病狂”也不是那么容易的！

今天我们要讲的这家“丧心病狂”的开发了6款数据库产品的公司就是亚马逊（Amazon），确切地说是亚马逊的云计算部门，也就是AWS。

AWS有哪6款数据库呢？

确切地说，我认为是7款数据库：

* RDS

* RDS-Aurora

* Redshift

* DynamoDB

* Neptune

* Timestream

* QLDB

(RDS和RDS-Aurora有些人认为是同款数据库。)

这几款数据库真是各有神通，几乎把所有数据库相关的应用场景都捕捉到了。

接下来逐一介绍下：

RDS （Relational Database Service)

RDS顾名思义就是“关系型数据库”。这里其实亚马逊移植了市面上常用的几款数据库，做成了“云”的版本给客户，包括：Oracle，MySQL, MS SQL, MariaDB, PostgreSQL。

这么做的好处，就是客户教育成本低，迁移成本低，用自己熟悉的数据库，又享受了云端的高可用和高性能。

这些好像没啥，很“正常”，还不够“丧心病狂”，但是接下来的几款数据库产品，AWS就要开挂了。

RDS-Aurora

虽然说，Aurora是挂在RDS下面的一个数据库产品，但是我认为它完全是不一样的。不能和其它RDS数据库相提并论。

数据库的一个核心问题就是解决“高并发”，其中包括：高并发的“读”，和高并发的“写”。（比如一个电商平台的网站，对商品的查询都是读，下订单则都是写了。）

你可能会说，高并发的“读”不难处理啊！可多几个数据部分不就行了？比如，一份数据放在10个服务器上--对于读，来说，是这样的。

但是，如果系统里面有很多数据副本的时候，高并发的“写”就不能有效的同步到所有的副本上了--所以，高并发的读写实际上是一对儿矛盾的综合体。

Aurora通过“日志即数据”的概念，把“数据引擎”和“数据存储”进行了有效的分割，从而达到了空前的高并发读写机能。

传统的普通数据库服务，或者普通的自建数据库机构，“写”只能发生在一个“主”数据上，然后“主”再把自己的数据同步给其它副本。Aurora则不同，“写”可以发生在任何一个可用区上。Aurora的架构使用了3个可用区，每个可用区有2个副本，也就是一共6个副本，这6个副本都可以进行读写。极大的弥补了，传统数据库对高并发的瓶颈。这是不是很“丧心病狂”？这是如何做到的？！

细节，在这里就不赘述了，有兴趣的话，可以咨询我们的架构师~

高并发的读写是典型的OLTP（On-Line Transaction Processing联机事务处理过程）中发生的场景。那么对于OLAP （On-Line Analytical Processing 在线分析过程），AWS提出了什么产品呢？

Redshift

和OLTP场景下，数据库需要支持高并发读写不同，OLAP场景下数据库读写频率很低，数据库需要进行大量的聚合计算：数据量大，计算量也大。（比如，一天结束之后，我们需要对今天的用户行为进行分析，所有用户行为数据可能是几个TB。）

这时候，就需要Redshift出场了。Redshift说起来也是关系型数据库，但是它和RDS们有个本质的不同，它不是按“行”来存储数据的，而是按“列”来的。不仅如此，它还按照“列”，对数据进行了排序！基本上这就是为了做“聚合”而诞生的数据库啊！而且按列聚合的数据库很方便压缩，Redshift可以处理PB级数据哦！！！

你说这就可以了吧：传统的关系型数据库，AWS有了；OLTP数据库有了；OLAP数据库也有了。AWS觉得还不够！