兑吧：从自建HBase迁移到阿里云HBase实战经验

本文主要是介绍兑吧：从自建HBase迁移到阿里云HBase实战经验，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

2019独角兽企业重金招聘Python工程师标准>>>

既然MySQL 8和PostgreSQL 10已经发布了，现在是时候回顾一下这两大开源关系型数据库是如何彼此竞争的。

在这些版本之前，人们普遍认为，Postgres在功能集表现更出色，也因其“学院派”风格而备受称赞，MySQL则更善长大规模并发读/写。

但是随着它们最新版本的发布，两者之间的差距明显变小了。

特性比较

首先来看看我们都喜欢谈论的“时髦”功能。

业务介绍兑吧集团包含兑吧网络和推啊网络，兑吧网络是一家致力于帮助互联网企业提升运营效率的用户运营服务平台，提供积分商城和媒体运营服务。推啊网络是一家互动式广告平台，经过多年的探索与实践，首创了全新的移动广告模式，实现了广告主、媒体、用户多方共赢。在推啊的广告场景中，广告主可获得更好的投放效果，媒体方能得到更好的流量变现效率，受众端具有更好的用户体验，目前推啊已经服务超过15000家媒体，阿里云hbase主要服务于"推啊"的广告业务。 "推啊"的整体业务流程如下图：整体产品架构广告平台基础架构完善，能有效支持业务，其中核心数据平台为公司所有业务提供强有力的数据支撑。其中整个数据平台根据处理业务不同大致分为3个模块：离线统计模块：对数据进行离线统计，提供报表和相应的后台数据分析实时统计模块：实时数据主要用来对接算法，用于统计用户的实时行为，比如对不同广告的曝光，点击等行为，要求快速计算响应，所以我们采用低延迟的流式计算实时OLAP分析模块：多维实时分析，定位是提供分钟粒度的统计数据，主要用于任意维度和指标的统计 HBase在"推啊"使用场景 HBase在推啊主要用于流式数据统计，存储用户画像的相关数据，属于实时统计模块中主要存储。实时统计时，对用户的行为数据根据不同维度不同指标进行统计，比如会记录用户在不同广告上的曝光，点击，参与等数据，也会记录用户的相应属性，比如用户对哪类广告比较感兴趣，用户的年龄，性别，职业，爱好等特征。这些数据全部存储在HBase集群中。为什么从物理HBase迁移到阿里云HBase 最开始我们是物理机房自建HBase，选择阿里云HBase主要出于以下几个考虑：云HBase服务基本免运维。减轻运维和系统调优压力，由阿里云hbase专家团队提供专业的运维服务。 HBase基础设施重要性高。HBase作为底层存储系统，一旦出现系统故障，排查周期长，难度高，短时间内难以解决，直接影响到线上系统的稳定性，在这方面阿里云Hbase能提供强大的技术支撑，阿里云有国内最强大的内核团队，据了解阿里目前有3个pmc，6个committer，是中国拥有最多HBase committer的公司。云HBase服务好。在使用Hbase上有任何疑问都可以直接咨询阿里云Hbase同学，他们响应及时，服务周到，能给出专业的建议。整个迁移实战过程根据我们业务的发展，从3个阶段阐述下阿里云hbase的使用情况以及遇到的问题	MySQL 8	PostgreSQL 10
查询 & 分析
公用表表达式 (CTEs)	New
窗口函数	New
数据类型
JSON支持	Improved
GIS / SRS	Improved
全文检索
可扩展性
逻辑复制		New
半同步复制		New
声明式分区		New