本文主要是介绍彻底搞懂 HBase Rowkey 设计和实现方式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、前言
HBase 由于它存储和读写的高性能,在 OLAP 即时分析中发挥着重要的作用。而 RowKey 作为 HBase 的核心知识点,其设计势必会影响到数据在 HBase 中的分布,还会影响我们查询效率,可以说 RowKey 的设计质量关乎了 HBase 的质量。
言归正传,对于关系型数据库,数据定位可以理解为“二维坐标”;但在 HBase 中,定位一条数据(即一个 Cell)我们需要 4 个维度的限定:行键(RowKey)、列族(Column Family)、列限定符(Column Qualifier)、时间戳(Timestamp)。其中,RowKey 是最容易出现问题的。除了根据业务和查询需求来设计之外,还有很多地方需要我们注意。
二、RowKey 概念
HBase 中 RowKey 可以唯一标识一行记录,在 HBase 查询的时候有以下几种方式:
通过 get 方式,指定 RowKey 获取唯一一条记录
通过 scan 方式,设置 startRow 和 stopRow 参数进行范围匹配
全表扫描,即直接扫描整张表中所有行记录
从字面意思来看,
相关文章:
这篇关于彻底搞懂 HBase Rowkey 设计和实现方式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!