(转)HBase为什么不建议设置过多的列簇?

2024-05-24 10:18
文章标签 设置 建议 过多 hbase

本文主要是介绍(转)HBase为什么不建议设置过多的列簇?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在HBase中,是允许设置多个列簇的,但是为什么在实际生产中会设置很少的列簇呢?一般设置在1至3个左右,尽量是越少越好。
原因有多个方面,具体简要说明几点:

1、列簇的数量对flush的影响
在一个RegionServer上有一个或多个region,每个region又由一个或多个store组成,一个store存储的就是一个列簇,也就是说列簇的数量越多,每个region的的store就越多,那么region中的memstore数量就会就多,当memstore达到一定的阈值时,就会将memstore中的数据flush到storeFile中,每次flush都会产生IO,当memstore数量增多时,需要flush的就越多,就会影响了flush的IO性能及消耗更多的集群资源,甚至会造成memstore的flush阻塞现象。

2、列簇的数量对split的影响
在region的大小超过一定的大小时(hbase.hregion.max.filesize参数),region就会分裂,当然region的分裂并不是region中所有的文件大小大于上述的参数就分裂,而是region中最大的storeFile的大小达到了上述参数的值时才会触发region分裂,如果列簇的数量过多的话,并且这些列簇之间的数据量相差很大,那么在region分裂后原本数据量小的storeFile就会拆分成更小的文件,在scan范围数据时就会影响该列簇数据的读性能,因为region的分裂针对的是所有的列簇,并不是某单个的列簇,是为了保证分裂之后相同行的数据在仍在一个region上。

3、列簇的数量对compaction的影响
同样的,compaction的操作针对的是region的操作,在列簇越多时,相关文件就会越多,region合并时产生的IO就会消耗越多,加大了资源的消耗。

4、列簇的数量对HDFS的影响
HDFS对目录下的文件数量是有限制的(dfs.namenode.fs-limits.max-directory-items),例如region的数量为m个,列簇的数量为n个,那么对应的文件数量就有mn个,但是每个store下的storeFile(HFile)的数量至少有一个,假设有K个,那么总共对应的文件数量就有mn*k个,列簇的数量是文件数量的n倍。

5、列簇的数量对RegionServer内存的影响
在一个store中存储的就是一个列簇,store中的memstore是内存结构,当列簇越多,那么memstore的数量就越多,占用的内存的空间就会越多。

总结:根据实际生产需求,能够用一个列簇解决的就尽量用一个列簇,当两个列簇的数量相差悬殊时,可以将其两个列簇的数据拆分为两个表的单个列簇。
————————————————
版权声明:本文为CSDN博主「已个人」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_43888806/article/details/100127854

这篇关于(转)HBase为什么不建议设置过多的列簇?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/998126

相关文章

PyCharm如何设置新建文件默认为LF换行符

《PyCharm如何设置新建文件默认为LF换行符》:本文主要介绍PyCharm如何设置新建文件默认为LF换行符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录PyCharm设置新建文件默认为LF换行符设置换行符修改换行符总结PyCharm设置新建文件默认为LF

Linux上设置Ollama服务配置(常用环境变量)

《Linux上设置Ollama服务配置(常用环境变量)》本文主要介绍了Linux上设置Ollama服务配置(常用环境变量),Ollama提供了多种环境变量供配置,如调试模式、模型目录等,下面就来介绍一... 目录在 linux 上设置环境变量配置 OllamPOgxSRJfa手动安装安装特定版本查看日志在

Ubuntu中Nginx虚拟主机设置的项目实践

《Ubuntu中Nginx虚拟主机设置的项目实践》通过配置虚拟主机,可以在同一台服务器上运行多个独立的网站,本文主要介绍了Ubuntu中Nginx虚拟主机设置的项目实践,具有一定的参考价值,感兴趣的可... 目录简介安装 Nginx创建虚拟主机1. 创建网站目录2. 创建默认索引文件3. 配置 Nginx4

如何关闭 Mac 触发角功能或设置修饰键? mac电脑防止误触设置技巧

《如何关闭Mac触发角功能或设置修饰键?mac电脑防止误触设置技巧》从Windows换到iOS大半年来,触发角是我觉得值得吹爆的MacBook效率神器,成为一大说服理由,下面我们就来看看mac电... MAC 的「触发角」功能虽然提高了效率,但过于灵敏也让不少用户感到头疼。特别是在关键时刻,一不小心就可能触

Nginx配置系统服务&设置环境变量方式

《Nginx配置系统服务&设置环境变量方式》本文介绍了如何将Nginx配置为系统服务并设置环境变量,以便更方便地对Nginx进行操作,通过配置系统服务,可以使用系统命令来启动、停止或重新加载Nginx... 目录1.Nginx操作问题2.配置系统服android务3.设置环境变量总结1.Nginx操作问题

grom设置全局日志实现执行并打印sql语句

《grom设置全局日志实现执行并打印sql语句》本文主要介绍了grom设置全局日志实现执行并打印sql语句,包括设置日志级别、实现自定义Logger接口以及如何使用GORM的默认logger,通过这些... 目录gorm中的自定义日志gorm中日志的其他操作日志级别Debug自定义 Loggergorm中的

前端 CSS 动态设置样式::class、:style 等技巧(推荐)

《前端CSS动态设置样式::class、:style等技巧(推荐)》:本文主要介绍了Vue.js中动态绑定类名和内联样式的两种方法:对象语法和数组语法,通过对象语法,可以根据条件动态切换类名或样式;通过数组语法,可以同时绑定多个类名或样式,此外,还可以结合计算属性来生成复杂的类名或样式对象,详细内容请阅读本文,希望能对你有所帮助...

MySQL8.0设置redo缓存大小的实现

《MySQL8.0设置redo缓存大小的实现》本文主要在MySQL8.0.30及之后版本中使用innodb_redo_log_capacity参数在线更改redo缓存文件大小,下面就来介绍一下,具有一... mysql 8.0.30及之后版本可以使用innodb_redo_log_capacity参数来更改

Nginx设置连接超时并进行测试的方法步骤

《Nginx设置连接超时并进行测试的方法步骤》在高并发场景下,如果客户端与服务器的连接长时间未响应,会占用大量的系统资源,影响其他正常请求的处理效率,为了解决这个问题,可以通过设置Nginx的连接... 目录设置连接超时目的操作步骤测试连接超时测试方法:总结:设置连接超时目的设置客户端与服务器之间的连接

mybatis和mybatis-plus设置值为null不起作用问题及解决

《mybatis和mybatis-plus设置值为null不起作用问题及解决》Mybatis-Plus的FieldStrategy主要用于控制新增、更新和查询时对空值的处理策略,通过配置不同的策略类型... 目录MyBATis-plusFieldStrategy作用FieldStrategy类型每种策略的作