ceph之rados设计原理与实现第二章：计算寻址之美与数据平衡之殇crush

本文主要是介绍ceph之rados设计原理与实现第二章：计算寻址之美与数据平衡之殇crush，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

执行命令

ceph osd crush dump

可以查看当前集群crush map信息
其中会输出可调crush参数"tunables"、规定的若干规则"rules"、以及"cluster map"。

1. rules

“rules”，可以有多条，这些规则"rules"可以与存储池绑定，针对特定存储池执行自制的crush算法映射、以及决定本crush规则包含哪些osd。
书中一个简单的rule实例如下：

#rules
rule rule_name{ruleset 0type replicatedmin_size 1max_size 10step take rootstep chooseleaf firstn 0 type hoststep emit
}

2. cluster map

“cluster map”，存在唯一，包含了数据中心、机架、主机、osd等整个拓扑结构，除了osd都是虚拟的，并且记录了每个osd的weight和reweight，weight和reweight直接影响了随机哈希算法结果，但是由于crush是随机的，所以调整weight、reweight并不能精确控制pg在osd上的分布。

3. tunables

“tunables”，大多数参数都不建议调整，如果选不出足够的样本数，那么应该调大全局重试次数，但显然这会增加crush重试次数从而增加crush计算时间。
以上针对crush可以的参数调整，都会导致pg在osd迁移已达到数据分布均衡，但是为了在线平衡不影响业务的性能，每次调整都应该先模拟测试效果，并且做到多次微调。

4. 针对crush的调参优化ceph

调整crush只有两个目标，一个是增加crush计算效率，另一个就是数据负载均衡。针对数据重平衡，ceph有reweight、weight-set、umap、balancer。balancer依赖前三种工具，计算osd空间利用率的方差构建评分系统，既可以针对整个集群也可以针对存储池独占的osd，实现自动的评估系统评分，然后决定什么时候调整以及调整多少合适，从而代替了人工实现了自动化。因为针对上述参数的调整都是需要人工干预，都是多次微调实际非常麻烦，并且实际生产环境ceph扩容或者故障导致的pg自动迁移非常频繁，每次pg迁移后之前的调整都付之东流，因此自动化调整应运而生。

仍在学习，未完待续…

这篇关于ceph之rados设计原理与实现第二章：计算寻址之美与数据平衡之殇crush的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！