本文主要是介绍开发者中心基于Kubernetes实现云上的自动扩缩,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
开发者中心基于Kubernetes实现云上的自动扩缩
- Horizontal Pod Autoscaler
- 样例
- 弹性伸缩容错处理
- 开发者中心自动扩缩使用
随着业务量的增多,应用的压力越来越大,这时就需要调整应用的部署量来应对高并发。但是业务量并非一成不变的,当业务量减少时,应用部署过多反而成为一种资源的浪费,这时需要减少部署量来降低资源的损耗。在传统的运维过程中,离不开人为的操作,同时启动量的多少对于运维人员来说也不能准确把控。幸运的是Kubernetes提供了容器的弹性伸缩功能,通过对容器的cpu、内存、并发量等监控,实现容器的自动伸缩,极大的简化了运维的操作难度、节省了人员开支和资源损耗。
Horizontal Pod Autoscaler
Horizontal Pod Autoscaling,简称HPA, Kubernetes通过HPA的设定,实现了容器的弹性伸缩功能。对于Kubernetes中的POD集群来说,HPA可以实现很多自动化功能,比如当POD中业务负载上升的时候,可以创建新的POD来保证业务系统稳定运行,当POD中业务负载下降的时候,可以销毁POD来减少资源的浪费。
HPA最早版本(autoscaling/v1)仅支持CPU作为可监控的度量标准。当前版本HPA处于测试阶段(autoscaling/v2beta1)支持内存和其他自定义指标。
当前的弹性伸缩的指标包括:
- CPU
- 内存
- 并发数
- 包传输大小
HPA控制器默认每隔30秒就会运行一次,一旦创建的HPA,我们就可以通过命令查看获取到的当前指标信息
$ kubectl get hpa NAME -n NAMESPACE
同样如果要查看HAP的事件,也可通下面的命令查看
$ kubectl describe hpa NAME -n NAMESPACE
样例
apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:name: hpa-namenamespace: my-namespace
spec:scaleTargetRef:apiVersion: apps/v1kind: Deployment # 基于Deployment进行扩缩name: deployment-name # Deployment名minReplicas: 1 # 最大实例数maxReplicas: 10 # 最小实例数metrics:- type: Resourceresource:name: cputargetAverageUtilization: 50 # CPU阈值设定50%- type: Podspods:metricName: packets-per-secondtargetAverageValue: 1k # 每秒数据量- type: Objectobject:metricName: requests-per-secondtarget:apiVersion: extensions/v1beta1kind: Ingressname: main-routetargetValue: 10k # 每秒请求量
弹性伸缩容错处理
- HPA通过heapster或自定义RESTClient获取到当前的指标信息如CPU,会对HPA设定值进行比较后,进行扩容或缩容,使当前值尽量向其设定值靠近。同时为避免业务的不稳定,弹性伸缩增加了等待时间,当进行扩或缩后,HPA将进行一段时间的等待,这段时间不会进行弹性伸缩。对于扩容,等待时间为3分钟,而缩容,等待时间为5分钟。
- HPA Controller中有一个tolerance(容忍力)的概念,它允许一定范围内的使用量的不稳定,现在默认为0.1,这也是出于维护系统稳定性的考虑。例如,设定HPA调度策略为cpu使用率高于50%触发扩容,那么只有当使用率大于55%或者小于45%才会触发伸缩活动,HPA会尽力把Pod的使用率控制在这个范围之间。
- 具体的每次扩容或者缩容的多少Pod的算法为:
Ceil(前采集到的使用率 / 用户自定义的使用率) * Pod数量)
- 每次最大扩容pod数量不会超过当前副本数量的2倍
从Kubernetes1.6开始,对HPA控制器,在原先horizontal-pod-autoscaler-sync-period参数基础上,新增加了horizontal-pod-autoscaler-upscale-delay和horizontal-pod-autoscaler-downscale-delay两个参数,默认值分别是3分钟和5分钟,分别代表自动伸展后的延迟时间和自动收缩后的延迟时间。
我们可以通过为Controller Manager添加Flags来对水平Pod Autoscaler进行一些调整:
- 利用Flags-horizontal-pod-autoscaler-sync-period确定hPa对于Pods组指标的监控频率。默认的周期为30秒。
- 两次扩展操作之间的默认间隔为3分钟,可以Flags来控制-horizontal-pod-autoscaler-upscale-delay
- 两个缩小操作之间的默认间隔为5分钟,同样可以通过Flags来控制-horizontal-pod-autoscaler-downscale-delay
开发者中心自动扩缩使用
开发者中心支持针对应用进行自动扩缩设置,目前支持的阈值有CPU和内存
只需要简单的设置,即可开启应用的自动扩缩
这篇关于开发者中心基于Kubernetes实现云上的自动扩缩的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!