healthchecks专题

[译]Kubernetes 最佳实践:使用readiness和liveness探测器做HealthChecks

前言: 分布式系统通常是难于管理的。主要是由于组件很多,且当其中一个损坏时,系统必须能探测到,绕过它,最后修复它,并且最重要的是,这一系列都需要是自动的。 如果一个实例不可用,那么系统就不应该向其分发请求,相反,应该将请求分发到其他可用的实例上,或者稍后再尝试。同时系统应该自动将失效的实例重新恢复到可用状态。 默认情况下,kubernetes(以后简称k8s)当pod中所有container一“