Kubernetes 高可用性入门:初学者指南

2024-04-06 20:44

本文主要是介绍Kubernetes 高可用性入门:初学者指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Kubernetes 高可用性解释

  • 引言
  • 一、需要 Kubernetes 高可用性
  • 二、Kubernetes 控制平面的高可用性
    • 2.1、etcd
    • 2.2、API 服务器
    • 2.3、Kube 调度器
    • 2.4、Kube 控制器管理器
    • 2.5、云控制器管理器
  • 三、工作节点的高可用性
  • 四、Kubernetes 集群可用性度量
  • 五、Kubernetes 可用性常见问题
  • 六、总结

引言

在本文中将研究 Kubernetes 的高可用性。以及研究每个 Kubernetes 组件的弹性和容错能力。

Kubernetes 高可用性对于确保应用程序始终可用至关重要。本文提供了 Kubernetes 高可用性的全面的初学者指南,涵盖了基本概念、组件和最佳实践。

文章首先介绍了高可用性的重要性,并概述了 Kubernetes 中实现高可用性的方法。然后,它深入探讨了 Kubernetes 的核心高可用性组件。

实现 Kubernetes 高可用性的最佳实践,例如:

  • 使用多主控制平面: 避免单点故障。
  • 部署高可用节点: 使用多个节点来运行工作负载。
  • 使用自动 Pod 重新调度: 在节点故障时重新启动 Pod。
  • 监控和告警: 主动监控集群并对问题发出警报。

一、需要 Kubernetes 高可用性

Kubernetes 是一个分布式系统,它容易受到多种故障的影响。对于公司来说,拥有高可用性的 Kubernetes 以提供良好的客户体验至关重要。在发生意外中断时,如果集群在一个或多个组件发生故障后仍无法继续运行,则停机可能会导致收入损失、声誉问题等。

通过在 Kubernetes 中实施 HA,可以降低停机风险,在集群上运行的应用程序和服务仍然可用且可供用户访问,并且系统可以在没有人为干预的情况下快速从故障中恢复。在较高级别上,这可以通过部署具有跨多个可用区或区域的网络拓扑的控制平面组件的多个副本来实现。

二、Kubernetes 控制平面的高可用性

Kubernetes 控制平面具有以下核心组件。

  1. API 服务器
  2. Kube 控制器管理器
  3. Kube 调度器
  4. 云控制器管理器(可选)

运行单节点控制平面可能会导致所有控制平面组件出现单点故障。要拥有高度可用的 Kubernetes 控制平面,应至少有三个仲裁控制平面节点,并在所有三个节点上复制控制平面组件。

在这里插入图片描述
现在,了解跨节点部署为多个副本时每个控制平面组件的性质非常重要。因为很少有组件在部署为多个副本时使用 leader-election。

一起看一下每个控制位置组件的高可用性。

2.1、etcd

说到etcd HA架构,有两种模式。

  • 堆叠式 etcd:与控制平面节点一起部署的 etcd。
  • 外部 etcd 集群:运行专用节点的 etcd 集群。此模型具有管理良好的备份和还原选项的优点。

要具有容错能力至少应该有三个节点 etcd 集群。etcd 集群的容错能力如下表所示。

集群大小大多数容错能力
110
220
321
431
532
642
743

在生产部署方面,定期备份 etcd 至关重要。

2.2、API 服务器

API 服务器是一个无状态应用程序,主要与 etcd 集互以存储和检索数据。即API 服务器的多个实例可以跨不同的控制平面节点运行。

为确保集群 API 始终可用,应将负载均衡器放置在 API 服务器副本的前面。工作线程节点、最终用户和外部系统使用此负载均衡器端点与集群进行交互。

2.3、Kube 调度器

当运行多个 kube 调度程序实例时,它遵循 leader-election 方法。这是因为,schedler 组件涉及 pod 调度活动,并且一次只能有一个实例做出决策。因此,当运行调度程序的多个副本时,一个实例将被选为领导者,其他实例将被标记为跟随者。

这确保了始终有一个活动的计划程序,用于制定计划决策,并避免冲突和不一致。如果是领导者,则追随者将被选为领导者并接管所有日程安排决定。这样就拥有了一个具有一致调度的高可用性调度程序。

2.4、Kube 控制器管理器

Kuber 控制器管理器也遵循相同的领导者选举方法。在许多副本中,选出一个控制器管理器,领导者和其他人被标记为追随者。领导控制器负责控制集群的状态。

2.5、云控制器管理器

云控制器管理器 (CCM) 是一个 Kubernetes 组件,它运行与特定于云提供商的 API 交互的控制器,以管理负载均衡器、持久卷和路由等资源。

就像调度程序和 kube-controller 一样,CCM 也使用领导者选举来确保一次只有一个活动副本做出决策并与云提供商 API 交互。

三、工作节点的高可用性

要使工作器节点高可用性,需要运行应用程序所需的多个工作器节点。当存在 Pod 扩展活动或节点故障时,其他工作节点上应有足够的容量来安排 Pod。

在云平台上可以使用自动缩放来缩放工作器节点。因此,当存在扩展活动或资源需求时,工作节点可以扩展到所需的容量。

四、Kubernetes 集群可用性度量

假设没有计划内停机时间,Google SRE 手册中的下表显示了根据不同可用性级别计算允许的停机时间:
在这里插入图片描述

每个组织都有用于群集可用性的 SLO。如果使用的是管理服务,则服务提供商的 SLA 将与 SLO 保持一致。

  1. AWS EKS SLA
  2. GKE SLA
  3. Azure AKS SLA\

五、Kubernetes 可用性常见问题

(1)控制平面故障期间会发生什么?
即使发生控制平面故障,工作器节点上的现有工作负载也会继续为请求提供服务器服务。但是,如果出现节点故障,则不会发生 Pod 调度活动或任何类型的更新活动

(2)如果 Kubernetes 集群中的 DNS 服务失败,会发生什么情况?
如果 DNS 服务(如核心 DNS)发生故障,可能会对群集中运行的应用程序的可用性和功能产生重大影响。它可能会中断服务发现、外部访问、负载均衡、监视和日志记录以及滚动更新,从而导致应用程序故障、错误和中断。

六、总结

Kubernetes 高可用性对于确保应用程序始终可用至关重要。通过了解 Kubernetes 的核心高可用性组件和最佳实践,初学者可以构建高可用且弹性的 Kubernetes 集群。本文提供了 Kubernetes 高可用性的全面概述,是初学者入门并开始使用 Kubernetes 的宝贵资源。

在这里插入图片描述

这篇关于Kubernetes 高可用性入门:初学者指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/880786

相关文章

Python包管理工具pip的升级指南

《Python包管理工具pip的升级指南》本文全面探讨Python包管理工具pip的升级策略,从基础升级方法到高级技巧,涵盖不同操作系统环境下的最佳实践,我们将深入分析pip的工作原理,介绍多种升级方... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

PowerShell中15个提升运维效率关键命令实战指南

《PowerShell中15个提升运维效率关键命令实战指南》作为网络安全专业人员的必备技能,PowerShell在系统管理、日志分析、威胁检测和自动化响应方面展现出强大能力,下面我们就来看看15个提升... 目录一、PowerShell在网络安全中的战略价值二、网络安全关键场景命令实战1. 系统安全基线核查

Java操作Word文档的全面指南

《Java操作Word文档的全面指南》在Java开发中,操作Word文档是常见的业务需求,广泛应用于合同生成、报表输出、通知发布、法律文书生成、病历模板填写等场景,本文将全面介绍Java操作Word文... 目录简介段落页头与页脚页码表格图片批注文本框目录图表简介Word编程最重要的类是org.apach

Python设置Cookie永不超时的详细指南

《Python设置Cookie永不超时的详细指南》Cookie是一种存储在用户浏览器中的小型数据片段,用于记录用户的登录状态、偏好设置等信息,下面小编就来和大家详细讲讲Python如何设置Cookie... 目录一、Cookie的作用与重要性二、Cookie过期的原因三、实现Cookie永不超时的方法(一)

从入门到精通MySQL联合查询

《从入门到精通MySQL联合查询》:本文主要介绍从入门到精通MySQL联合查询,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下... 目录摘要1. 多表联合查询时mysql内部原理2. 内连接3. 外连接4. 自连接5. 子查询6. 合并查询7. 插入查询结果摘要前面我们学习了数据库设计时要满

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.

从入门到精通C++11 <chrono> 库特性

《从入门到精通C++11<chrono>库特性》chrono库是C++11中一个非常强大和实用的库,它为时间处理提供了丰富的功能和类型安全的接口,通过本文的介绍,我们了解了chrono库的基本概念... 目录一、引言1.1 为什么需要<chrono>库1.2<chrono>库的基本概念二、时间段(Durat

Linux中SSH服务配置的全面指南

《Linux中SSH服务配置的全面指南》作为网络安全工程师,SSH(SecureShell)服务的安全配置是我们日常工作中不可忽视的重要环节,本文将从基础配置到高级安全加固,全面解析SSH服务的各项参... 目录概述基础配置详解端口与监听设置主机密钥配置认证机制强化禁用密码认证禁止root直接登录实现双因素

解析C++11 static_assert及与Boost库的关联从入门到精通

《解析C++11static_assert及与Boost库的关联从入门到精通》static_assert是C++中强大的编译时验证工具,它能够在编译阶段拦截不符合预期的类型或值,增强代码的健壮性,通... 目录一、背景知识:传统断言方法的局限性1.1 assert宏1.2 #error指令1.3 第三方解决

深度解析Spring Boot拦截器Interceptor与过滤器Filter的区别与实战指南

《深度解析SpringBoot拦截器Interceptor与过滤器Filter的区别与实战指南》本文深度解析SpringBoot中拦截器与过滤器的区别,涵盖执行顺序、依赖关系、异常处理等核心差异,并... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现