Kubernetes集群上的Etcd备份和恢复

2024-05-24 08:28

本文主要是介绍Kubernetes集群上的Etcd备份和恢复,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在本教程中,您将学习如何在Kubernetes集群上使用etcd快照进行etcd备份和恢复。

在Kubernetes架构中,etcd是集群的重要组成部分。所有集群对象及其状态都存储在etcd中。为了更好地理解Kubernetes,有几点关于etcd的信息是您需要了解的。

  • 它是一个一致的、分布式的、安全的键值存储。
  • 它使用raft协议。
  • 支持堆叠etcd的高可用架构。
  • 它存储kubernetes集群配置、所有API对象、对象状态和服务发现细节。

Kubernetes etcd 备份使用etcdctl

以下是您应该了解的有关 etcd 备份的信息。

  1. etcd 有一个内置的快照机制。
  2. etcdctl是与 etcd 交互以获取快照的命令行实用程序。

按照下面给出的步骤备份 etcd 快照。

  1. 登录到控制平面
  2. 如果群集控制平面中没有 etcdctl,请使用以下命令进行安装。
sudo apt install etcd-client
  1. 我们需要将以下三部分信息传递给etcdctl以获取etcd快照。
    1. etcd endpoint (–endpoints)
    2. ca certificate (–cacert)
    3. server certificate (–cert)
    4. server key (–key)

你可以通过两种方式获得上述参数。

  • etcd的静态pod清单文件位于/etc/kubernetes/manifest/etcd.yaml位置。

  • 您也可以通过描述在kube-system命名空间中运行的etcd pod来获得上述细节。在描述pod时,将etcd-master-node替换为您的etcd pod名称。
kubectl get po -n kube-system
kubectl describe pod etcd-master-node -n kube-system
  1. 使用以下命令进行etcd快照备份。
ETCDCTL_API=3 etcdctl \--endpoints=https://127.0.0.1:2379 \--cacert=<ca-file> \--cert=<cert-file> \--key=<key-file> \snapshot save <backup-file-location>

添加实际位置和参数时,命令如下所示。执行该命令进行备份。您可以将/opt/backup/etc.db替换为您选择的位置和名称。

ETCDCTL_API=3 etcdctl \--endpoints=https://127.0.0.1:2379 \--cacert=/etc/kubernetes/pki/etcd/ca.crt \--cert=/etc/kubernetes/pki/etcd/server.crt \--key=/etc/kubernetes/pki/etcd/server.key \snapshot save /opt/backup/etcd.db

如果执行成功,你会得到一个“Snapshot saved at /opt/backup/etc.db”的消息,如下所示。

此外,您可以使用以下命令来验证快照。

ETCDCTL_API=3 etcdctl --write-out=table snapshot status /opt/backup/etcd.db

下面是一个示例输出。

+----------+----------+------------+------------+
|   HASH   | REVISION | TOTAL KEYS | TOTAL SIZE |
+----------+----------+------------+------------+
| b7147656 |    51465 |       1099 |     5.1 MB |
+----------+----------+------------+------------+

Kubernetes etcd恢复使用快照备份

现在我们在/opt/backup/etc.db位置有了备份。我们将使用快照备份来恢复etcd。

下面是恢复etcd的命令。

ETCDCTL_API=3 etcdctl snapshot restore <backup-file-location>

让我们执行etcd还原命令。/opt/backup/etc.db是备份文件。

ETCDCTL_API=3 etcdctl snapshot restore /opt/backup/etcd.db

如果您想使用特定的数据目录进行恢复,可以使用--data-dir标志添加位置,如下所示。

ETCDCTL_API=3 etcdctl --data-dir /opt/etcd snapshot restore /opt/backup/etcd.db

创建定时任务备份

通过配置 Kubernetes CronJob,可以指定定期执行备份任务的时间表,确保etcd数据在指定的时间间隔内自动备份。这种方式不仅简化了备份流程,还能确保集群数据的安全和持久性,防止数据丢失。CronJob的灵活性和自动化特性使得管理和维护etcd备份变得更加高效和可靠。

apiVersion: batch/v1
kind: CronJob
metadata:name: etcd-disaster-recovery  # 定义 CronJob 的名称namespace: cronjob  # 指定 CronJob 所属的命名空间
spec:schedule: "0 2 * * *"  # 设置定时任务的调度时间表达式,表示每天凌晨2点执行一次jobTemplate:spec:template:metadata:# labels:#   app: etcd-disaster-recovery  # 为 Pod 添加标签,可根据需要注释或删除spec:affinity:  # 定义 Pod 的亲和性配置nodeAffinity:requiredDuringSchedulingIgnoredDuringExecution:nodeSelectorTerms:- matchExpressions:- key: kubernetes.io/hostnameoperator: Invalues:- master01  # 选择特定的节点(这里是选择 hostname 为 master01 的节点)containers:  # 定义 Pod 中的容器- name: etcd  # 容器名称image: registry.k8s.io/etcd:3.5.10-0  # 使用的 etcd 镜像版本为 3.5.10-0imagePullPolicy: "IfNotPresent"  # 镜像拉取策略,如果本地已存在该镜像,则不重新拉取command:  # 容器启动命令- sh- -c- "export ETCDCTL_API=3; \etcdctl --endpoints=$ENDPOINT \--cert=/etc/kubernetes/pki/etcd/server.crt \--key=/etc/kubernetes/pki/etcd/server.key \--cacert=/etc/kubernetes/pki/etcd/ca.crt \snapshot save /snapshot/snapshot.db; \echo etcd backup success"env:  # 环境变量配置,设置了一个名为 ENDPOINT 的环境变量,值为 "https://127.0.0.1:2379"- name: ENDPOINTvalue: "https://127.0.0.1:2379"volumeMounts:  # 挂载配置,指定了容器中需要挂载的卷和挂载路径- mountPath: "/etc/kubernetes/pki/etcd"  # 将主机上的 /etc/kubernetes/pki/etcd 目录挂载到容器的 /etc/kubernetes/pki/etcd 路径name: etcd-certs- mountPath: "/var/lib/etcd"  # 将主机上的 /var/lib/etcd 目录挂载到容器的 /var/lib/etcd 路径name: etcd-data- mountPath: "/snapshot"  # 将主机上的 /root/etcd/snapshot 目录挂载到容器的 /snapshot 路径name: snapshotsubPath: data/etcd-snapshot  # 在主机上的 /root/etcd/snapshot 目录下,将数据挂载到容器的 /snapshot/data/etcd-snapshot 路径下- mountPath: /etc/localtime  # 将主机上的 /etc/localtime 文件挂载到容器的 /etc/localtime 路径name: lt-config- mountPath: /etc/timezone  # 将主机上的 /etc/timezone 文件挂载到容器的 /etc/timezone 路径name: tz-configrestartPolicy: OnFailure  # 定义容器重启策略,当容器失败时才会重启volumes:  # 卷配置,定义了 Pod 中使用的卷- name: etcd-certshostPath:path: /etc/kubernetes/pki/etcd  # 使用主机上的 /etc/kubernetes/pki/etcd 目录作为卷- name: etcd-datahostPath:path: /var/lib/etcd  # 使用主机上的 /var/lib/etcd 目录作为卷- name: snapshothostPath:path: /root/etcd/snapshot  # 使用主机上的 /root/etcd/snapshot 目录作为卷- name: lt-confighostPath:path: /etc/localtime  # 使用主机上的 /etc/localtime 文件作为卷- name: tz-confighostPath:path: /etc/timezone  # 使用主机上的 /etc/timezone 文件作为卷hostNetwork: true  # 使用主机网络模式,Pod 将共享主机的网络命名空间

结论

在这篇博客中,我们学习了使用etcdctl命令行实用工具进行Kubernetes etcd备份和恢复。

这篇关于Kubernetes集群上的Etcd备份和恢复的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/997883

相关文章

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

centos7基于keepalived+nginx部署k8s1.26.0高可用集群

《centos7基于keepalived+nginx部署k8s1.26.0高可用集群》Kubernetes是一个开源的容器编排平台,用于自动化地部署、扩展和管理容器化应用程序,在生产环境中,为了确保集... 目录一、初始化(所有节点都执行)二、安装containerd(所有节点都执行)三、安装docker-

Golang使用etcd构建分布式锁的示例分享

《Golang使用etcd构建分布式锁的示例分享》在本教程中,我们将学习如何使用Go和etcd构建分布式锁系统,分布式锁系统对于管理对分布式系统中共享资源的并发访问至关重要,它有助于维护一致性,防止竞... 目录引言环境准备新建Go项目实现加锁和解锁功能测试分布式锁重构实现失败重试总结引言我们将使用Go作

如何在一台服务器上使用docker运行kafka集群

《如何在一台服务器上使用docker运行kafka集群》文章详细介绍了如何在一台服务器上使用Docker运行Kafka集群,包括拉取镜像、创建网络、启动Kafka容器、检查运行状态、编写启动和关闭脚本... 目录1.拉取镜像2.创建集群之间通信的网络3.将zookeeper加入到网络中4.启动kafka集群

Nacos集群数据同步方式

《Nacos集群数据同步方式》文章主要介绍了Nacos集群中服务注册信息的同步机制,涉及到负责节点和非负责节点之间的数据同步过程,以及DistroProtocol协议在同步中的应用... 目录引言负责节点(发起同步)DistroProtocolDistroSyncChangeTask获取同步数据getDis

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

HDFS—集群扩容及缩容

白名单:表示在白名单的主机IP地址可以,用来存储数据。 配置白名单步骤如下: 1)在NameNode节点的/opt/module/hadoop-3.1.4/etc/hadoop目录下分别创建whitelist 和blacklist文件 (1)创建白名单 [lytfly@hadoop102 hadoop]$ vim whitelist 在whitelist中添加如下主机名称,假如集群正常工作的节

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

电脑桌面文件删除了怎么找回来?别急,快速恢复攻略在此

在日常使用电脑的过程中,我们经常会遇到这样的情况:一不小心,桌面上的某个重要文件被删除了。这时,大多数人可能会感到惊慌失措,不知所措。 其实,不必过于担心,因为有很多方法可以帮助我们找回被删除的桌面文件。下面,就让我们一起来了解一下这些恢复桌面文件的方法吧。 一、使用撤销操作 如果我们刚刚删除了桌面上的文件,并且还没有进行其他操作,那么可以尝试使用撤销操作来恢复文件。在键盘上同时按下“C