Flink1.12 native kubernetes 演进之路

本文主要是介绍Flink1.12 native kubernetes 演进之路，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

点击上方 "zhisheng"关注, 星标或置顶一起成长

Flink 从入门到精通系列文章

Flink 1.10

Flink 1.10 开始支持将 native kubernetes 作为其资源管理器。在该版本中，你可以使用以下命令在你的 kubernetes 集群中创建一个flink session。

./bin/kubernetes-session.sh \-Dkubernetes.cluster-id=<ClusterId> \-Dtaskmanager.memory.process.size=4096m \-Dkubernetes.taskmanager.cpu=2 \-Dtaskmanager.numberOfTaskSlots=4 \-Dresourcemanager.taskmanager-timeout=3600000

此时创建session 的 kubernetes 相关参数支持的比较少，只支持设置资源大小，容器镜像，命名空间等基本参数。对于生产环境，暴露这些参数远远不够。

然后使用如下的命令，提交任务到我们刚刚创建的Session 中：

 ./bin/flink run -d -e kubernetes-session -Dkubernetes.cluster-id=<ClusterId> examples/streaming/WindowJoin.jar

Flink 1.11

Flink1.11，首先创建 session 的kubernetes 相关参数支持增多了，支持了node-selector， tolerations等调度相关参数，并且支持设置保留JobManager端点的服务类型。

支持资源调度相关参数，对于生产环境非常重要。我们可以控制我们的 session 集群资源，主要是jobmanager 和 taskmanager 调度到指定的机器上，是实现资源隔离，安全，计费的前提。

另外flink1.11 新增了Application 模式（和Session 模式不同）。Application模式允许用户创建一个包含作业和Flink运行时的镜像，根据需要自动创建和销毁集群组件。

该模式就更加云原生了，可以充分发挥native k8s的弹性。根据提交的任务，来自动创建jobmanager 和 taskmanager ，待任务运行完成，则自动销毁jobmanager 和 taskmanager 。

可以使用如下命令，启动application：

 ./bin/flink run-application -p 8 -t kubernetes-application \-Dkubernetes.cluster-id=<ClusterId> \-Dtaskmanager.memory.process.size=4096m \-Dkubernetes.taskmanager.cpu=2 \-Dtaskmanager.numberOfTaskSlots=4 \-Dkubernetes.container.image=<CustomImageName> \local:///opt/flink/usrlib/my-flink-job.jar

Flink 1.12

Flink 1.12 之前的版本中JobManager的 HA 是通过ZooKeeper 来实现的。

在1.12 版本中，Kubernetes提供了Flink可用于JobManager故障转移的内置功能，而不是依赖ZooKeeper。Kubernetes HA 服务与ZooKeeper实现基于相同的基本接口构建，并使用Kubernetes的ConfigMap对象处理从JobManager故障中恢复所需的所有元数据。

为了启动HA集群，您必须配置以下步骤：

high-availability(required): high-availability 选项必须设置为KubernetesHaServicesFactory。

high-availability: org.apache.flink.kubernetes.highavailability.KubernetesHaServicesFactory

high-availability.storageDir(required): JobManager元数据将持久保存在文件系统high-availability.storageDir中，并且仅指向此状态的指针存储在Kubernetes中。

high-availability.storageDir: s3:///flink/recovery kubernetes.cluster-id(required): 为了标识Flink集群，您必须指定kubernetes.cluster-id。

kubernetes.cluster-id: cluster1337

此外flink 1.12 支持flink 中程序使用kubernetes 中的secrets。通过如下两种方式：

将Secrets用作Pod中的文件；
使用Secrets作为环境变量；

这样的话，我们可以将一些敏感凭证数据放到Secret中。在安全性上是一种增强。

最后Flink使用Kubernetes OwnerReference来清理所有集群组件。由Flink创建的所有资源，包括ConfigMap，Service和Pod，都将OwnerReference设置为Deployment/<cluster-id>。删除部署后，所有相关资源将自动删除。

总结

Flink 对于native kubernetes 的支持逐步增强，kubernets 相对于yarn等资源管理器，有着诸多的优势。

https://zhuanlan.zhihu.com/p/336070632

基于 Apache Flink 的实时监控告警系统关于数据中台的深度思考与总结（干干货）日志收集Agent，阴暗潮湿的地底世界
2020 继续踏踏实实的做好自己

公众号(zhisheng)里回复 面经、ClickHouse、ES、Flink、 Spring、Java、Kafka、监控 等关键字可以查看更多关键字对应的文章。

点个赞+在看，少个 bug ????

这篇关于Flink1.12 native kubernetes 演进之路的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

Flink1.12 native kubernetes 演进之路

Flink 1.11

Flink 1.12

总结

相关文章

Kubernetes常用命令大全近期总结

Kubernetes PodSecurityPolicy：PSP能实现的5种主要安全策略

native和static native区别

K8S（Kubernetes）开源的容器编排平台安装步骤详解

什么是Kubernetes PodSecurityPolicy？

容器编排平台Kubernetes简介

【Kubernetes】K8s 的安全框架和用户认证

kubernetes集群部署Zabbix监控平台

【Kubernetes】常见面试题汇总（三）

【Kubernetes】常见面试题汇总（一）