【大数据】Flink 中的 Slot、Task、Subtask、并行度

2024-02-06 07:20

本文主要是介绍【大数据】Flink 中的 Slot、Task、Subtask、并行度,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Flink 中的 Slot、Task、Subtask、并行度

  • 1.并行度
  • 2.Task 与线程
  • 3.算子链与 slot 共享资源组
  • 4.Task slots 与系统资源
  • 5.总结

我们在使用 Flink 时,经常会听到 taskslot线程 以及 并行度 这几个概念,对于初学者来说,这几个概念以及它们与内存,CPU 之间的关系经常搞不清楚,下面我们就通过这篇文章来弄清楚这些概念。

1.并行度

特定算子的子任务(subtask)的 个数 称之为 并行度parallel)。一般情况下,一个 数据流的并行度 可以认为是其 所有算子中最大的并行度。Flink 中每个算子都可以在代码中通过 .setParallelism(n) 来重新设置并行度,而并行执行的 subtask 要发布到不同的 slot 中去执行。

2.Task 与线程

对于分布式执行的任务,Flink 将算子的 subtasks 链接成 tasks。每个 subtask 由一个线程执行。如下图中样例数据流用 5 个 subtask 执行,因此就有 5 个并行线程。

在这里插入图片描述
上图中,source + map 算子组成一个 subtask,并行度为 2,keyby + window + apply 算子组成一个 subtask,并行度为 2,sink 算子组成一个 subtask,并行度为 1。

3.算子链与 slot 共享资源组

前面提到 Flink 会将算子的 subtask 链接成 task,实际上就是通过算子链操作来实现的。将算子链接成 task 的好处:

  • ✅ 它减少线程间切换、缓冲的开销,并且减少延迟的同时增加整体吞吐量。
  • ✅ 链行为是可以配置的;将两个算子链接在一起能使得它们在同一个线程中执行,从而提升性能。

Flink 默认会将能链接的算子尽可能地进行链接(例如两个 map 转换操作)。 此外, Flink 还提供了对链接更细粒度控制的 API 以满足更多需求。

如果想对整个作业禁用算子链,可以调用 StreamExecutionEnvironment.disableOperatorChaining()。下列方法还提供了更细粒度的控制。需要注意的是, 这些方法只能在 DataStream 转换操作后才能被调用,因为它们只对前一次数据转换生效。例如,可以 someStream.map(...).startNewChain() 这样调用,而不能 someStream.startNewChain() 这样。

另外,一个 slot 共享资源组对应着 Flink 中的一个 slot 槽, 可以根据需要手动地将各个算子隔离到不同的 slot 中。

Transformation
Description
Start new chain以当前 operator 为起点开始新的连接。如下的两个 mapper 算子会链接在一起而 filter 算子则不会和第一个 mapper 算子进行链接。someStream.filter(...).map(...).startNewChain().map(...)
Disable chaining任何算子不能和当前算子进行链接。someStream.map(...).disableChaining()
Set slot sharing group配置算子的资源组。Flink 会将相同资源组的算子放置到同一个 slot 槽中执行,并将不同资源组的算子分配到不同的 slot 槽中,从而实现 slot 槽隔离。如果所有输入操作都在同一个资源组,资源组将从输入算子开始继承。Flink 默认的资源组名称为 default,算子可以显式调用 slotSharingGroup("default") 加入到这个资源组中 .someStream.filter(...).slotSharingGroup("name")

4.Task slots 与系统资源

每个 worker(TaskManager)都是一个 JVM 进程,可以在单独的线程中执行一个或多个 subtask。为了控制一个 TaskManager 中接受多少个 task,就有了所谓的 task slot(至少一个)。

每个 task slot 代表 TaskManager 中 资源的固定子集。例如,具有 3 个 slot 的 TaskManager,会将其托管内存 1 / 3 1/3 1/3 用于每个 slot。分配资源意味着 subtask 不会与其他作业的 subtask 竞争托管内存,而是具有一定数量的保留托管内存。注意此处没有 CPU 隔离;当前 slot 仅分离 task 的托管内存。

通过调整 task slot 的数量,用户可以定义 subtask 如何互相隔离。每个 TaskManager 有一个 slot,这意味着每个 task 组都在单独的 JVM 中运行(例如,可以在单独的容器中启动)。具有多个 slot 意味着更多 subtask 共享同一 JVM。同一 JVM 中的 task 共享 TCP 连接(通过多路复用)和心跳信息。它们还可以共享数据集和数据结构,从而减少了每个 task 的开销。

在这里插入图片描述
上边例子,从图所示 5 个 subtask 用 5 个 task slot 来执行,一定是这样分配的吗?

这个还真不一定,默认情况下,上边例子只需要 2 个 slot 就可以了。

在这里插入图片描述
我们再看另外一个例子,当我们把并行度调大为 6。

在这里插入图片描述
按照并行度拆开这个任务(task),我们发现会有 13 个 subtask,那么是不是就意味着需要 13 个 slot 才能执行该任务呢?

答案是否定的,实际是只需要 6 个 slot 就够了。

为什么会这样呢?我们来看两条规则:

  • 1️⃣ 默认情况下,Flink 允许子任务共享 slot,即使他们是不同任务的子任务。这样的结果就是一个 slot 可以保存作业的整个 pipeline
  • 2️⃣ Task Slot 是静态的概念,指的是 TaskManager 具有的并发执行能力。

在这里插入图片描述
实际上,第一个 slot 会运行 3 个 subtask,也就是执行 3 个线程。

前面也提到了 slot 只是做了内存隔离,并没有做 CPU 隔离,但是 CPU 资源是有限的,所以我们在设置资源参数时,需要考虑一下集群可提供的资源。

在这里插入图片描述
那么问题又来了,上面这个图中所示需要 5 个 task slot,但是默认情况下 Flink 会自动优化成为需要 2 个 slot,如果我们不想使用默认的 slot 个数来执行呢,那就要通过 slot 共享组来实现了。

DataStream<String> inputDataStream = env.socketTextStream(host, port);
DataStream<Tuple2<String, Integer>> resultStream = inputDataStream.flatMap(new WordCount.MyFlatMapper()).slotSharingGroup("green").keyBy(0).sum(1).setParallelism(2).slotSharingGroup("red");resultStream.print().setParallelism(1);

这几行代码几个 subtask?并行度是多少?用几个 task slot

看一下以上代码运行时 Flink Web UI:

在这里插入图片描述
从 Web UI 界面可以看出,该任务被切分成了 5 个子 task,按照最大并行度算子来算,这个任务的并行度应该为 2,那么这 5 个 subtask 占用了几个 slot 呢?

通过设置 slotSharingGroup,是手动干预 slot 分配的手段之一,默认情况下,整个 StreamGraph 都会用一个默认的 default SlotSharingGroup,即所有的 task 都可以共用一个 slot

上面代码里,source 算子并没有显式分配 slot 共享组,所以它将被分在默认的 default 共享组里,而 flatMap 算子被显式指定到了 green 共享组里,聚合算子同样被显式指定到了 red 共享组里,那么最后的 sink 算子呢?注意,默认情况下,每一个算子会与其前一个算子保持在同一个共享组内,所以 sink 算子(也就是上边的打印算子)也会被分配在 red 共享组里,按照 slot 共享组进行分组,每个分组最大的并行度相加,就是这个任务所占用的总共 slot,所以应该是 4 个。

在这里插入图片描述

5.总结

通过上面几个例子,我们已经很清楚的理解这些概念了,总结以下几点:

  • 1️⃣ Flink 中 slot 是任务执行所申请资源的最小单元,同一个 TaskManager 上的所有 slot 都只是做了内存分离,并没有做 CPU 隔离。
  • 2️⃣ 每一个 TaskManager 都是一个 JVM 进程,如果某个 TaskManager 上只有一个 slot,这意味着每个 task 组都在单独的 JVM 中运行,如果有多个 slot 就意味着更多 subtask 共享同一 JVM。
  • 3️⃣ 一般情况下有多少个 subtask,就是有多少个并行线程,而并行执行的 subtask 要发布到不同的 slot 中去执行。
  • 4️⃣ Flink 默认会将能链接的算子尽可能地进行链接,也就是算子链,Flink 会将同一个算子链分组内的 subtask 都发到同一个 slot 去执行,也就是说一个 slot 可能要执行多个 subtask,即多个线程。
  • 5️⃣ Flink 可以根据需要手动地将各个算子隔离到不同的 slot 中。
  • 6️⃣ 一个任务所用的总共 slot 为所有资源隔离组所占用的 slot 之和,同一个资源隔离组内,按照算子的最大并行度来分配 slot

这篇关于【大数据】Flink 中的 Slot、Task、Subtask、并行度的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/683555

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

pandas数据过滤

Pandas 数据过滤方法 Pandas 提供了多种方法来过滤数据,可以根据不同的条件进行筛选。以下是一些常见的 Pandas 数据过滤方法,结合实例进行讲解,希望能帮你快速理解。 1. 基于条件筛选行 可以使用布尔索引来根据条件过滤行。 import pandas as pd# 创建示例数据data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dav

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者