FlinkX流控实现

2024-08-28 05:32
文章标签 实现 流控 flinkx

本文主要是介绍FlinkX流控实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

FlinkX流控实现

流量控制防止并发性能过高对源数据库造成影响。

在FlinkX中,流量控制是采用Byte为单位/s进行流量控制的。

配置参数实例:

{“speed”: {"bytes": 0}
}

当 bytes > 0 时,才会开启流量控制。

整个计算的速率是根据整个系统中的指标,按照每秒的窗口,实时计算出限流的速率的。通过对读取记录的限流,但是没有背压。


image-20200524100353781

限流原理

实现逻辑

首先我们看一下读取器的初始化过程,

InputFormat初始化

public void open(InputSplit inputSplit) throws IOException {checkIfCreateSplitFailed(inputSplit);if(!inited){// 初始化累加器收集器,每秒从FlinkAPI读取对应累加器的值,并设置为global值initAccumulatorCollector();// 初始化指标累加器,每次调用nextRecord时提交指标initStatisticsAccumulator();// 开启限流器openByteRateLimiter();initRestoreInfo();if(restoreConfig.isRestore()){formatState.setNumOfSubTask(indexOfSubTask);}inited = true;}openInternal(inputSplit);}

本次只看前三个。

  1. 初始化累加器收集器,每秒从FlinkAPI读取对应累加器的值,并设置为global值(下文中计算速率是有用到)

  2. 初始化指标累加器,每次调用nextRecord时提交指标

  3. 开启限流器

  4. 初始化Restore配置(本章不讲,后续章节有用到)

我们重点详解一下前三个步骤:

在详解每一个步骤之前,首先了解下在数据同步过程中具体的指标

指标详情

分类指标名称含义
读取指标numRead累计读取数据条数
byteRead累计读取数据字节数
readDuration读取数据的总时间
写入指标numWrite累计写入数据条数
byteWrite累计写入数据字节数
writeDuration写入数据的总时间
错误指标nErrors累计错误记录数
nullErrors累计空指针错误记录数
duplicateErrors累计主键冲突错误记录数
conversionErrors累计类型转换错误记录数
otherErrors累计其它错误记录数

全局指标实现

如何控制全局限流,很重要的一环就是收集到全局系统的关键状况,无论是微服务调用还是读取限流本质都是同一个道理。首先需要找一个全局存储提供这些指标的存储和更新,FlinkX在这里使用的Flinx的累加器

image-20200524101615078

指标初始化
private void initStatisticsAccumulator(){numReadCounter = getRuntimeContext

这篇关于FlinkX流控实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1113862

相关文章

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python中将嵌套列表扁平化的多种实现方法

《Python中将嵌套列表扁平化的多种实现方法》在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋... 目录python中将嵌套列表扁平化的方法技术背景实现步骤1. 使用嵌套列表推导式2. 使用itert

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

在Linux中改变echo输出颜色的实现方法

《在Linux中改变echo输出颜色的实现方法》在Linux系统的命令行环境下,为了使输出信息更加清晰、突出,便于用户快速识别和区分不同类型的信息,常常需要改变echo命令的输出颜色,所以本文给大家介... 目python录在linux中改变echo输出颜色的方法技术背景实现步骤使用ANSI转义码使用tpu

Python使用python-can实现合并BLF文件

《Python使用python-can实现合并BLF文件》python-can库是Python生态中专注于CAN总线通信与数据处理的强大工具,本文将使用python-can为BLF文件合并提供高效灵活... 目录一、python-can 库:CAN 数据处理的利器二、BLF 文件合并核心代码解析1. 基础合

Python使用OpenCV实现获取视频时长的小工具

《Python使用OpenCV实现获取视频时长的小工具》在处理视频数据时,获取视频的时长是一项常见且基础的需求,本文将详细介绍如何使用Python和OpenCV获取视频时长,并对每一行代码进行深入解析... 目录一、代码实现二、代码解析1. 导入 OpenCV 库2. 定义获取视频时长的函数3. 打开视频文

golang版本升级如何实现

《golang版本升级如何实现》:本文主要介绍golang版本升级如何实现问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录golanwww.chinasem.cng版本升级linux上golang版本升级删除golang旧版本安装golang最新版本总结gola

SpringBoot中SM2公钥加密、私钥解密的实现示例详解

《SpringBoot中SM2公钥加密、私钥解密的实现示例详解》本文介绍了如何在SpringBoot项目中实现SM2公钥加密和私钥解密的功能,通过使用Hutool库和BouncyCastle依赖,简化... 目录一、前言1、加密信息(示例)2、加密结果(示例)二、实现代码1、yml文件配置2、创建SM2工具

Mysql实现范围分区表(新增、删除、重组、查看)

《Mysql实现范围分区表(新增、删除、重组、查看)》MySQL分区表的四种类型(范围、哈希、列表、键值),主要介绍了范围分区的创建、查询、添加、删除及重组织操作,具有一定的参考价值,感兴趣的可以了解... 目录一、mysql分区表分类二、范围分区(Range Partitioning1、新建分区表:2、分

MySQL 定时新增分区的实现示例

《MySQL定时新增分区的实现示例》本文主要介绍了通过存储过程和定时任务实现MySQL分区的自动创建,解决大数据量下手动维护的繁琐问题,具有一定的参考价值,感兴趣的可以了解一下... mysql创建好分区之后,有时候会需要自动创建分区。比如,一些表数据量非常大,有些数据是热点数据,按照日期分区MululbU