FlinkX流控实现

2024-08-28 05:32
文章标签 实现 流控 flinkx

本文主要是介绍FlinkX流控实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

FlinkX流控实现

流量控制防止并发性能过高对源数据库造成影响。

在FlinkX中,流量控制是采用Byte为单位/s进行流量控制的。

配置参数实例:

{“speed”: {"bytes": 0}
}

当 bytes > 0 时,才会开启流量控制。

整个计算的速率是根据整个系统中的指标,按照每秒的窗口,实时计算出限流的速率的。通过对读取记录的限流,但是没有背压。


image-20200524100353781

限流原理

实现逻辑

首先我们看一下读取器的初始化过程,

InputFormat初始化

public void open(InputSplit inputSplit) throws IOException {checkIfCreateSplitFailed(inputSplit);if(!inited){// 初始化累加器收集器,每秒从FlinkAPI读取对应累加器的值,并设置为global值initAccumulatorCollector();// 初始化指标累加器,每次调用nextRecord时提交指标initStatisticsAccumulator();// 开启限流器openByteRateLimiter();initRestoreInfo();if(restoreConfig.isRestore()){formatState.setNumOfSubTask(indexOfSubTask);}inited = true;}openInternal(inputSplit);}

本次只看前三个。

  1. 初始化累加器收集器,每秒从FlinkAPI读取对应累加器的值,并设置为global值(下文中计算速率是有用到)

  2. 初始化指标累加器,每次调用nextRecord时提交指标

  3. 开启限流器

  4. 初始化Restore配置(本章不讲,后续章节有用到)

我们重点详解一下前三个步骤:

在详解每一个步骤之前,首先了解下在数据同步过程中具体的指标

指标详情

分类指标名称含义
读取指标numRead累计读取数据条数
byteRead累计读取数据字节数
readDuration读取数据的总时间
写入指标numWrite累计写入数据条数
byteWrite累计写入数据字节数
writeDuration写入数据的总时间
错误指标nErrors累计错误记录数
nullErrors累计空指针错误记录数
duplicateErrors累计主键冲突错误记录数
conversionErrors累计类型转换错误记录数
otherErrors累计其它错误记录数

全局指标实现

如何控制全局限流,很重要的一环就是收集到全局系统的关键状况,无论是微服务调用还是读取限流本质都是同一个道理。首先需要找一个全局存储提供这些指标的存储和更新,FlinkX在这里使用的Flinx的累加器

image-20200524101615078

指标初始化
private void initStatisticsAccumulator(){numReadCounter = getRuntimeContext

这篇关于FlinkX流控实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1113862

相关文章

Java实现将byte[]转换为File对象

《Java实现将byte[]转换为File对象》这篇文章将通过一个简单的例子为大家演示Java如何实现byte[]转换为File对象,并将其上传到外部服务器,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言1. 问题背景2. 环境准备3. 实现步骤3.1 从 URL 获取图片字节数据3.2 将字节数组

Win32下C++实现快速获取硬盘分区信息

《Win32下C++实现快速获取硬盘分区信息》这篇文章主要为大家详细介绍了Win32下C++如何实现快速获取硬盘分区信息,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 实现代码CDiskDriveUtils.h#pragma once #include <wtypesbase

Nginx实现前端灰度发布

《Nginx实现前端灰度发布》灰度发布是一种重要的策略,它允许我们在不影响所有用户的情况下,逐步推出新功能或更新,通过灰度发布,我们可以测试新版本的稳定性和性能,下面就来介绍一下前端灰度发布的使用,感... 目录前言一、基于权重的流量分配二、基于 Cookie 的分流三、基于请求头的分流四、基于请求参数的分

Python Excel实现自动添加编号

《PythonExcel实现自动添加编号》这篇文章主要为大家详细介绍了如何使用Python在Excel中实现自动添加编号效果,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、背景介绍2、库的安装3、核心代码4、完整代码1、背景介绍简单的说,就是在Excel中有一列h=会有重复

MySQL的隐式锁(Implicit Lock)原理实现

《MySQL的隐式锁(ImplicitLock)原理实现》MySQL的InnoDB存储引擎中隐式锁是一种自动管理的锁,用于保证事务在行级别操作时的数据一致性和安全性,本文主要介绍了MySQL的隐式锁... 目录1. 背景:什么是隐式锁?2. 隐式锁的工作原理3. 隐式锁的类型4. 隐式锁的实现与源代码分析4

如何通过Golang的container/list实现LRU缓存算法

《如何通过Golang的container/list实现LRU缓存算法》文章介绍了Go语言中container/list包实现的双向链表,并探讨了如何使用链表实现LRU缓存,LRU缓存通过维护一个双向... 目录力扣:146. LRU 缓存主要结构 List 和 Element常用方法1. 初始化链表2.

MySQL中Next-Key Lock底层原理实现

《MySQL中Next-KeyLock底层原理实现》Next-KeyLock是MySQLInnoDB存储引擎中的一种锁机制,结合记录锁和间隙锁,用于高效并发控制并避免幻读,本文主要介绍了MySQL中... 目录一、Next-Key Lock 的定义与作用二、底层原理三、源代码解析四、总结Next-Key L

Java中数组转换为列表的两种实现方式(超简单)

《Java中数组转换为列表的两种实现方式(超简单)》本文介绍了在Java中将数组转换为列表的两种常见方法使用Arrays.asList和Java8的StreamAPI,Arrays.asList方法简... 目录1. 使用Java Collections框架(Arrays.asList)1.1 示例代码1.

Redis实现RBAC权限管理

《Redis实现RBAC权限管理》本文主要介绍了Redis实现RBAC权限管理,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1. 什么是 RBAC?2. 为什么使用 Redis 实现 RBAC?3. 设计 RBAC 数据结构

SpringBoot基于沙箱环境实现支付宝支付教程

《SpringBoot基于沙箱环境实现支付宝支付教程》本文介绍了如何使用支付宝沙箱环境进行开发测试,包括沙箱环境的介绍、准备步骤、在SpringBoot项目中结合支付宝沙箱进行支付接口的实现与测试... 目录一、支付宝沙箱环境介绍二、沙箱环境准备2.1 注册入驻支付宝开放平台2.2 配置沙箱环境2.3 沙箱