奇富科技引领大数据调度革命:高效、稳定、实时诊断

2023-10-30 20:20

本文主要是介绍奇富科技引领大数据调度革命:高效、稳定、实时诊断,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

日前,在世界最大的开源基金会 Apache旗下最为活跃的项目之一DolphinScheduler组织的分享活动上,奇富科技的数据平台专家刘坤元应邀为国内外技术工作者献上一场题为《Apache DolphinScheduler在奇富科技的优化实践》的精彩分享,为大数据任务调度系统的未来探索出一条新的道路。

7301dcfe7d3e4cc4b2e44b03a99db6fb.png 

刘坤元以一个数仓(数据仓库的简称,指用于存储、分析、报告的数据系统)同学熟知的起夜率指标开启了本次分享。

在建设大数据平台时,企业通常会面临数据生产的稳定性问题,数仓同学在值班期间需要处理各种告警和任务。工作通常从凌晨0:30开始,收到首条告警后起床,不断接到更多电话告警,不得不跑到客厅办公。由于对上下游任务逻辑不太清楚,2:00左右召集其他同学一起处理问题。凌晨3:00时,惊动老板起夜,电话沟通处理方案。5:00,所有任务处理完成后,等待计算数据。7:00睡眼朦胧地起床上班。9:00刚到公司楼下,就被业务人员在工作群里“+1”“+1”“+10086”地催问数据产出时间,手忙脚乱中开始一天的工作。

“可以说,天下数仓同学苦起夜值班久矣!好消息是,在奇富科技内部,由于引入了Apache DolphinScheduler,起夜率这个核心指标有了83%的下降。”刘坤元说。

谈到Apache DolphinScheduler的引入,刘坤元回顾了奇富科技数据平台工作原本面临的挑战。

由于奇富科技是一家金融科技公司,业务需要保证高可用,所以,奇富科技的调度平台是异地双机房架构,核心工作流会异地双机房运行。这会带来三点困难。

首先,调度任务量大。目前每天调度的工作流实例在3万多,任务实例在14万多。每天调度的任务量非常庞大。每天保障这么多任务实例稳定、无延迟运行,是一个非常大的挑战。

其次,运维复杂。因为每天调度的任务实例非常多,经历了几次调度机器扩容阶段。目前2个调度集群有6台Master、34台Worker机器。而且调度机器处于异地2个城市,增加了很多管理运维复杂性。

第三,SLA要求高。因为要支持的业务带有金融属性,如果调度服务稳定性出问题,导致任务重复调度、漏调度或者异常,损失会非常大。

针对以上三个问题,奇富科技在2022年中着手引入了Apache DolphinScheduler,围绕调度服务稳定,做了两个方向的优化。第一,调度服务稳定性优化。第二、调度服务监控。细节请见《Apache DolphinScheduler 在奇富科技的首个调度异地部署实践》https://mp.weixin.qq.com/s/hAp7IQPWbhaaVuRsW7LtGg

改造之后的效果,刘坤元也给出了几个具体表现:

以前1周到半个月才能完成的数据需求任务,现在3个小时就可以交付;

每天把不同数据源新增200-300T的数据,转化为10000张以上的各类报表,三五个同学就游刃有余;

新增诊断功能后,无需人工干预,系统自动生成诊断报告;

……

在分享活动中,奇富科技性能更稳定、规模更大、功能也更加丰富的数据系统,也引起了金融机构的关注与兴趣。DolphinScheduler提出建议,可以将这一系统产品化并推向市场。

一方面,产品化令金融机构能直接受益于奇富科技的经验,提高数据生产的稳定性,实现更高效的数据处理。金融机构通常面临的如调度任务量大、运维复杂等问题将迎刃而解。

另一方面,奇富科技的经验也将为其他行业提供有价值的启示。数据调度是许多行业都需要面对的问题,因此奇富科技的解决方案不仅局限于金融领域。这有望在各个行业中推动更多创新和效率提升。

活动最后,DolphinScheduler对奇富科技的创新精神和分享精神给予了极高的赞赏:奇富科技的经验分享不仅促进了技术进步,还鼓励了更多公司积极参与开源社区,从中获益,推动了整个金融科技领域向前发展。

这篇关于奇富科技引领大数据调度革命:高效、稳定、实时诊断的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/310352

相关文章

Python在二进制文件中进行数据搜索的实战指南

《Python在二进制文件中进行数据搜索的实战指南》在二进制文件中搜索特定数据是编程中常见的任务,尤其在日志分析、程序调试和二进制数据处理中尤为重要,下面我们就来看看如何使用Python实现这一功能吧... 目录简介1. 二进制文件搜索概述2. python二进制模式文件读取(rb)2.1 二进制模式与文本

C#实现将XML数据自动化地写入Excel文件

《C#实现将XML数据自动化地写入Excel文件》在现代企业级应用中,数据处理与报表生成是核心环节,本文将深入探讨如何利用C#和一款优秀的库,将XML数据自动化地写入Excel文件,有需要的小伙伴可以... 目录理解XML数据结构与Excel的对应关系引入高效工具:使用Spire.XLS for .NETC

C#高效实现在Word文档中自动化创建图表的可视化方案

《C#高效实现在Word文档中自动化创建图表的可视化方案》本文将深入探讨如何利用C#,结合一款功能强大的第三方库,实现在Word文档中自动化创建图表,为你的数据呈现和报告生成提供一套实用且高效的解决方... 目录Word文档图表自动化:为什么选择C#?从零开始:C#实现Word文档图表的基本步骤深度优化:C

MySQL数据目录迁移的完整过程

《MySQL数据目录迁移的完整过程》文章详细介绍了将MySQL数据目录迁移到新硬盘的整个过程,包括新硬盘挂载、创建新的数据目录、迁移数据(推荐使用两遍rsync方案)、修改MySQL配置文件和重启验证... 目录1,新硬盘挂载(如果有的话)2,创建新的 mysql 数据目录3,迁移 MySQL 数据(推荐两

input的accept属性让文件上传安全高效

《input的accept属性让文件上传安全高效》文章介绍了HTML的input文件上传`accept`属性在文件上传校验中的重要性和优势,通过使用`accept`属性,可以减少前端JavaScrip... 目录前言那个悄悄毁掉你上传体验的“常见写法”改变一切的 html 小特性:accept真正的魔法:让

Python数据验证神器Pydantic库的使用和实践中的避坑指南

《Python数据验证神器Pydantic库的使用和实践中的避坑指南》Pydantic是一个用于数据验证和设置的库,可以显著简化API接口开发,文章通过一个实际案例,展示了Pydantic如何在生产环... 目录1️⃣ 崩溃时刻:当你的API接口又双叒崩了!2️⃣ 神兵天降:3行代码解决验证难题3️⃣ 深度

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

《MySQL快速复制一张表的四种核心方法(包括表结构和数据)》本文详细介绍了四种复制MySQL表(结构+数据)的方法,并对每种方法进行了对比分析,适用于不同场景和数据量的复制需求,特别是针对超大表(1... 目录一、mysql 复制表(结构+数据)的 4 种核心方法(面试结构化回答)方法 1:CREATE

JAVA线程的周期及调度机制详解

《JAVA线程的周期及调度机制详解》Java线程的生命周期包括NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING和TERMINATED,线程调度依赖操作系统,采用抢占... 目录Java线程的生命周期线程状态转换示例代码JAVA线程调度机制优先级设置示例注意事项JAVA线程

详解C++ 存储二进制数据容器的几种方法

《详解C++存储二进制数据容器的几种方法》本文主要介绍了详解C++存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::ve... 目录1.std::vector<uint8_t>(最常用)特点:适用场景:示例:2.std::arra

SpringBoot+Vue3整合SSE实现实时消息推送功能

《SpringBoot+Vue3整合SSE实现实时消息推送功能》在日常开发中,我们经常需要实现实时消息推送的功能,这篇文章将基于SpringBoot和Vue3来简单实现一个入门级的例子,下面小编就和大... 目录前言先大概介绍下SSE后端实现(SpringBoot)前端实现(vue3)1. 数据类型定义2.