DataWorks:依赖上一周期(跨周期依赖)解析

2023-10-29 19:51
文章标签 依赖 解析 周期 dataworks

本文主要是介绍DataWorks:依赖上一周期(跨周期依赖)解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文档均以修改xc_create节点的配置为案例。

DataWorks的三种跨周期依赖形式:

①一层子节点:
节点依赖关系:依赖当前节点的下游,例如 节点A存在下游节点B、C、D三个节点,依赖一层子节点是节点A依赖B、C、D三个节点的上一周期。
业务场景:本次 任务运行依赖上一周期下游节点对本节点的结果表(本节点输出表)进行清洗的最终结果(是否正常产出)。
②本节点:
节点依赖关系: 跨周期自依赖(依赖当前节点的上一周期。)
业务场景:本次任务运行依赖上一周期该任务的业务数据的产出情况。
③自定义:
节点依赖关系:手动 需要依赖的节点(多个节点用英文下的逗号分隔)​
业务场景:业务逻辑上需要依赖其他的业务数据正常产出,但是本任务中没有操作该业务数据。

依赖上一周期和依赖本周期的区别:

注意:在运维中心中查看节点依赖关系时,所有跨周期依赖的节点都会以虚线 的形式展示。也是任务实际的依赖,下线任务时候这部分的依赖关系也需要去掉,也是任务运行需要判断的条件之一。

70b421ce48c5c670c78842bda610a670f774d476

业务流程节点依赖关系

b0fd6191417a29154d672a76991d0a20fcf26607

运维中心展示如下:

e652783356ae9cbe27f04310063f6fc079fffc6f

xc_create节点代码及配置

节点sql解析:xc_create节点创建xc_1,xc_2两张表(或产出两张表的数据并将xc_1,xc_2作为本节点的输出。

fb3d8cf7bf64f0f6867b64422bf6c2b66e7487a4

xc_select节点代码及配置

节点sql解析:xc_select节点中查询xc_create节点中的表数据,通过自动解析功能解析将xc_create节点作为本节点依赖的上游。

847abf0693512b89fb21a442bdda8571b053cfd5

依赖上一周期:一层子节点

节点依赖: 依赖当前节点的下游,例如 节点A存在下游节点B、C、D三个节点,依赖一层子节点是节点A依赖B、C、D三个节点的上一周期。

业务场景:该任务运行依赖上一周期下游任务对本任务的结果表(本节点输出表)进行清洗的最终结果(下游任务运行成功,本节点本周期任务开始运行,否则反之)。


xc_create 选择依赖一层子节点

eb770f59064caf7cdd7bff44c1a440094c22ed22

运维中心任务依赖关系如图:

ecec26cb7c656224eb5e01c2445a6ec55096b5c0

依赖上一周期:本节点

节点依赖:本次任务运行依赖本节点上一周期任务运行情况,上一周期任务未完成将阻塞本周期任务运行。
业务场景:本次任务数据依赖上次数据清洗情况。

xc_create表配置如图(为便于观察,我将本节点设置为小时调度任务)

14b906955cf6b1458190566ac8b98331d049d907

运维中心的周期实例查看依赖情况,如图:

bcc7d6ec36301d3272b2d732f892c9287c3bec83

依赖上一周期:自定义

节点依赖:代码中没有用到1000374815节点的产出表但是业务上需要取依赖该1000374815节点的上一周期数据是否顺利产出从节点关系来说:xc_create节点需要依赖1000374815节点上一周期。

业务场景:业务逻辑上需要依赖1000374815任务的业务数据正常产出,但是本任务(xc_create)中没有操作该业务数据。


新的节点如下:节点id:1000374815

8f862fc4179eea65ac9a235bcabb359df0a84acf

xc_create节点依赖的上游选择自定义,选择1000374815节点。

e6cfcf8c3acd4232d432ff9a4712d10979862b35

运维中心周期任务依赖如图:

b47b5034599e1afc4b3d8ecd61bb4e5fc32ffba3

【实时场景一】:无法确定上游何时产出数据时,本节点可对上游做跨周期依赖。


【实时场景二】:我的需求是A任务每天每小时整点执行一次,B任务每天跑一次,但是希望A任务每天第一次跑成功后B任务就跑起, 这样可以怎么配置?

  A:A任务配置时,需要勾选“依赖上一周期” 选“本节点”,然后B任务的定时时间为0点,这样每天自动调度实例里B任务实例就只依赖A 任务0点实例即A任务第一个实例。


【实时场景三】:天任务依赖小时任务,不需要依赖今天的数据,只需要依赖昨天的小时数据(直接依赖今天的小时任务实例导致下 游天任务小时到第二天才完成)

  A:天任务调度配置界面选择“依赖上一周期”-“自定义”,将上游小时任务的节点id填进去后,重新提交发布。


有疑问可下方留言


这篇关于DataWorks:依赖上一周期(跨周期依赖)解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/302987

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

每天认识几个maven依赖(ActiveMQ+activemq-jaxb+activesoap+activespace+adarwin)

八、ActiveMQ 1、是什么? ActiveMQ 是一个开源的消息中间件(Message Broker),由 Apache 软件基金会开发和维护。它实现了 Java 消息服务(Java Message Service, JMS)规范,并支持多种消息传递协议,包括 AMQP、MQTT 和 OpenWire 等。 2、有什么用? 可靠性:ActiveMQ 提供了消息持久性和事务支持,确保消

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

pip-tools:打造可重复、可控的 Python 开发环境,解决依赖关系,让代码更稳定

在 Python 开发中,管理依赖关系是一项繁琐且容易出错的任务。手动更新依赖版本、处理冲突、确保一致性等等,都可能让开发者感到头疼。而 pip-tools 为开发者提供了一套稳定可靠的解决方案。 什么是 pip-tools? pip-tools 是一组命令行工具,旨在简化 Python 依赖关系的管理,确保项目环境的稳定性和可重复性。它主要包含两个核心工具:pip-compile 和 pip

OWASP十大安全漏洞解析

OWASP(开放式Web应用程序安全项目)发布的“十大安全漏洞”列表是Web应用程序安全领域的权威指南,它总结了Web应用程序中最常见、最危险的安全隐患。以下是对OWASP十大安全漏洞的详细解析: 1. 注入漏洞(Injection) 描述:攻击者通过在应用程序的输入数据中插入恶意代码,从而控制应用程序的行为。常见的注入类型包括SQL注入、OS命令注入、LDAP注入等。 影响:可能导致数据泄

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

Spring 源码解读:自定义实现Bean定义的注册与解析

引言 在Spring框架中,Bean的注册与解析是整个依赖注入流程的核心步骤。通过Bean定义,Spring容器知道如何创建、配置和管理每个Bean实例。本篇文章将通过实现一个简化版的Bean定义注册与解析机制,帮助你理解Spring框架背后的设计逻辑。我们还将对比Spring中的BeanDefinition和BeanDefinitionRegistry,以全面掌握Bean注册和解析的核心原理。

CSP 2023 提高级第一轮 CSP-S 2023初试题 完善程序第二题解析 未完

一、题目阅读 (最大值之和)给定整数序列 a0,⋯,an−1,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105 和 1≤ai≤108。 一个序列的非空连续子序列可以用两个下标 ll 和 rr(其中0≤l≤r<n0≤l≤r<n)表示,对应的序列为 al,al+1,⋯,ar​。两个非空连续子序列不同,当且仅当下标不同。 例如,当原序列为 [1,2,1,2] 时,要计算子序列 [

多线程解析报表

假如有这样一个需求,当我们需要解析一个Excel里多个sheet的数据时,可以考虑使用多线程,每个线程解析一个sheet里的数据,等到所有的sheet都解析完之后,程序需要提示解析完成。 Way1 join import java.time.LocalTime;public class Main {public static void main(String[] args) thro

深入理解数据库的 4NF:多值依赖与消除数据异常

在数据库设计中, "范式" 是一个常常被提到的重要概念。许多初学者在学习数据库设计时,经常听到第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及 BCNF(Boyce-Codd范式)。这些范式都旨在通过消除数据冗余和异常来优化数据库结构。然而,当我们谈到 4NF(第四范式)时,事情变得更加复杂。本文将带你深入了解 多值依赖 和 4NF,帮助你在数据库设计中消除更高级别的异常。 什么是