从零到一,全面掌握Apache DolphinScheduler发版流程,实战派经验分享!

本文主要是介绍从零到一,全面掌握Apache DolphinScheduler发版流程,实战派经验分享!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

file

引言

Apache DolphinScheduler的发版流程对于确保软件质量和社区协作至关重要,社区Committer王兴杰为我们详细介绍了Apache DolphinScheduler的发版流程,包括环境准备、流程文档、基础工具准备、依赖包确认等关键步骤,并指出了发版流程中可能会遇到的麻烦以及相应的解决方案,欢迎学习指正。

一、发版物料

(1)Apache要求

a. Maven仓库物料(发版过程中会存储在临时库中) https://repository.apache.org/content/repositories/orgapachedolphinscheduler-{index}/org/apache/dolphinscheduler/

b. 发布包、签名文件和keys 对发布版本签名,用户也可据此判断下载的版本是否被篡改。

(2)DolphinScheduler要求 Dockerhub 镜像 Helm 文件

(3)权限要求

  • PMC Member拥有完整的发版权限;
  • Committer会有小部分权限缺失,需要PMC Member配合。

二、发版流程

  1. 环境准备
  • jdk :1.8版本以上 (1.8.0_271)
  • Maven:尽可能保证3.9版本以上(3.9.6)
  • 低版本maven构建部署包会失败
  • gpg:各版本均可 (2.0.22)
  • svn:高于1.6版本(1.7.14 ),低版本会报错

file

  • git:1.8.3.1
  • 服务器系统:MacOS,Linux(Linux服务器、CentOS7)
  • 服务器要求需要能访问Apache官网或GitHub,目前Window在同步gpg、公钥ID时会出现异常,建议尽可能使用非Window系统。
  1. 发版流程文档
  • 中文: https://github.com/apache/dolphinscheduler/blob/dev/docs/docs/zh/contribute/release.md
  • 英文: https://github.com/apache/dolphinscheduler/blob/dev/docs/docs/en/contribute/release.md
  1. 基础工具准备 (1)gpg安装 按照文档执行操作

file (2)配置maven仓库

  • 修改settings-security.xml文件
  • 修改conf/settings.xml配置文件(注意路径),文件中的apache LDAP是apache对应的用户名密码,明文。
  1. 依赖包确认 这里主要检查依赖包对一个的license 和对应的下载地址。

file

可以查看pom的提交日志,查看修改记录,正常在review pr的时候会检查这一项。但是可能会有遗漏或重复的情况。

  1. 修改版本

(1)为了方便后续打包等操作,可以增加环境变量。包括后续对svn的一些操作所需的环境变量,建议在文档中新建的变量都创建为环境变量。

file

(2)文档版本修改

注意:docsdev.js是Apache DolphinScheduler官网该版本的引用位置相关文件,文件修改的效果只有在website的pr被merge之后才能体现,所以这部分文件需要严格按照文档修改,建议在打包之前检查一下文件的修改情况。

file

  1. 部署包构建发布

部署包的构建分为三个部分

(1)发布检查

a.分支准备

file

首先要在官方的github仓库创建prepare分支,fetch分支后运行上述命令。文档中的origin要根据用户clone的仓库决定,如果直接clone的是官方仓库,这里使用origin没有问题。如果使用的是fork的仓库,创建upstream(如果叫upstream的话)指向官方仓库,那GH_REMOTE得是upstream。发版的所有操作都是直接推到官方仓库。

一般情况prepare分支是基于dev创建的。 在clone或者创建upstream时,最好是使用git协议,不要使用https,否则推送tag会失败。

b.发版校验

命令运行大概需要8G内存,注意资源。

file

运行结束后最好检查一下dolphinscheduler-dist/target文件夹的大小,如果超过950M,并且没有瘦身策略,发版得暂停。

这一步主要是为了验证构建部署包的过程是否正确。

(2)发版准备

需要清理掉发版校验的文件,执行clean命令。clean命令执行后可能会存在部分文件未清理的情况,可以考虑执行git stash暂存。

这里如果是多次发版,需要再执行 mvn release命令之前清理掉本地和远程(官方仓库)的tag,否则会报错。这里需要提前配置 注意1 的内容。

该步骤不会有成果。

如果在命令中出现clone prepare分支失败的问题需要检查upstream的协议,网络等情况,如果网络不稳定可以重试。

此处需要检查仓库中prepare分支和tag的commit,需要一致。

file

(3)部署发布

 a. 执行命令

该命令基于发版准备的结果,所以【发版准备】的结果不能做任何修改(包括代码),命令结束后会在https://repository.apache.org/#stagingRepositories 中显示内容。这个内容可能会有一点点延迟,但正常不会超过五分钟。如果发现没有文件,大概率是maven的远程仓库配置问题,可以排查一下。

file

如果发版过程中发现有代码的修改,需要重新执行发版的操作,必须至少要从【发版准备】开始,执行【发版准备】前需要执行git release:clean 命令,如果有多余文件可以git stash暂存。多次发版需要注意stagingRepositories中文件的时间,如果发现时间与执行发版命令时间不对应情况可能说明包为同步。正常stagingRepositories的文件会替换,无需主动删除。

发版过程会使用到gpg -s的命令,命令的密码缓存应该是十分钟,如果服务器资源不太够,构建时间会超过十分钟,这里需要保证gpg 密码的缓存时间。

file

到这里所有发布包的构建流程已经结束。

b. 发布包提交apache仓库

file

建议将SVN_DIR_DEV和 SVN_DIR_RELEASE 也都设置为环境变量。

file

如果是committer这部其实可以不用执行, commit没有权限。

file

这里DolphinScheduler并没有打开对应的设置,所以这部分需要将gpg-key-id导出来后发给PMC帮忙添加,或者在发版邮件后补充。但是尽可能是添加到KEYS里面。

file

这里需要注意的是tar.gz.asc文件,可以使用【注意】部分的命令添加,但是在打包的时候其实是已经生成了。也可以手动在maven本地仓库里面拷贝出来。

部分服务器 shasum的命令没有,可以使用sha512sum shasum -a 512 = sha512sum.

file

打包日志里面写了生成的asc文件位置。

c. 发版文件检查

file

    除了上述的文件,建议在检查一下`doc/conf/docsdev.js`文件。到此为止发版打包的工作就已经结束了。
  1. 发版邮件

创建RELEASE NODE

file

这里要求python要在3.0版本,生成的结果是一个md文件,文件中自带了pr的链接,最好是在检查一下pr的名称和对应的位置,这里的位置错误会较多,很多bug也到了improvement里。

RELEASE NODE创建好后会马上触发一个工作流,用来构建docker镜像和helm文件。构建的流水线日志可以在https://github.com/apache/dolphinscheduler/actions中查看。

【注意】如果是多次创建RELEASE NODE的话,需要检查一下 https://github.com/apache/dolphinscheduler/releases是不是有重复的内容,或者先把原来的删掉再创建新的。这里新创建的不会覆盖,只会新增。

邮件一共有三封

a. 发版投票邮件 按照指导文档中的内容编写邮件即可,发送邮件的邮箱需要提前订阅dev邮件,否则其他人回复的邮件无法看到。

邮件写完后再次检查一下里面涉及到所有的链接,是否有正确的内容。

等待72小时以上,至少有三名pmc参与投票,committer和contributor不要求数量。没有一名PMC发出-1的投票,则投票结束。

b.投票结束邮件 按照指导文档中的内容编写邮件即可,投票人员的title需要问社区,以前官网有pmc和committer的名单,但是最近找不到了。

c.第三封邮件在后续内容介绍

8. 官网文档修改

file

如果新增是一个两个版本号的版本,需要在 https://github.com/apache/dolphinscheduler/blob/dev/.github/ISSUE_TEMPLATE/bug-report.yml中添加对应的版本。比如3.3*这种。

这里的修改一定要仔细,如果修改错误官网就会有内容丢失甚至无法访问,注意符号的转义。

pr被merge后,官网的文档就已经可以查看了,这里浏览器会有缓存,清一下,或者无痕打开。

这里还需要再发一封邮件,通知发版已经结束。

邮件发布后需要删除prepare分支。

  1. 新闻稿件

新闻稿件主要是描述这次发版的主要变更,一般三位版本号的版本主要修复bug,和一些improvement。稿件中需要简述一下重点的pr内容,图片可以查看pr提交的内容,有的文档中会有对应的图片,中文文档的pr列表中需要翻译一下pr的名字。最后的贡献者在tool中有对应的工具,同样使用python3.0版本执行。

三、版本验证

  1. 官网文档 登录官网查看对应版本是否正常
  2. dockerhub镜像 不同的服务镜像不同,需要检查所有的镜像更新时间和tag

file

发版完成

恭喜你,完成以上步骤后,Apache DolphinScheduler的发版流程就全部结束了。感谢所有贡献者的辛勤工作和社区的支持,对发版工作感兴趣的朋友可以根据教程实操一下,社区欢迎这样的尝试。

本文由 白鲸开源科技 提供发布支持!

这篇关于从零到一,全面掌握Apache DolphinScheduler发版流程,实战派经验分享!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1094905

相关文章

Golang操作DuckDB实战案例分享

《Golang操作DuckDB实战案例分享》DuckDB是一个嵌入式SQL数据库引擎,它与众所周知的SQLite非常相似,但它是为olap风格的工作负载设计的,DuckDB支持各种数据类型和SQL特性... 目录DuckDB的主要优点环境准备初始化表和数据查询单行或多行错误处理和事务完整代码最后总结Duck

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

将Python应用部署到生产环境的小技巧分享

《将Python应用部署到生产环境的小技巧分享》文章主要讲述了在将Python应用程序部署到生产环境之前,需要进行的准备工作和最佳实践,包括心态调整、代码审查、测试覆盖率提升、配置文件优化、日志记录完... 目录部署前夜:从开发到生产的心理准备与检查清单环境搭建:打造稳固的应用运行平台自动化流水线:让部署像

Python实现NLP的完整流程介绍

《Python实现NLP的完整流程介绍》这篇文章主要为大家详细介绍了Python实现NLP的完整流程,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 编程安装和导入必要的库2. 文本数据准备3. 文本预处理3.1 小写化3.2 分词(Tokenizatio

C#读取本地网络配置信息全攻略分享

《C#读取本地网络配置信息全攻略分享》在当今数字化时代,网络已深度融入我们生活与工作的方方面面,对于软件开发而言,掌握本地计算机的网络配置信息显得尤为关键,而在C#编程的世界里,我们又该如何巧妙地读取... 目录一、引言二、C# 读取本地网络配置信息的基础准备2.1 引入关键命名空间2.2 理解核心类与方法

Apache Tomcat服务器版本号隐藏的几种方法

《ApacheTomcat服务器版本号隐藏的几种方法》本文主要介绍了ApacheTomcat服务器版本号隐藏的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需... 目录1. 隐藏HTTP响应头中的Server信息编辑 server.XML 文件2. 修China编程改错误

Golang使用minio替代文件系统的实战教程

《Golang使用minio替代文件系统的实战教程》本文讨论项目开发中直接文件系统的限制或不足,接着介绍Minio对象存储的优势,同时给出Golang的实际示例代码,包括初始化客户端、读取minio对... 目录文件系统 vs Minio文件系统不足:对象存储:miniogolang连接Minio配置Min

Golang使用etcd构建分布式锁的示例分享

《Golang使用etcd构建分布式锁的示例分享》在本教程中,我们将学习如何使用Go和etcd构建分布式锁系统,分布式锁系统对于管理对分布式系统中共享资源的并发访问至关重要,它有助于维护一致性,防止竞... 目录引言环境准备新建Go项目实现加锁和解锁功能测试分布式锁重构实现失败重试总结引言我们将使用Go作

Node.js 中 http 模块的深度剖析与实战应用小结

《Node.js中http模块的深度剖析与实战应用小结》本文详细介绍了Node.js中的http模块,从创建HTTP服务器、处理请求与响应,到获取请求参数,每个环节都通过代码示例进行解析,旨在帮... 目录Node.js 中 http 模块的深度剖析与实战应用一、引言二、创建 HTTP 服务器:基石搭建(一