liunx下ETL(kettle)脚本定时任务(crontab)启动失败定位及解决

2024-05-24 23:18

本文主要是介绍liunx下ETL(kettle)脚本定时任务(crontab)启动失败定位及解决,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

现象:

       最近项目有使用ETL工具kettle进行数据抽取更新,最终在服务器上执行时需要进行定时启动;通过crontab-e配置之后发现没有启动成功,由于只有子用户权限,没有root用户及sudo权限,经过一番排查及操作才得以解决,故记录下来;

原有步骤:

1.kettle脚本的编写

Date=`date +%Y%m%d%H%M%S`
/app/ETL/kettle/kitchen.sh -file=/app/ETL/work/test/test.kjb -logfile=/app/ETL/work/test/log/etl_${Date}.log

命名为start_job.sh;并授权整个/app/ETL/目录744权限,脚本编写过程中推荐使用绝对路径;

执行./start_job.sh运行正常且日志打印正常;

2.编写crontab -e

通过crontab -e编写定时任务:

00 15 * * * /bin/sh /app/ETL/work/test/start_job.sh

出现crontab: installing new crontab表示定时任务编写成功,但等待发现任务并没有执行;

原因定位:

1.由于环境集中管理,手上并没有root用户及sudo权限,无法查询crontab日志;

有权限的可以通过日志查看;crontab 日志路径如下:/var/log/cron

2.由于无日志,通过service crond status查看crontab运行状态正常,并配置测试定时任务:

00 16 * * * date >> /app/time.log

发现测试任务运行正常;

3.通过网上一番查找,定位原因:

 crontab有一个坏毛病,就是它总是不会缺省的从用户profile文件中读取环境变量参数,经常导致在手工执行某个脚本时是成功的,但是到crontab中试图让它定期执行时就是会出错。

如执行ETL这个脚本需要java_home变量,有可能你使用的这个用户的java版本与root不一致,或者root账户就没有安装java;

我这里就是root账户下的jdk是1.7但ETL需要的是1.8;

解决方法:

解决方法有两个:

1.在elk脚本中指定相关变量:

start_job.sh编写如下:

set ff=unix
#!/bin/bash
export JAVA_HOME=/app/jdk1.8.0_181
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
Date=`date +%Y%m%d%H%M%S`
/app/ETL/kettle/kitchen.sh -file=/app/ETL/work/test/test.kjb -logfile=/app/ETL/work/test/log/etl_${Date}.log

2.在crontab -e指定当前用户配置文件:

55 01 * * * . ~/.bash_profile;/bin/sh /app/ETL/work/test/start_job.sh

 其中. ~/.bash_profile;就是表示当前用户的隐藏配置文件;

推荐使用第二种方式;

关联问题记录:

1.在编写start_job.sh脚本时会出现/bin/sh^M: bad interpreter错误,可通过脚本头部添加 set ff=unix解决

2.crontab -e生效后不是立即就可以执行,需要2-3分钟之后,所以测试时要注意配置的corn时间;

 

这篇关于liunx下ETL(kettle)脚本定时任务(crontab)启动失败定位及解决的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/999811

相关文章

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定

504 Gateway Timeout网关超时的根源及完美解决方法

《504GatewayTimeout网关超时的根源及完美解决方法》在日常开发和运维过程中,504GatewayTimeout错误是常见的网络问题之一,尤其是在使用反向代理(如Nginx)或... 目录引言为什么会出现 504 错误?1. 探索 504 Gateway Timeout 错误的根源 1.1 后端

解决升级JDK报错:module java.base does not“opens java.lang.reflect“to unnamed module问题

《解决升级JDK报错:modulejava.basedoesnot“opensjava.lang.reflect“tounnamedmodule问题》SpringBoot启动错误源于Jav... 目录问题描述原因分析解决方案总结问题描述启动sprintboot时报以下错误原因分析编程异js常是由Ja

SpringBoot集成XXL-JOB实现任务管理全流程

《SpringBoot集成XXL-JOB实现任务管理全流程》XXL-JOB是一款轻量级分布式任务调度平台,功能丰富、界面简洁、易于扩展,本文介绍如何通过SpringBoot项目,使用RestTempl... 目录一、前言二、项目结构简述三、Maven 依赖四、Controller 代码详解五、Service

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据

SpringBoot通过main方法启动web项目实践

《SpringBoot通过main方法启动web项目实践》SpringBoot通过SpringApplication.run()启动Web项目,自动推断应用类型,加载初始化器与监听器,配置Spring... 目录1. 启动入口:SpringApplication.run()2. SpringApplicat

解决Nginx启动报错Job for nginx.service failed because the control process exited with error code问题

《解决Nginx启动报错Jobfornginx.servicefailedbecausethecontrolprocessexitedwitherrorcode问题》Nginx启... 目录一、报错如下二、解决原因三、解决方式总结一、报错如下Job for nginx.service failed bec