首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
kettle专题
java如何调用kettle设置变量和参数
《java如何调用kettle设置变量和参数》文章简要介绍了如何在Java中调用Kettle,并重点讨论了变量和参数的区别,以及在Java代码中如何正确设置和使用这些变量,避免覆盖Kettle中已设置... 目录Java调用kettle设置变量和参数java代码中变量会覆盖kettle里面设置的变量总结ja
阅读更多...
Kettle邮件发不出去_已解决
参考网上各种教程,配置了kettle的相关信息,奈何就是发不出去,哪里都没问题,而且执行还不报错,将信息故意填错,执行也不报错。 配置如下: 执行的日志一直是这样: 研究半天,发现不是配置问题,根本就不执行,加到JOB中也不行,JOB前后加上START和SUCCESS还是不行。 最后,我发现Kettle中,好像有两个Mail工具,而且长的一模一样: 在j
阅读更多...
Kettle发送邮件功能如何配置以实现自动化?
kettle发送邮件如何设置?Kettle配置发送邮件的方法? Kettle发送邮件功能能够帮助用户在数据处理过程中自动发送电子邮件,极大地提高了工作效率。AokSend将详细介绍如何配置Kettle发送邮件功能,以实现自动化操作。 Kettle发送邮件:设置对象 需要在Kettle中明确指定邮件的收件人和发件人地址。这样,当Kettle发送邮件时,系统就能准确无误地将邮件发送给指定的收
阅读更多...
kettle源码分析之5 日志系统
文章目录 core消息体 https://blog.csdn.net/weixin_39819880/article/details/88087652 core 用过kettle的人都有体会,spoon的使用机制是swing的gui开发,在整个过程的机理会使用大量的事件监听。日志系统也一样。 loglevel级别分为: NOTHING( 0, “Nothing” ), ER
阅读更多...
kettle源码分析之4 osgi与插件开发
文章目录 简介使用注册查找服务 插件数据库插件stepjob https://wiki.pentaho.com/display/EAI/OSGI+in+Kettle https://www.oreilly.com/library/view/building-modular-cloud/9781449345143/ 简介 对于kettle的插件系统可以看一下上面连接的文档。
阅读更多...
Kettle入门(七)
问题集锦 链接mysql时提示jar包找不到 1.需要下载mysql-connector-java.jar包 2.因为kettle默认使用的org.gjt.mm.mysql.Driver驱动,但是mysql5以上的版本次驱动已改名,故需要下载5.1.49版的jar包 - 通过这种方式可能会导致java脚本有问题 3.若要使用8.0以上版本的驱动,需要在kettle目录下simple-
阅读更多...
Kettle入门(六)
资源库 数据库资源库 数据库资源库是将作业和转换相关的信息存储在数据库中,执行的时候直接去数据库读取信息,便于跨平台使用 操作步骤 1.点击右上角“connect”,选择“Other Resporitory” 2.选择“Database Repository”,点击“Get Started” 3.建立新链接 1.输入链接名称2.选择kettle配置库3.点击“Finish” 4
阅读更多...
Kettle入门(五)
核心控件(【步骤】) 转换 输入控件 介绍 输入是【转换】里的的第一个分类,输入控件也是【转换】中的第一大控件,用来抽取数据或生成数据。输入是ETL中的E(Extract),主要做“数据提取”的工作 常用控件 CSV文件输入 窗口介绍 步骤名称 此控件的名称,可以修改,但是在一个转换里不能与其他控件重名 文件名 选择需要打开的csv文件,可通过后面的浏览按钮选择,也可以直接在
阅读更多...
Kettle使用8.x 版本的 MySQL
自定义链接 对于 8.x 版本的 MySQL, 8.x的jdbc 连接驱动方式有所变化, 不能使用现有的 MySQL 连接配置方式, 需要使用自定义 jdbc 连接方式(数据库类型选择Generic Database), jdbc驱动jar需要使用8.x.jar 自定义驱动类名称:com.mysql.cj.jdbc.Driver 自定义连接URL:jdbc:mysql://localho
阅读更多...
ETL工具~Kettle调研
ETL工具~Kettle调研 2017.2Kettlekettle是其中Pentaho默认的ETL工具,下图为Pentaho的使用情况 什么是ETL 抽取(Extract):需要连接到不同的数据资源,以便为随后的步骤(转换、加载、分析、报表展示等)提供数据。数据抽取实际上是ETL解决方案的成功实施的一个主要障碍。转换(Transform):任何对数据的处理过程都是转换。通常包括:1、移
阅读更多...
kettle相关知识
相关链接 开源ETL工具(Kettle) V5.1.0 免费Spoon版http://www.cr173.com/soft/30051.htmlETL工具大全,你了解多少http://bbs.csdn.net/topics/390349305Kettle_抽取数据举例http://blog.csdn.net/huangyanlong/article/details/42264543 文件列表
阅读更多...
银行数仓项目实战(二)--数据采集(Kettle的抽取(E)转换(T)加载(L))
Kettle安装 Kettle又名PDI 要求电脑中有Java环境。 下载Kettle9.0的安装包,如有需要可以联系up私发噢。 注意!!! 解压路径不能有中文,空格 解压后双击spoon.bat即可使用 链接数据库需要相应的驱动,Oracle的驱动是OJDBC,导入到相应的文件夹中 之后需要重启Kettle ETL:Extract(抽取)-translate(转换)-load(加载)
阅读更多...
银行数仓项目实战(三)--使用Kettle进行增量,全量抽取
文章目录 使用Kettle进行全量抽取使用Kettle进行增量抽取 使用Kettle进行全量抽取 一般只有项目初始化的时候会使用到全量抽取,全量抽取的效率慢,抽取的数据量大。 我们在第一次进行全量抽取的时候,要在表中新建一个字段记录抽取时间,用于后面方便进行增量抽取。 全量抽取抽取的是T+1天到昨天的23.59分的数据 首先我们需要在目标表中新建一个字段用于记录上次抽取的时间。
阅读更多...
kettle从入门到精通 第七十一课 ETL之kettle 再谈http post,轻松掌握body中传递json参数
场景: kettle中http post步骤如何发送http请求且传递body参数? 解决方案: http post步骤中直接设置Request entity field字段即可。 1、手边没有现成的post接口,索性用python搭建一个简单的接口,关键代码如下(安装python环境略): from flask import Flask, request, jsonifyap
阅读更多...
使用kettle做的数据同步案例
1 mongo同步数据到mysql中 我想把51万8400的计算出来的八字信息,从mongo同步到mysql,看看在mysql中运行会怎么样。 选择mongodb input,这个是在Big Data中。 填写数据库和表 获取到mongodb的字段,获取到mongo的字段,如果某个字段是json结构,则需要自己处理一下,因为mysql中也可以使用json类型。 添加【表输出】,然后按住sh
阅读更多...
kettle基础概念的学习
kettle基础概念的学习 参考书籍:Pentaho Kettle Solutions中文版。由于最近不断的使用kettle,随着不断深入使用,遇到的问题越来越多,发现脑子那点货根本不够用,所以根据阅读把一些概念记录一下,方便自己观看,也希望读看到帖子的有所帮助。 1、转换。Kettle在运行转换的时候,根据用户的设置,可以将数据以不同的方式发送到多个数据流中。注意:有两种基本发送
阅读更多...
kettle的job定时任务的一个小问题
kettle的job定时任务的一个小问题 思考,启动此job,做一个最简单,job实现表输入和表输出,但是实现表输入和表输出要花2个小时。那么这个job定时是如何执行的呢???第一种情况、job定时60分钟即1个小时。当job执行结束(即用了2个小时以后),再等待一个小时,再次执行此job的转换表输入和表输出。第二种情况、job执行了60分钟即1个小时,job重新启动,造成job的转换
阅读更多...
kettle作业发送QQ邮箱提醒——kettle开发42
随着kettle作业的不断深入和业务的不断运用,对于kettle作业是否正确执行保证底层数仓数据的及时准确是至关重要的。话不多说,上主菜。 一、开通SMTP邮箱服务 1、登录QQ邮箱,点击设置→账户→POP3/IMAP/SMTP/Exchange/CardDAV/CalDAV服务→ IMAP/SMTP服务 2、开通IMAP/SMTP服务 开通完成后会有一个授权码,此时记得保存
阅读更多...
Kettle 使用教程(1)—入门
大数据的开发过程中使用的是Kettle为6.1.0版本 简介 Kettle是一款纯Java开发的ETL工具,它是跨平台的,所以它可以在Window、Linux、Unix上运行。注意什么是ETL,读者可以自行百度了解,我的理解是将一个数据库的数据导入到另外一个数据库中,当让这种说法并不严谨,因为数据传输过程中肯定还有很多转换步骤。我们可以在它的官网上下载最新的工具包,也可以在Github上面下
阅读更多...
用kettle调用js抽取数据库照片到本地
本来打算先开发kettle插件的,但是比较麻烦,同时要的比较急,就临时写了个js来; js代码: //Script here//文件路径var filepath = "G:\\zp\\";//相片名称var filename = SFZH+".jpg";//写到硬盘var fos = new Packages.java.io.FileOutputStream(new Packa
阅读更多...
kettle日期参数使用
在使用日期类型参数进行比较大小的时候,务必保证传递的日期类型参数和比较的类型保持一致。 在ETL过程中使用日期类型的参数很是常见,例如SQL如下: SELECT b.display_name, a.company_id, date_format(max(first_send_notice_date), ‘%Y-%m’) accMonth, count(*) totalReport, s
阅读更多...
kettle数据同步的五种方案
数据同步:当数据源发生改变时,其他相关数据也跟着发展变化。根据需求不同可采取以下方案。 1.触发器 在数据库建立增删改的触发器。触发器将变更放到一张临时表里。oracle同步cdc 优点:实时同步 缺点:影响到业务系统,因为需要在业务系统建立触发器 2.日志 通过分析源数据库日志,来获得源数据库中的变化的数据。oracle异步cdc 优点:不影响业务系统 缺点:有一定得延时
阅读更多...
kettle从入门到精通 第六十五课 ETL之kettle 执行动态SQL语句,轻松实现全量增量数据同步
本次课程的逻辑是同步t1表数据到t2表,t1和t2表的表机构相同,都有id,name,createtime三个字段。 CREATE TABLE `t1` (`id` bigint NOT NULL AUTO_INCREMENT,`name` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL,`cr
阅读更多...
kettle从入门到精通 第六十四课 ETL之kettle kettle中执行SQL脚本步骤,使用需当心
1、群里有不定时会有同学反馈执行SQL脚本步骤使用有问题,那么咱们今天一起来学习下该步骤。trans中的执行SQL脚本有两方面功能,使用时需小心,不然很容易踩坑。 官方定义: 翻译: 您可以使用此步骤执行 SQL 脚本,可以选择在转换的初始化阶段执行一次,或者针对步骤接收的每一行输入执行一次。第二个选项可用于在 SQL 脚本中使用参数。 2、执行 SQL 脚本的默认功能是只在转换
阅读更多...
kettle之java组件 对redis集群进行增删改查
创作背景 1、kettle9.4 2、jdk8 所需的jar包 jedis-2.9.0.jar commons-pool2-2.4.2.jar(kettle自带commons-pool-1.5.7.jar) 如果不引入会报错 ERROR (version 9.4.0.0-343, build 0.0 from 2022-11-08 07.50.27 by buildguy) :
阅读更多...
解决kettle界面右上角的connect消失——且使用admin登录不上Kettle资源库
一、问题描述 1.1、Kettle界面右上角的connect消失了 当我们配置Kettle界面的资源库(Other Repositories)内容后,Kettle界面右上角的connect消失了;如下图所示: 1.2、使用默认的账户【admin】和密码【admin】登录不上kettle资源库 当我们切换到我们配置的数据库使用超管账号【admin】和密码【
阅读更多...