kettle8.2专题

Kettle8.2查询组件之流查询

Kettle8.2查询组件之流查询 一、相关说明二、设计转换三、转换配置四、运行转换五、结果分析 一、相关说明 数据库查询组件说明: 流查询在查询前把数据都加载到内存中,并且只能进行等值查询。需求说明: 从A数据库中的sys_dept表中读取数据,在从从B数据库中sys_user表查询数据,然后根据dep_id获取dep_name,保存到Excel中。源表sys_user和

Kettle8.2查询组件之数据库连接

Kettle8.2查询组件之数据库连接 一、相关说明二、设计转换三、转换配置四、运行转换五、结果分析 一、相关说明 数据库查询组件说明: 数据库连接可以执行两个数据库的查询,和单参数的表输入。 需求说明: 从A数据库中的sys_dept表中读取数据,根据dep_id从B数据库中sys_user表获取dep_name,保存到Excel中。 源表sys_user和sys_

Kettle8.2查询组件之数据库查询

Kettle8.2查询组件之数据库查询 一、相关说明二、设计转换三、转换配置四、运行转换五、结果分析 一、相关说明 数据库查询组件说明: 数据库查询就是数据库里面的左连接。 左连接就是两张表执行左关联查询,把左边的表数据全部查询出来。 需求说明: 从sys_user表中读取数据,根据dep_id从sys_dept表获取dep_name,保存到Excel中。 源表sys

Kettle8.2查询组件之HTTP Client

Kettle8.2查询组件之HTTP Client 一、相关说明二、设计转换三、转换配置四、运行转换五、结果分析 一、相关说明 查询组件说明: 查询是转换里面的第七个分类。 查询是用来查询数据源里的数据并合并到主数据流中。 需求说明: 从网络上获取xml,解析出ProductID、ProductName、SupplierID、CategoryID,保存到数据库表中。

Kettle8.2转换组件之行扁平化

Kettle8.2转换组件之行扁平化 一、相关说明二、设计转换三、转换配置四、运行转换五、结果分析 一、相关说明 需求说明: 从Excel读取数据,把数据进行行扁平化处理,存储在Excel。 数据源如下: 期望目标如下: 行扁平化组件说明: 行扁平化就是把同一组的多行数据合并成为一行。 注意: 只有数据流的同类数据、数据行记录一致的情况才可使用! 数据流必须进

Kettle8.2转换组件之行转列

Kettle8.2转换组件之行转列 一、相关说明二、设计转换三、转换配置四、运行转换五、结果分析 一、相关说明 需求说明: 从Excel读取数据,把星期工作小时行转为星期列和工作小时列,把数据保存到Excel。 数据源如下: 期望目标如下: 行转列组件说明: 行转列就是把数据字段的字段名转换为一列,把数据行变为数据列。 二、设计转换 输入:Excel输

Kettle8.2转换组件之列转行

Kettle8.2转换组件之列转行 一、相关说明二、设计转换三、转换配置四、运行转换五、结果分析 一、相关说明 需求说明: 从Excel中读取数据,按照姓名进行分组,把星期、工作小时从列转为行,并保存在Excel中。 数据源如下: 期望目标如下: 列转行组件说明: 列转行就是如果数据一列有相同的值,按照指定的字段,把多行数据转换为一行数据。去除一些原来的列名,把

Kettle8.2转换组件之列拆分为多行

Kettle8.2转换组件之列拆分为多行 一、相关说明二、设计转换三、转换配置四、运行转换五、结果分析 一、相关说明 需求说明: 从CSV读取数据,将文件中的hobby字段按照分号;进行拆分,把数据保存在Excel中。 数据源如下: 期望目标如下: 列拆分为多行组件说明: 列拆分为多行就是把指定分隔符的字段进行拆分为多行。 二、设计转换 输入:csv输

Kettle8.2转换组件之拆分字段

Kettle8.2转换组件之拆分字段 一、相关说明二、设计转换三、转换配置四、运行转换五、查看结果 一、相关说明 需求说明: 从数据库表读取数据,将name字段内容拆分为first_name和last_name,并把结果数据保存在数据库目标表中。 数据源(数据库中表数据): 建表语句及插入数据语句,如下: CREATE DATABASE /*!32312 IF NOT

Kettle8.2转换组件之唯一行(哈希值)

Kettle8.2转换组件之唯一行(HashSet) 一、相关说明二、设计转换三、转换配置四、运行转换五、查看结果 一、相关说明 需求说明: 从Excel读取数据,去除其中重复的字段,并把结果数据保存在数据库表中。唯一行组件说明: 唯一行(哈希值)就是删除数据流重复的行。删除重复的行,并仅筛选作为该步骤输入数据的惟一行。它跟踪内存中的重复行,并且不需要排序输入来处理重复行。