本文主要是介绍数据预处理之文件转换kettle:字符串操作(去空,值替换,补位),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
【实验目的】
利用Kettle的“过滤记录”,“字符串替换”,“字符串操作”组件,实现记录的过滤,字符串替换及字符串的去空格功能。
【实验原理】
通过“过滤记录”对单元格为空的记录进行过滤,然后通过“字符串替换”指定替换单元格中某些特定内容,再通过“字符串操作”实现字符串的去空格功能。
【实验步骤】
一、创建转换
1.点击,在下拉菜单中点击选择,这样创建了一个转换文件。我们点击,重命名该转换文件,保存在某个指定的路径。
2.我们在新建的转换文件上开始可视化编程。需要的组件如下图所示。选择好组件好,按下图所示连接好组件。主要组件为excel input,Filter rows ,Replace in string ,String operations,excel writer。组件支持自定义命名。
二、可视化编程
1. “Excel输入”的配置:
2.“过滤记录”的配置:
3.“字符串替换”的配置:
4.“字符串操作”配置:
5.“Microsoft Excel 输出”配置:
三.运行程序:
点击开始运行程序,在弹出的对话框中,选择运行该程序。
运行结果:
四.实验结果
输入数据
(1) 课程信息表.
输出数据:
“Microsoft Excel 输出”输出数据:
这篇关于数据预处理之文件转换kettle:字符串操作(去空,值替换,补位)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!