knime用三种方法提取列中需要的数据实战

2024-09-06 03:12

本文主要是介绍knime用三种方法提取列中需要的数据实战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

有如下数据,需要对数据处理,输出客户需要的效果。

数据样例:👇

图片

最终效果:
图片

01实现过程

第一种解决办法:

详解节点操作过程:

①使用** Table Creator (节点1)**:

  • "Table Creator"节点的作用是允许手动创建数据表,用户可以在类似电子表格的界面中输入数据。
黑龙江省-李四-市场部
广东省-王五-财务部
四川省-赵六-人力资源部
河南省-钱七-研发部
江苏省-孙八-客户服务部
甘肃省-王源-技术组

将上面数据复制到Table Creator中:

图片

②使用** Regex Extractor (节点2)**:

  • "Regex Extractor"节点,用于从文本数据中提取符合指定正则表达式的部分。该节点可以帮助用户从文本中提取特定模式的信息,例如日期、邮政编码、URL等。用户可以在节点配置中指定正则表达式,并将匹配的结果提取到新的列中。这个节点在处理需要从文本中提取特定信息的任务时非常有用

图片

                    正则表达式:([^\-]+)$    或者:(?:.*-)([一-龟]+$)

③最终输出结果如下👇:

图片

第二种解决办法:

在这里插入图片描述

②使用** Regex Substring (节点2)**:

  • "Regex Substring"节点,用于从字符串中提取符合指定正则表达式的子字符串。该节点可以返回子字符串的匹配结果作为新的字符串列,并支持多种返回模式,包括第一个匹配、最后一个匹配、按编号匹配或连接所有匹配。这个节点在需要从文本中提取特定模式的子字符串时非常有用。

图片

③最终输出结果如下👇:

在这里插入图片描述

第三种解决办法:

②使用** Column Expressions (节点2)**:

  • "Column Expressions"是一个节点,用于通过表达式操作列的数据。用户可以在该节点中定义表达式,以对输入数据的列进行计算、转换或创建新列。该节点支持访问列数据、常量和函数,并可以生成新的列作为输出。用户可以使用该节点执行各种列级操作,例如数学运算、逻辑运算、字符串操作等。

图片

③最终输出结果如下👇:

图片

今天的分享就到这里了。有收获的小伙伴,记得点赞、收藏、分享哦!

如果您对本次分享的内容感兴趣的话,记得关注哦!不然下次找不到喽!
关注不迷路哦!

“好记性不如烂笔头”,IT小本本 —— 记录IT知识,分享打工人真实的日常操作笔记!!!
😝有需要的小伙伴,可以V扫描下方二维码免费关注哦!第一时间获取最新动态!!

在这里插入图片描述

这篇关于knime用三种方法提取列中需要的数据实战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1140838

相关文章

Window Server2016加入AD域的方法步骤

《WindowServer2016加入AD域的方法步骤》:本文主要介绍WindowServer2016加入AD域的方法步骤,包括配置DNS、检测ping通、更改计算机域、输入账号密码、重启服务... 目录一、 准备条件二、配置ServerB加入ServerA的AD域(test.ly)三、查看加入AD域后的变

Golang操作DuckDB实战案例分享

《Golang操作DuckDB实战案例分享》DuckDB是一个嵌入式SQL数据库引擎,它与众所周知的SQLite非常相似,但它是为olap风格的工作负载设计的,DuckDB支持各种数据类型和SQL特性... 目录DuckDB的主要优点环境准备初始化表和数据查询单行或多行错误处理和事务完整代码最后总结Duck

Window Server2016 AD域的创建的方法步骤

《WindowServer2016AD域的创建的方法步骤》本文主要介绍了WindowServer2016AD域的创建的方法步骤,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、准备条件二、在ServerA服务器中常见AD域管理器:三、创建AD域,域地址为“test.ly”

NFS实现多服务器文件的共享的方法步骤

《NFS实现多服务器文件的共享的方法步骤》NFS允许网络中的计算机之间共享资源,客户端可以透明地读写远端NFS服务器上的文件,本文就来介绍一下NFS实现多服务器文件的共享的方法步骤,感兴趣的可以了解一... 目录一、简介二、部署1、准备1、服务端和客户端:安装nfs-utils2、服务端:创建共享目录3、服

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

Python中使用defaultdict和Counter的方法

《Python中使用defaultdict和Counter的方法》本文深入探讨了Python中的两个强大工具——defaultdict和Counter,并详细介绍了它们的工作原理、应用场景以及在实际编... 目录引言defaultdict的深入应用什么是defaultdictdefaultdict的工作原理

使用Python进行文件读写操作的基本方法

《使用Python进行文件读写操作的基本方法》今天的内容来介绍Python中进行文件读写操作的方法,这在学习Python时是必不可少的技术点,希望可以帮助到正在学习python的小伙伴,以下是Pyth... 目录一、文件读取:二、文件写入:三、文件追加:四、文件读写的二进制模式:五、使用 json 模块读写

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,