knime用三种方法提取列中需要的数据实战

2024-09-06 03:12

本文主要是介绍knime用三种方法提取列中需要的数据实战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

有如下数据,需要对数据处理,输出客户需要的效果。

数据样例:👇

图片

最终效果:
图片

01实现过程

第一种解决办法:

详解节点操作过程:

①使用** Table Creator (节点1)**:

  • "Table Creator"节点的作用是允许手动创建数据表,用户可以在类似电子表格的界面中输入数据。
黑龙江省-李四-市场部
广东省-王五-财务部
四川省-赵六-人力资源部
河南省-钱七-研发部
江苏省-孙八-客户服务部
甘肃省-王源-技术组

将上面数据复制到Table Creator中:

图片

②使用** Regex Extractor (节点2)**:

  • "Regex Extractor"节点,用于从文本数据中提取符合指定正则表达式的部分。该节点可以帮助用户从文本中提取特定模式的信息,例如日期、邮政编码、URL等。用户可以在节点配置中指定正则表达式,并将匹配的结果提取到新的列中。这个节点在处理需要从文本中提取特定信息的任务时非常有用

图片

                    正则表达式:([^\-]+)$    或者:(?:.*-)([一-龟]+$)

③最终输出结果如下👇:

图片

第二种解决办法:

在这里插入图片描述

②使用** Regex Substring (节点2)**:

  • "Regex Substring"节点,用于从字符串中提取符合指定正则表达式的子字符串。该节点可以返回子字符串的匹配结果作为新的字符串列,并支持多种返回模式,包括第一个匹配、最后一个匹配、按编号匹配或连接所有匹配。这个节点在需要从文本中提取特定模式的子字符串时非常有用。

图片

③最终输出结果如下👇:

在这里插入图片描述

第三种解决办法:

②使用** Column Expressions (节点2)**:

  • "Column Expressions"是一个节点,用于通过表达式操作列的数据。用户可以在该节点中定义表达式,以对输入数据的列进行计算、转换或创建新列。该节点支持访问列数据、常量和函数,并可以生成新的列作为输出。用户可以使用该节点执行各种列级操作,例如数学运算、逻辑运算、字符串操作等。

图片

③最终输出结果如下👇:

图片

今天的分享就到这里了。有收获的小伙伴,记得点赞、收藏、分享哦!

如果您对本次分享的内容感兴趣的话,记得关注哦!不然下次找不到喽!
关注不迷路哦!

“好记性不如烂笔头”,IT小本本 —— 记录IT知识,分享打工人真实的日常操作笔记!!!
😝有需要的小伙伴,可以V扫描下方二维码免费关注哦!第一时间获取最新动态!!

在这里插入图片描述

这篇关于knime用三种方法提取列中需要的数据实战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1140838

相关文章

C++中::SHCreateDirectoryEx函数使用方法

《C++中::SHCreateDirectoryEx函数使用方法》::SHCreateDirectoryEx用于创建多级目录,类似于mkdir-p命令,本文主要介绍了C++中::SHCreateDir... 目录1. 函数原型与依赖项2. 基本使用示例示例 1:创建单层目录示例 2:创建多级目录3. 关键注

Linux修改pip和conda缓存路径的几种方法

《Linux修改pip和conda缓存路径的几种方法》在Python生态中,pip和conda是两种常见的软件包管理工具,它们在安装、更新和卸载软件包时都会使用缓存来提高效率,适当地修改它们的缓存路径... 目录一、pip 和 conda 的缓存机制1. pip 的缓存机制默认缓存路径2. conda 的缓

C++从序列容器中删除元素的四种方法

《C++从序列容器中删除元素的四种方法》删除元素的方法在序列容器和关联容器之间是非常不同的,在序列容器中,vector和string是最常用的,但这里也会介绍deque和list以供全面了解,尽管在一... 目录一、简介二、移除给定位置的元素三、移除与某个值相等的元素3.1、序列容器vector、deque

C++常见容器获取头元素的方法大全

《C++常见容器获取头元素的方法大全》在C++编程中,容器是存储和管理数据集合的重要工具,不同的容器提供了不同的接口来访问和操作其中的元素,获取容器的头元素(即第一个元素)是常见的操作之一,本文将详细... 目录一、std::vector二、std::list三、std::deque四、std::forwa

Python实现常用文本内容提取

《Python实现常用文本内容提取》在日常工作和学习中,我们经常需要从PDF、Word文档中提取文本,本文将介绍如何使用Python编写一个文本内容提取工具,有需要的小伙伴可以参考下... 目录一、引言二、文本内容提取的原理三、文本内容提取的设计四、文本内容提取的实现五、完整代码示例一、引言在日常工作和学

Linux修改pip临时目录方法的详解

《Linux修改pip临时目录方法的详解》在Linux系统中,pip在安装Python包时会使用临时目录(TMPDIR),但默认的临时目录可能会受到存储空间不足或权限问题的影响,所以本文将详细介绍如何... 目录引言一、为什么要修改 pip 的临时目录?1. 解决存储空间不足的问题2. 解决权限问题3. 提

Python实战之屏幕录制功能的实现

《Python实战之屏幕录制功能的实现》屏幕录制,即屏幕捕获,是指将计算机屏幕上的活动记录下来,生成视频文件,本文主要为大家介绍了如何使用Python实现这一功能,希望对大家有所帮助... 目录屏幕录制原理图像捕获音频捕获编码压缩输出保存完整的屏幕录制工具高级功能实时预览增加水印多平台支持屏幕录制原理屏幕

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密

C++字符串提取和分割的多种方法

《C++字符串提取和分割的多种方法》在C++编程中,字符串处理是一个常见的任务,尤其是在需要从字符串中提取特定数据时,本文将详细探讨如何使用C++标准库中的工具来提取和分割字符串,并分析不同方法的适用... 目录1. 字符串提取的基本方法1.1 使用 std::istringstream 和 >> 操作符示

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解