深究KNIME分析平台上的节点是如何实现推荐原理的

2024-03-25 05:40

本文主要是介绍深究KNIME分析平台上的节点是如何实现推荐原理的,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

kinme节点推荐分为社区推荐和服务器推荐,社区推荐即为官方hub,网址https://hub.knime.com/,这个是knime官方存储节点和流程库的,里面也会时常更新。
社区推荐就根据很多使用社区里面节点的频率。服务器推荐是knime-server上存储的节点,我们在KAP分析平台上可以通过knime-serve的api直接连接到服务器上,可以下载服务器上的节点到KAP分析平台上,它就根据用户在服务上使用的节点频率进行节点推荐,但它推荐的节点只是服务器本地resposity里面现有的节点。
Workspace推荐代码
源码有这么一段话
Frequency of how often the nodes were used in the workflows of your workspace.
在工作区的工作流中使用节点的频率。
在这里插入图片描述

这部分代码是获取节点频率的

    return NodeFrequencies.from(Files.newInputStream(WORKSPACE_NODE_TRIPLES_JSON_FILE)).getFrequencies().stream();

worksapce的节点使用率存在了一个名为workspace_recommendations.json的json文件内,每次更新最自动根据KNIME的工作空间(D:\Users\nn\knime-workspace.metadata\knime)路径找到这个文件,并对其更新,在KAP平台上拖动节点,work coach会自动根据最新的json数据来进行节点推荐。

static {PREFS = new ScopedPreferenceStore(InstanceScope.INSTANCE, FrameworkUtil.getBundle(WorkspaceTripleProvider.class).getSymbolicName());WORKSPACE_NODE_TRIPLES_JSON_FILE = Paths.get(KNIMEConstants.getKNIMEHomeDir(), "workspace_recommendations.json");
}

community推荐机制代码
在这里插入图片描述
CommunityTripleProvider.java

//
// Source code recreated from a .class file by IntelliJ IDEA
// (powered by Fernflower decompiler)
//package org.knime.workbench.workflowcoach.data;import java.util.Collections;
import java.util.List;
import org.eclipse.core.runtime.preferences.InstanceScope;
import org.eclipse.ui.preferences.ScopedPreferenceStore;
import org.osgi.framework.FrameworkUtil;public class CommunityTripleProvider extends AbstractFileDownloadTripleProvider {private static final ScopedPreferenceStore PREFS;static {PREFS = new ScopedPreferenceStore(InstanceScope.INSTANCE, FrameworkUtil.getBundle(CommunityTripleProvider.class).getSymbolicName());}public CommunityTripleProvider() {super("https://update.knime.com/community_recommendations.json", "community_recommendations.json");}public String getName() {return "Community";}public String getDescription() {return "Frequency of how often the KNIME community used this node.";}public boolean isEnabled() {return PREFS.getBoolean("community_node_triple_provider");}public static final class Factory implements NodeTripleProviderFactory {public Factory() {}public List<NodeTripleProvider> createProviders() {return Collections.singletonList(new CommunityTripleProvider());}public String getPreferencePageID() {return "org.knime.workbench.workflowcoach";}}
}

上面代码社区的推荐代码,可以看到推荐的原理是我们请求一个url,这个url返回一个json数据,这个数据是最近社区一些节点的使用频率

 private static void fillRecommendationsMap(Map<String, List<NodeRecommendationManager.NodeRecommendation>> recommendationMap, NodeTriple nf) {if (!nf.getNode().isPresent() && !nf.getPredecessor().isPresent() && isSourceNode(nf.getSuccessor())) {add(recommendationMap, "<source_nodes>", nf.getSuccessor(), nf.getCount());}if (!nf.getPredecessor().isPresent() && nf.getNode().isPresent() && isSourceNode((NodeInfo)nf.getNode().get())) {add(recommendationMap, "<source_nodes>", (NodeInfo)nf.getNode().get(), nf.getCount());}if (nf.getNode().isPresent()) {add(recommendationMap, getKey((NodeInfo)nf.getNode().get()), nf.getSuccessor(), nf.getCount());}if (nf.getPredecessor().isPresent() && nf.getNode().isPresent()) {add(recommendationMap, getKey((NodeInfo)nf.getPredecessor().get()) + "#" + getKey((NodeInfo)nf.getNode().get()), nf.getSuccessor(), nf.getCount());}}

实验
在这里插入图片描述
这里我新建一个流程,其中Data Generator为社区的节点,其功能为数字生成器,Test是我自己自定义开发的节点,其功能是可以调整数据保留几位小数。后面两个分别是画直线图和散点图。
在这里插入图片描述
在这里插入图片描述

一开始我把在eclipse上自定义开发的节点达成jar包放到knime安装目录下的dropin目录下,这样打开KNIME分析平台就可以看到这个节点了。但是当选中此节点时,此时的workflow coach没有任何推荐的节点,我们执行这个流程并保存。
打开workflow coach配置,点击更新,此时会下载更新一个名为workspace_recommendations.json。里面存储了当前工作区每个节点使用的频率。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

可以看到Test节点的前驱为Data Generator,后继为Scatter Plot和Line Plot
此时再查看workflow coach
在这里插入图片描述

可以看出Scatter Plot和Line Plot分别为50%,同理社区的节点推荐元也是如此,不过这个每次更新都能远程下载一个节点使用频率的json文件,还有在工作区上,分析平台时如何监视节点的,并算出频率的,这些问题还有待研究。

这篇关于深究KNIME分析平台上的节点是如何实现推荐原理的的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/843998

相关文章

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

Qt QCustomPlot库简介(最新推荐)

《QtQCustomPlot库简介(最新推荐)》QCustomPlot是一款基于Qt的高性能C++绘图库,专为二维数据可视化设计,它具有轻量级、实时处理百万级数据和多图层支持等特点,适用于科学计算、... 目录核心特性概览核心组件解析1.绘图核心 (QCustomPlot类)2.数据容器 (QCPDataC

Java内存分配与JVM参数详解(推荐)

《Java内存分配与JVM参数详解(推荐)》本文详解JVM内存结构与参数调整,涵盖堆分代、元空间、GC选择及优化策略,帮助开发者提升性能、避免内存泄漏,本文给大家介绍Java内存分配与JVM参数详解,... 目录引言JVM内存结构JVM参数概述堆内存分配年轻代与老年代调整堆内存大小调整年轻代与老年代比例元空

深度解析Java DTO(最新推荐)

《深度解析JavaDTO(最新推荐)》DTO(DataTransferObject)是一种用于在不同层(如Controller层、Service层)之间传输数据的对象设计模式,其核心目的是封装数据,... 目录一、什么是DTO?DTO的核心特点:二、为什么需要DTO?(对比Entity)三、实际应用场景解析

关于集合与数组转换实现方法

《关于集合与数组转换实现方法》:本文主要介绍关于集合与数组转换实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、Arrays.asList()1.1、方法作用1.2、内部实现1.3、修改元素的影响1.4、注意事项2、list.toArray()2.1、方

从原理到实战深入理解Java 断言assert

《从原理到实战深入理解Java断言assert》本文深入解析Java断言机制,涵盖语法、工作原理、启用方式及与异常的区别,推荐用于开发阶段的条件检查与状态验证,并强调生产环境应使用参数验证工具类替代... 目录深入理解 Java 断言(assert):从原理到实战引言:为什么需要断言?一、断言基础1.1 语

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

java实现docker镜像上传到harbor仓库的方式

《java实现docker镜像上传到harbor仓库的方式》:本文主要介绍java实现docker镜像上传到harbor仓库的方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 前 言2. 编写工具类2.1 引入依赖包2.2 使用当前服务器的docker环境推送镜像2.2

Go语言中nil判断的注意事项(最新推荐)

《Go语言中nil判断的注意事项(最新推荐)》本文给大家介绍Go语言中nil判断的注意事项,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1.接口变量的特殊行为2.nil的合法类型3.nil值的实用行为4.自定义类型与nil5.反射判断nil6.函数返回的