Datacleaner译文修改版目录

2024-02-21 18:58

本文主要是介绍Datacleaner译文修改版目录,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

参考文档

4.5

本文档的副本可以供自己使用和分发给别人,只要你不收取任何费用(副本和进一步提供,每个副本包含版权声明,是否分布在打印或电子。


表的内容

即DataCleaner概论
1。背景和概念
数据质量(DQ)是什么? 什么是数据分析? 什么是数据整理? 什么是数据存储?
综合数据存储
什么是数据监控? 主数据管理(MDM)是什么?
2。开始使用DataCleaner桌面
安装桌面应用程序 连接到你的数据存储 将组件添加到工作 将组件结合在一起
Transformer  输出 过滤器的要求 输出数据流
执行工作 Saving and opening jobs 模板工作 洁净的数据写入文件
3。开始使用DataCleaner监视器
安装监视web应用程序 在Windows上创建资源文件夹
连接到你的datastore 建立一个工作 调度工作 在仪表板上添加度量图表
二。分析组件引用
4。Transform
JavaScript transformer 调用子分析工作 Equals 最大行 非空 Union
5。Improve
重复检测
“模型训练 (Model training)”模式 “检测(Detection)模式 未经训练的检测(Untrained detection)模式
合并复制
合并复制 结论
同义词查找 DE movers and deceased check 
地址和邮件抑制数据源 输出
英国搬家公司、死亡和邮件首选项检查
地址和邮件抑制数据源 输出
我们搬家公司,死者和do-not-mail检查
地址和邮件抑制数据源 输出
查表 国家标识符 姓名和地址更正
6。分析,分解
逻辑分析仪 完整性分析仪 字符集分布 日期差距分析仪 日期/时间分析器 数字分析仪 模式搜索 参考数据匹配器 参照完整性 字符串分析仪 唯一键检查 值分布 价值匹配器 工作日的分布
7。写
创建CSV文件 创建Excel电子表格 创建临时表 插入表 更新表
三。参考数据
8。字典 9。同义词(又名。同义词目录)
同义词的文本文件目录 数据存储同义词目录
10。字符串的模式
四。配置参考
11。配置文件
XML模式 数据存储
数据库(JDBC)连接 逗号分隔值(CSV)文件 固定宽度值文件 Excel电子表格 XML文件数据存储 ElasticSearch指数 MongoDB数据库 CouchDB数据库 综合数据存储
参考数据
字典 同义词目录 字符串的模式
任务 runner 存储 provider
12。分析工作文件
XML schema 源节
13。日志记录
日志配置文件 默认的日志配置 修改日志级别 选择日志输出
14。数据库驱动程序
安装在DataCleaner桌面数据库驱动程序 安装数据库驱动程序在DataCleaner监视器
五。DataCleaner监控存储库
15。存储库配置
配置存储库位置
目录的存储库 数据库支持的库
提供已签署的Java WebStart客户端文件
制造已签名的jar 配置DataCleaner监视器以使用已签名的jar
集群配置(分布式执行)
16。仓库布局
多租户的布局 租户家里的布局
VI。DataCleaner监视web服务
17。工作引发
触发服务 轮询执行状态
18。库导航
工作文件 结果文件 上传内容存储库 修改结果的元数据 重命名工作 复制工作 删除工作
19。度量web服务
指标的背景 可用的指标列表 特定的度量指标的值
20。原子转换(数据清洗服务)
原子转换服务是什么? 调用原子转换
七。从命令行调用DataCleaner工作
21。命令行界面
可执行文件 使用场景 执行分析工作 清单数据存储内容和可用的组件 可参数化的工作 动态覆盖配置元素 22。Apache Hadoop和Spark接口
Hadoop部署概述 设置Spark和DataCleaner环境
上载配置文件到HDFS 上传作业文件到HDFS 将可执行文件上传到HDFS
使用Spark启动DataCleaner作业 使用Hadoop DataCleaner桌面
配置Hadoop集群 CSV数据存储在HDFS Hadoop集群上运行作业
使用Hadoop DataCleaner监视器
CSV数据存储在HDFS Hadoop集群上运行作业
Hadoop接口的局限性
八。第三方集成
22。Pentaho集成
配置DataCleaner Pentaho数据集成 发射DataCleaner概要Pentaho数据集成的步骤 运行Pentaho在DataCleaner监控数据集成工作 运行在Pentaho DataCleaner工作数据集成
九。开发人员指南
23。体系结构
数据访问 处理框架
24。通过代码执行的工作
概述的步骤和选项 步骤1:配置 步骤2:工作 步骤3:执行 步骤4:结果
25。开发人员资源
扩展开发教程 建筑DataCleaner
26岁。扩展包装
带注释的组件 单一JAR文件 扩展元数据的XML 组件的图标
27。扩展包装
带注释的组件 单一JAR文件 扩展元数据的XML

组件的图标

28。嵌入DataCleaner

这篇关于Datacleaner译文修改版目录的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/732747

相关文章

android应用中res目录说明

Android应用的res目录是一个特殊的项目,该项目里存放了Android应用所用的全部资源,包括图片、字符串、颜色、尺寸、样式等,类似于web开发中的public目录,js、css、image、style。。。。 Android按照约定,将不同的资源放在不同的文件夹中,这样可以方便的让AAPT(即Android Asset Packaging Tool , 在SDK的build-tools目

CentOS下mysql数据库data目录迁移

https://my.oschina.net/u/873762/blog/180388        公司新上线一个资讯网站,独立主机,raid5,lamp架构。由于资讯网是面向小行业,初步估计一两年内访问量压力不大,故,在做服务器系统搭建的时候,只是简单分出一个独立的data区作为数据库和网站程序的专区,其他按照linux的默认分区。apache,mysql,php均使用yum安装(也尝试

Detectorn2预训练模型复现:数据准备、训练命令、日志分析与输出目录

Detectorn2预训练模型复现:数据准备、训练命令、日志分析与输出目录 在深度学习项目中,目标检测是一项重要的任务。本文将详细介绍如何使用Detectron2进行目标检测模型的复现训练,涵盖训练数据准备、训练命令、训练日志分析、训练指标以及训练输出目录的各个文件及其作用。特别地,我们将演示在训练过程中出现中断后,如何使用 resume 功能继续训练,并将我们复现的模型与Model Zoo中的

Java Web应用程序的推荐目录结构

以前没有用过maven管理过项目的依赖,最后使用上了maven,发现通过不能方式建立出来的web应用程序目录结构基本都不一样,既然每次都要到网上搜索如何建立maven管理的Web应用程序,不如自己找百度谷歌一下。 找了半天 ,感觉比较好的maven管理的web应用程序目录结构是这个: ├── pom.xml└── src├── main│ ├── java│ │ └── myg

src/pyaudio/device_api.c:9:10: fatal error: portaudio.h: 没有那个文件或目录

(venv) shgbitai@shgbitai-C9X299-PGF:~/pythonworkspace/ai-accompany$ pip install pyaudio sounddeviceCollecting pyaudioDownloading PyAudio-0.2.14.tar.gz (47 kB)━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

为libpng不同架构创建构建目录、编译、安装以及合并库文件的所有步骤。

好的。既然你已经有了 libpng 的源代码,并且当前处在它的目录下,我们可以简化脚本,不再需要下载和解压源代码这一步。以下是修改后的脚本:```sh#!/bin/bash# 当前目录即 libpng 源代码目录LIBPNG_SRC_DIR=$(pwd)# 设置工作目录WORK_DIR=$(pwd)/libpng_buildBUILD_DIR_X86_64="$WORK_DIR/build

Spring Boot + Vue 多级目录的构建详解

1. 背景介绍 1.1 为何选择 Spring Boot + Vue? 在现代 Web 开发中,前后端分离已成为一种标准实践。Spring Boot 提供了强大的后端开发能力,尤其在构建企业级应用时,其轻量级、高效性和丰富的生态系统让开发者如虎添翼。而 Vue.js 则以其简单易学的语法和灵活的组件系统,成为前端开发的热门选择。结合这两个技术栈,我们可以轻松实现复杂的业务逻辑与优秀的用户体验。

Java传输本地目录到远程服务器

在使用Java进行开发时,有时需要将本地目录中的文件复制或传输到远程服务器上。这种场景在部署应用程序或进行数据迁移时尤为常见。JSch库提供了一种简便的方法来实现这一功能。以下是从Codekru网站获取的信息摘要,并结合相关内容,展示如何使用JSch库实现从本地计算机复制整个目录到远程服务器的过程。 准备工作 首先,确保您的项目中已经包含了JSch库的依赖。如果您使用Maven作为构建工具,可

关于WebZip乱码目录文件名修改

先引用一段 来描述问题:  在IT行业中,我们经常遇到与编码和字符集有关的问题,特别是在处理包含中文字符的文件或目录时。"WebZip乱码目录文件名修改"这个问题就是一个典型的例子,涉及到Webzip工具在下载包含中文路径的文件时出现的编码问题。Webzip是一款用于网站离线浏览的工具,它能够抓取整个网站并保存到本地,以便在没有网络连接的情况下访问。然而,当Webzip处理含有非

BLE协议栈安装和目录简介

首先在TI官网上下载BLE协议栈。  目前最新的协议栈版本已经升级到1.4.0, 并且此协议栈版本配套的 IAR 软件版本为 8.20.2。安装方法很简单,建议安装在C盘上,安装好后,你会在c盘上发现有Texas Instruments目录。 下面看看Texas Instruments下都有什么文件。 \Accessories\Drivers 里 面 存 放 的 是 烧 写 了