datacleaner专题

datacleaner第六部分

第六部分,DataCleaner监视web服务 表的内容 17所示。工作引发 触发服务 轮询执行状态 18岁。库导航 工作文件 结果文件 上传内容存储库 修改结果的元数据 重命名工作 复制工作 删除工作 19所示。度量web服务 指标的背景 可用的指标列表 特定的度量指标的值 20。原子转换(数据清洗服务) 原子转换服务是什么? 调用原子转换

datacleaner第五部分

第五部分。DataCleaner监控存储库 表的内容 15。存储库配置 配置存储库位置 目录的存储库 数据库支持的库 提供Java WebStart客户机文件签署 生产签名jar 配置DataCleaner监控使用签名jar 集群配置(分布式执行) 16。仓库布局 多租户的布局 租户家里的布局 第15章。存储库配置

datacleaner第四部分,11、12、13、14章

第四部分,配置参考 表的内容 11。配置文件 XML模式 数据存储 数据库(JDBC)连接 逗号分隔值(CSV)文件 固定宽度值文件 Excel电子表格 XML文件数据存储 ElasticSearch指数 MongoDB数据库 CouchDB数据库 综合数据存储 参考数据 字典 同义词目录 字符串的模式 任务跑 存储提供商 12。分析工作文件 X

datacleaner第三部分,八、九、十章

第三部分。参考数据 表的内容 8。字典 9。同义词(又名。同义词目录) 同义词的文本文件目录 数据存储同义词目录 10。字符串的模式 第八章。字典 字典是参考数据列表用于验证或分类值对某些黑或白名单。字典一般可列举的,有限的,而如。每次字符串模式是动态的和评估。 有意义的词典的例子: 字典之类的产品类型“珠宝”,“男装”、“运动”等

datacleaner第二部分,四、五、六、七章

第二部分。分析组件引用 表的内容 4所示。变换 JavaScript变压器 调用子分析工作 = 马克斯行 非空 联盟 5。改��� 重复检测 “模型训练”模式 “检测”模式 未经训练的检测模式 合并复制 合并复制 结论 同义词查找 DE行动者和已故的检查 地址和邮件抑制数据源 输出 英国搬家公司、死亡和邮件首选项检查 地址和邮件抑制

datacleaner第一部分,一、二、三章

第一部分介绍DataCleaner 1。背景和概念 数据质量(DQ)是什么? 什么是数据分析? 什么是数据整理? 什么是数据存储? 综合数据存储 什么是数据监控? 主数据管理(MDM)是什么? 2。开始使用DataCleaner桌面 安装桌面应用程序 连接到你的数据存储 将组件添加到工作 将组件结合在一起 Transformer  输出 过滤器的要求 输出数据流

Datacleaner译文修改版目录

参考文档 4.5 版权©2008 - 2015 本文档的副本可以供自己使用和分发给别人,只要你不收取任何费用(副本和进一步提供,每个副本包含版权声明,是否分布在打印或电子。 表的内容 即DataCleaner概论 1。背景和概念 数据质量(DQ)是什么? 什么是数据分析? 什么是数据整理? 什么是数据存储? 综合数据存储 什么是数据