数据仓库外的MDM

2024-01-27 08:58
文章标签 数据仓库 mdm

本文主要是介绍数据仓库外的MDM,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

转自:http://www.ciotimes.com/bigdata/90138.html 

企业被淹没在来自客户、供应商、员工和他们的操作系统的数据中。大多数企业有数据仓库 (DW) 或商业智能 (BI) 程序,有些已运行多年。DW/BI程序经常不能提供业务所需要的一致信息,因为客户员工、供应商和产品名称经常重复或不一致。主数据管理 (MDM) 就是用来解决不一致的列表和维度这种问题的方案。



    现实情况是,多年来,不管人们意识到它与否,数据仓库 (DW) 已经担任了默认的主数据管理 (MDM) 存储器。因为主数据管理(MDM) 必须进行一致性调和并为每一种业务需要执行企业分析的数据主题区产生数据总清单。早在主数据管理(MDM) 这个词出现的几年前, MDM被称作参考数据的管理。但数据仓库 (DW) 程序无法提供有效的主数据管理(MDM) 解决方案有几个原因。


    数据仓库并未改变源数据

    数据仓库 (DW) 支持下游的商业智能(BI)报表和分析而不是上游像企业资源规划(ERP)系统这样的操作流程和应用系统。它虽不是支持商业智能(BI)和报表的抑制剂,但期待它能支持需要主数据管理(MDM)的操作系统(即创建一个总清单来支持ERP系统)时,它确实成为一个问题。IT中的许多人的根本的假设是企业资源规划(ERP)系统应该自己管理自己的数据,包括主数据,因为企业资源规划(ERP)系统企业中数据的起源。许多数据仓储的实践者遵守着诫命:“不可改变的源数据。”不能够改变数据地创建“黄金记录”,有效的主数据管理(MDM)流程是不可能得以实现的。

    但通过企业资源规划(ERP)交付单一版的事实时却发生了一件有趣的事 — 人们使用它们中的多个,而每个都有自己的主数据版本。也许企业有来自不同供应商的企业资源规划(ERP) 产品,或者他们在企业针对不同的业务团体多次实施了同样的企业资源规划 (ERP)系统。

    不管怎样,最终的结果是企业资源规划 (ERP) 系统需要一个主数据管理(MDM)存储器来实现企业的作用。这就导致了企业资源规划 (ERP) 供应商开始针对他们的产品建造自己主数据管理 (MDM)解决方案,而对其它软件公司建立独立的解决方案。

    它不仅仅是合并数据

    数据从许多数据源中采集并整合到数据仓库(DW) 中进一步地处理为商业智能(BI)做好准备。数据仓库 (DW) 的整合过程善于在它获得的数据质量的约束中尽可能保持数据的一致。另一方面,主数据管理 (MDM) 需要在收集、净化、合规、一致、验证、授权和公布约定的主数据时更稳健和更广泛的流程。这一过程比通常用来加载数据仓库 (DW) 的提取、转换和加载 (ETL) 工具需要的更多。

    通常企业着手的首个主数据管理(MDM)之一是创建客户的单一视图。这种优先级是由实现全面和一致的顾客视图中很可能的商业投资回报率(ROI)所驱动。以顾客为中心的主数据管理 (MDM) 的关键整合过程是解决客户名字的不同,要么是个人或一种业务,以及与之相关的地址。名字和地址的匹配需要专门的流程,而产品一般都用于数据仓库 (DW)中。

    工具不充足

    数据仓库 (DW) 成功实施主数据管理 (MDM) 解决方案的另一个约束是,假设技术会解决主数据管理 (MDM) 的问题而无需在方程中包括很多人和流程(当然也包括政治)。数据管理, 在业务拥有数据而IT是它的托管人的情况下,需要成功地设计、部署和维持一个主数据管理 (MDM) 解决方案。

    商业人士需要帮助IT确定主数据,给它下定义,并帮助确定最后总清单应该是什么样的。主数据管理需要业务的承诺,它应该被视为公司的资产。值得注意的是,这样的抑制不是制约任何技术的方法,而是需要包括任何开发的解决方案。

    主数据管理 (MDM) 要求数据管理程序是企业信息管理方案的一部分,应主动更新与维护业务创建的数据定义。数据管理更是一个支持的流程,但往往因为它的可交付成果不纳入信息管理而不符合标准。


    准备开始

    在数据仓库及相关流程无法提供主数据管理 (MDM) 时,就是购买主数据管理 (MDM) 产品时,对吗?

    虽然购买相对建立可能是最具成本效益的方法,在购买主数据管理 (MDM) 产品之前仍然需要三思。购买之前应该确定你需要什么 。不弄明白为什么以往的努力中的欠缺必然会导致失败。你可能会部署一个新的主数据管理 (MDM) 产品,但仍未实现你想要的业务结果。更糟的是,你还可能会造成了另一个独立的数据 ― 让你离一个单一版本的真相更远。

    成功两大要素是数据整合的综合方法和为你的企业进行企业数据管理。


    一个企业数据整合平台通过能在运营和分析解决方案之间实现双向整合,用所需的合适技术整合各类企业应用程序和数据仓库(DW),来解决以上所讨论的第一种抑制。在过去实施战术上独立的数据整合工具,我们约束了每一个解决方案的建立。通常情况下,数据仓库(DW)采用提取、转换和加载(ETL)而企业应用程序使用网络服务,这就限制了分析的能力和操作系统交换和整合它们的数据。


    企业数据管理,尤其是数据管理,对任何主数据管理(MDM)解决方案的开始和保持运营都是十分必要的。没有一项技术要消除这些解决方案中的人为因素。


    你应该买主数据管理 (MDM) 产品吗? 也许吧,但先确保有一个综合企业数据整合平台,有合适的确保成功的支持信息管理的程序。



这篇关于数据仓库外的MDM的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/649735

相关文章

数据仓库理论知识

1、数据仓库的概念          数据仓库(英文:Date Warehouse,简称数仓、DW),是一个用于数据存储、分析、报告的数据系统。数据仓库的建设目的是面向分析的集成化数据环境,其数据来源于不同的外部系统,其结果开放给不同外部应用使用,为企业提供决策支持; 2、数据仓库的主要特征 数据仓库是面向主题性(Subject-Oriented )、集成性(Integrated)、非易

数据仓库: 6- 数据仓库分层

目录 6- 数据仓库分层6.1 简介6.1.1 数据仓库分层的优势6.1.2 常见的数据仓库分层模型6.1.2.1 四层模型6.1.2.2 三层模型 6.1.3 数据仓库分层原则6.1.4 数据仓库分层示例6.1.5 总结 6.2 ODS(操作数据存储)层6.2.1 ODS 层的主要功能6.2.2 ODS 层的特点6.2.3 ODS 层的设计要点6.2.4 ODS 层的应用场景6.2.5 总

数据仓库系统的实现与使用(含OLAP重点讲解)

系列文章: 《一文了解数据库和数据仓库》 《DB数据同步到数据仓库的架构与实践》 《数据湖(Data Lake)-剑指下一代数据仓库》 《从0建设离线数据仓库》 《基于Flink构建实时数据仓库》 阅读目录 前言创建数据仓库ETL:抽取、转换、加载OLAP/BI工具数据立方体(Data Cube)OLAP的架构模式小结 前言 数据仓库是数据仓库开发中最核心的部分。然而完整的数据仓库系统还会涉及

【数据产品案例】有赞大数据实践- 敏捷型数据仓库的构建及其应用

案例来源:@洪斌 案例地址: https://tech.youzan.com/you-zan-big-data-practice/ 1. 数据仓库处理:近源数据层→数据宽表→基础指标表 1)近源数据层:封装中间层,实现: a. 合并不同业务数据,如pc和app的日志数据 b. 脏数据屏蔽 c. 冗余字段合并 2)数据宽表:提取足够

一文说清什么是数据仓库

01 数据仓库的概念 数据仓库的概念可以追溯到20世纪80年代,当时IBM的研究人员开发出了“商业数据仓库”。本质上,数据仓库试图提供一种从操作型系统到决策支持环境的数据流架构模型。 目前对数据仓库(Data Warehouse)的标准定义,业界普遍比较认可的是由数据仓库之父比尔·恩门(Bill Inmon)在1991年出版的“Building the Data Warehouse”(

计算机毕业设计Hadoop+PySpark共享单车预测系统 PyHive 共享单车数据分析可视化大屏 共享单车爬虫 共享单车数据仓库 机器学习 深度学习

《Hadoop共享单车分析与预测系统》开题报告 一、课题背景与意义 1.1 课题背景 随着共享经济的快速发展,共享单车作为一种新型绿色环保的共享经济模式,在全球范围内迅速普及。共享单车通过提供便捷的短途出行服务,有效解决了城市居民出行的“最后一公里”问题,同时促进了低碳环保和绿色出行理念的推广。然而,随着共享单车数量的急剧增加,如何高效管理和优化单车布局成为共享单车运营商面临的重要挑战。

计算机毕业设计PyHive+Hadoop深圳共享单车预测系统 共享单车数据分析可视化大屏 共享单车爬虫 共享单车数据仓库 机器学习 深度学习 PySpark

毕业设计题目基于 Hadoop 的共享单车布局规划 二、毕业设计背景 公共交通工具的“最后一公里”是城市居民出行采用公共交通出行的主要障碍,也是建设绿色城市、低碳城市过程中面临的主要挑战。 共享单车(自行车)企业通过在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供服务,完成交通行业最后一块“拼图”,带动居民使用其他公共交通工具的热情,也与其他公共交通方式产生协同效应。 共享单车是

数据仓库系列19:数据血缘分析在数据仓库中有什么应用?

你是否曾经在复杂的数据仓库中迷失方向,不知道某个数据是从哪里来的,又会流向何方?或者在处理数据质量问题时,无法快速定位根源?如果是这样,那么数据血缘分析将会成为你的得力助手,帮助你在数据的海洋中找到明确的航向。 目录 引言:数据血缘分析的魔力什么是数据血缘分析?数据血缘的核心概念 数据血缘分析在数据仓库中的应用1. 数据质量管理实际应用案例 2. 影响分析实际应用案例 3. 合规性和审计

浅谈维度建模、数据分析模型,何为数据仓库,与数据库的区别

往期推荐 大数据HBase图文简介-CSDN博客 数仓分层ODS、DWD、DWM、DWS、DIM、DM、ADS-CSDN博客 数仓常见名词解析和名词之间的关系-CSDN博客 数仓架构:离线数仓、实时数仓Lambda和Kappa、湖仓一体数据湖-CSDN博客 0. 前言 1991年,数据仓库之父 比尔·恩门 著书《Building the DataWarehouse》,要求构建数据仓

数据仓库系列17:元数据管理在数据仓库中的作用是什么?

想象一下,你正在管理一个巨大的图书馆,里面存放着数以万计的书籍。但是,这个图书馆没有任何目录、索引或分类系统。你能想象找到特定的一本书会有多困难吗?这就是没有元数据管理的数据仓库的真实写照。 目录 什么是元数据?元数据管理的重要性元数据在数据仓库中的类型1. 技术元数据2. 业务元数据3. 操作元数据 元数据管理的核心功能1. 数据目录2. 数据血缘分析3. 数据质量管理4. 数据版本控制