数据价值管理-数据验收标准

2024-06-13 02:36

本文主要是介绍数据价值管理-数据验收标准,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        前情提要:数据价值管理是指通过一系列管理策略和技术手段,帮助企业把庞大的、无序的、低价值的数据资源转变为高价值密度的数据资产的过程,即数据治理和价值变现。第一讲介绍了业务架构设计的基本逻辑和思路。前面我们讲完了数据资产建设标准、数据归集标准、数据处理标准三大标准类型。

本章我们讲解数据验收标准

       数据验收是对数据治理结果的确认动作,是对开放共享的数据集在使用前的最后一道质检动作。

数据验收标准的制定来源于两个方向:

       1.数据分级分类标准+质量目标值;

       2.数据资产建设标准+数据归集标准+数据处理标准制定的数据规则;

1.数据分级分类标准+质量目标值

       A.数据分级分类:这里特指根据数据对组织运营、决策、服务等的影响程度,将数据分为重要数据和一般数据。通过数据分级分类,识别出组织内部的重要数据;

       重要数据的判定标准可以参考数据使用频率、数据价值(获取难易程度、获取成本、数据的稀缺性)2个大维度来衡量;

       B.基于识别出来的重要数据和一般数据,制定不同的数据质量管理策略,例如重要数据的准确性、完整性、一致性等维度的质量目标需要达到99.8%。一般数据的准确性、完整性、一致性等维度的质量目标需要达到95%;

2.提取数据资产建设标准+数据归集标准+数据处理标准制定的相关数据规则

数据资产建设标准提取的信息包含:

       在数据资产建设中提取参考标准

数据归集标准提取的信息包含:

数据归集范围标准

       数据归集范围标准是描述数据归集数据集的范围,数据集范围(例如数据库、表单、文件范围)、字段范围、时间范围、地域范围、业务范围

模型设计和接入血缘标准

       模型设计和接入血缘标准是定义数据从数据源到数据入到组织内部的转换过程中的标准,需要描述来源数据集、来源字段、来源数据存储颗粒度、写入数据库、写入表、写入字段;

数据入库/湖的处理规则

       数据入库/湖的处理规则是在模型设计和接入血缘标准的基础上对于某些特殊字段的简单处理规则,例如时间格式转换,全角半角符号转换等;

数据处理标准提取的信息包含:

       数据处理规则的需求描述

结合上述标准和规范,制定数据验收标准模板如下所示

验收通过的数据可以对外提供服务

这篇关于数据价值管理-数据验收标准的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1056043

相关文章

SpringBoot中使用 ThreadLocal 进行多线程上下文管理及注意事项小结

《SpringBoot中使用ThreadLocal进行多线程上下文管理及注意事项小结》本文详细介绍了ThreadLocal的原理、使用场景和示例代码,并在SpringBoot中使用ThreadLo... 目录前言技术积累1.什么是 ThreadLocal2. ThreadLocal 的原理2.1 线程隔离2

Redis的数据过期策略和数据淘汰策略

《Redis的数据过期策略和数据淘汰策略》本文主要介绍了Redis的数据过期策略和数据淘汰策略,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录一、数据过期策略1、惰性删除2、定期删除二、数据淘汰策略1、数据淘汰策略概念2、8种数据淘汰策略

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

Python给Excel写入数据的四种方法小结

《Python给Excel写入数据的四种方法小结》本文主要介绍了Python给Excel写入数据的四种方法小结,包含openpyxl库、xlsxwriter库、pandas库和win32com库,具有... 目录1. 使用 openpyxl 库2. 使用 xlsxwriter 库3. 使用 pandas 库

SpringBoot定制JSON响应数据的实现

《SpringBoot定制JSON响应数据的实现》本文主要介绍了SpringBoot定制JSON响应数据的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录前言一、如何使用@jsonView这个注解?二、应用场景三、实战案例注解方式编程方式总结 前言

使用Python在Excel中创建和取消数据分组

《使用Python在Excel中创建和取消数据分组》Excel中的分组是一种通过添加层级结构将相邻行或列组织在一起的功能,当分组完成后,用户可以通过折叠或展开数据组来简化数据视图,这篇博客将介绍如何使... 目录引言使用工具python在Excel中创建行和列分组Python在Excel中创建嵌套分组Pyt

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

在Mysql环境下对数据进行增删改查的操作方法

《在Mysql环境下对数据进行增删改查的操作方法》本文介绍了在MySQL环境下对数据进行增删改查的基本操作,包括插入数据、修改数据、删除数据、数据查询(基本查询、连接查询、聚合函数查询、子查询)等,并... 目录一、插入数据:二、修改数据:三、删除数据:1、delete from 表名;2、truncate

Java实现Elasticsearch查询当前索引全部数据的完整代码

《Java实现Elasticsearch查询当前索引全部数据的完整代码》:本文主要介绍如何在Java中实现查询Elasticsearch索引中指定条件下的全部数据,通过设置滚动查询参数(scrol... 目录需求背景通常情况Java 实现查询 Elasticsearch 全部数据写在最后需求背景通常情况下

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)