数据资产入表-数据治理-指标建设标准

2024-06-07 00:12

本文主要是介绍数据资产入表-数据治理-指标建设标准,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

       前情提要:数据价值管理是指通过一系列管理策略和技术手段,帮助企业把庞大的、无序的、低价值的数据资源转变为高价值密度的数据资产的过程,即数据治理和价值变现。上一讲介绍了标签标准设计的基本逻辑和思路。数据资产入表-数据治理-标签设计标准

本章重点讲解指标建设标准设计

       指标数据是为了基于场景出发,为了满足内部分析决策或者外部使用的一个高度凝练的数据结果集,指标数据标准是为满足管理指标生产过程、对基础类数据加工而产生的指标数据标准化规范。

       数据分析师或者数仓治理人员常常会听到”统计结果不对”、”这个指标没有”、”这个指标怎么用?”的灵魂拷问。在做了问题定位之后,除了真的指标缺失之外,还有以下三张情形:

       ①指标名称不规范:当指标生产了一段时间,有了初步沉淀后,发现存量指标的名称千奇百怪,各有各的风格,这个是在指标设计之初对于指标的命名没有做出对应的规范(做出规范的同时需要有工具支撑);

       ②指标重复建设:在盘点指标的过程中,发现指标因名称不规范、单位不规范等原因,同一个指标出现多次建设的情况;

       ③指标口径不清晰:在指标使用的过程中,发现指标命名长得相似,但是不知道具体含义,也不清楚哪个指标适用于哪个场景;

       因此需要构建一套指标数据标准,帮助我们在指标体系搭建的过程中和用户使用的过程中更为清晰明了。

指标数据标准建设

       指标数据标准是为满足内部分析管理需要和外部监管要求,对基础类数据加工而产生的指标数据标准化规范。指标数据标准通过基础属性、业务属性、技术属性和管理属性来描述指标数据规范化要求。--引用《JR/T0137-2017银行经营管理指标数据元》

指标类型

       指标的梳理还是离不开实体的确认,实体在指标体系中是指标统计的对象,在指标体系梳理的过程中,在业务的角度上把指标分为原子指标、复合指标、派生指标;

       原子指标:是针对实体对象的基础统计值;例如(企业数量)

       复合指标:是在原子指标的基础上,增加属性维度的统计;例如(杭州市:企业数量;杭州市:新成立企业数量)

       派生指标:是在原子指标、复合指标的基础上,进行复合计算的派生指标;例如(杭州市:企业数量累计同比)

指标体系搭建

       指标体系的搭建一般是业务运行一段时间后,对于明细数据有一定沉淀,且业务人员在实际业务管理过程中存在一定的场景需求之后,才有具体的指标体系搭建场景。指标体系搭建的步骤如下:

step1:场景/业务需求收集和调研

        在业务收集的过程中,需要用户明确的内容包含指标统计的场景描述、统计的时间范围、统计的类型(要当前值、同比值、累计值、环比值)、统计的区域(若业务上没有,可忽略),平常使用的频率,如果是金额维度,需要描述统计的单元;

step2:在收集和调研业务需求后,开始梳理指标体系,需要基于业务需求拆解核心信息

 ①确定原子指标:明确出来业务需求中需要统计的实体;

 ②确定复合属性:明确统计口径中包含的修饰维度,其中需要区分出常用修饰维度和使用率较低的属性;

 ③确定统计口径:基于需求确定统计时间、统计类型的口径;

 ④输出指标清单:基于上述的信息收集和梳理,生成版本号、构建指标名称模板、统计单位、计算类型、指标释义、指标计算规则、更新频率等;

  1. 版本号:是指本次指标逻辑操作的次数记录,一般依托于工具生成;
  2. 指标名称模板:在指标生产的过程中,一般不会一个个罗列指标进行生产,会采用group by 的逻辑分类统计,因此在我们输出需求清单的时候,可能不是实际的指标名称,而是指标名称的模板,需要在命名的时候给分类修饰词留下占位符;
  3. 指标类型:描述指标的类型是属于原子指标、复合指标,派生指标
  4. 业务标签:描述业务标签类型,业务标签类型背后可以映射一张标签结果表;
  5. 计算类型:指的是这个指标是基于count、sum、avg等类型计算而成;
  6. 指标释义:需要描述指标的统计维度,包含的必要维度有统计实体、参与统计的业务标签;
  7. 实体所在明细表:顾名思义是被统计实体的明细表表名;
  8. 计算规则:是指该指标的计算规则;
  9. 单位:描述指标的单位信息;
  10. 更新频率:指定指标计算的频率;结合明细表的更新频率,指标的计算频率要低于明细表的更新频率;
  11. 负责人:明确该指标的业务负责人名称;

 step3:推动开发和验收:基于输出的需求清单推动开发和验收上线;

指标梳理流程

这篇关于数据资产入表-数据治理-指标建设标准的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1037632

相关文章

小型数据中心是什么?如何建设?

在数字化时代,小型数据中心正成为许多企业和组织加强数据管理和服务扩展的理想选择。与传统大型数据中心相比,小型数据中心以其灵活性、高效性和相对较低的运营成本吸引着越来越多的关注。然而,要成功建设一个小型数据中心,并确保其安全、可靠和高效运行,需要综合考虑多个关键因素和最佳实践。本文将深入探讨小型数据中心的定义、关键要点以及建设过程中的注意事项,帮助您全面理解和规划这一重要的IT基础设施。 小型数据

【服务器运维】MySQL数据存储至数据盘

查看磁盘及分区 [root@MySQL tmp]# fdisk -lDisk /dev/sda: 21.5 GB, 21474836480 bytes255 heads, 63 sectors/track, 2610 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesSector size (logical/physical)

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述。以下是从不同角度对气象站的种类和应用范围的介绍: 一、气象站的种类 根据用途和安装环境分类: 农业气象站:专为农业生产服务,监测土壤温度、湿度等参数,为农业生产提供科学依据。交通气象站:用于公路、铁路、机场等交通场所的气象监测,提供实时气象数据以支持交通运营和调度。林业气象站:监测林区风速、湿度、温度等气象要素,为林区保护和

数据时代的数字企业

1.写在前面 讨论数据治理在数字企业中的影响和必要性,并介绍数据治理的核心内容和实践方法。作者强调了数据质量、数据安全、数据隐私和数据合规等方面是数据治理的核心内容,并介绍了具体的实践措施和案例分析。企业需要重视这些方面以实现数字化转型和业务增长。 数字化转型行业小伙伴可以加入我的星球,初衷成为各位数字化转型参考库,星球内容每周更新 个人工作经验资料全部放在这里,包含数据治理、数据要

如何在Java中处理JSON数据?

如何在Java中处理JSON数据? 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们将探讨在Java中如何处理JSON数据。JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,在现代应用程序中被广泛使用。Java通过多种库和API提供了处理JSON的能力,我们将深入了解其用法和最佳

两个基因相关性CPTAC蛋白组数据

目录 蛋白数据下载 ①蛋白数据下载 1,TCGA-选择泛癌数据  2,TCGA-TCPA 3,CPTAC(非TCGA) ②蛋白相关性分析 1,数据整理 2,蛋白相关性分析 PCAS在线分析 蛋白数据下载 CPTAC蛋白组学数据库介绍及数据下载分析 – 王进的个人网站 (jingege.wang) ①蛋白数据下载 可以下载泛癌蛋白数据:UCSC Xena (xena

中国341城市生态系统服务价值数据集(2000-2020年)

生态系统服务反映了人类直接或者间接从自然生态系统中获得的各种惠益,对支撑和维持人类生存和福祉起着重要基础作用。目前针对全国城市尺度的生态系统服务价值的长期评估还相对较少。我们在Xie等(2017)的静态生态系统服务当量因子表基础上,选取净初级生产力,降水量,生物迁移阻力,土壤侵蚀度和道路密度五个变量,对生态系统供给服务、调节服务、支持服务和文化服务共4大类和11小类的当量因子进行了时空调整,计算了

C++标准模板库STL介绍

STL的六大组成部分 STL(Standard Template Library)是 C++ 标准库中的一个重要组成部分,提供了丰富的通用数据结构和算法,使得 C++ 编程变得更加高效和方便。STL 包括了 6 大类组件,分别是算法(Algorithm)、容器(Container)、空间分配器(Allocator)、迭代器(Iterator)、函数对象(Functor)、适配器(Adapter)

【计算机网络篇】数据链路层(12)交换机式以太网___以太网交换机

文章目录 🍔交换式以太网🛸以太网交换机 🍔交换式以太网 仅使用交换机(不使用集线器)的以太网就是交换式以太网 🛸以太网交换机 以太网交换机本质上就是一个多接口的网桥: 交换机的每个接口考研连接计算机,也可以理解集线器或另一个交换机 当交换机的接口与计算机或交换机连接时,可以工作在全双工方式,并能在自身内部同时连通多对接口,使每一对相互通信的计算机都能像