数据仓库数据挖掘——商业智能概述

2024-02-14 12:32

本文主要是介绍数据仓库数据挖掘——商业智能概述,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


商业智能(简称:BI)这一概念最早是有Gartner公司于1996年提出   

               定义:是对商业信息的搜集、管理和分析过程,目的是使企业的各级决策者获得知识或洞察力,促使他们做出对企业更有利的决策

               

               从作用上说:BI好比数据炼油厂

               从形态上说:BI实际上是帮助企业提高决策能力和云因更努力的概念、方法、过程以及软件的集合。

               从技术上说:主要包括数据仓库、联机分析处理、数据挖掘三大技术,还包括数据展现、绩效管理、指标管理以及躯体用于统计和分析商业数据的先进的信息技术

               

               商业智能功能:客户关系管理、经营分析、战略决策支持、绩效管理、产品创新和推广、异常处理

               当前典型应用:

                                      一、零售业:预测、营销、产品销售模式

                                      二、保险业:理赔分析、顾客利润率分析、客户价值分析、客户划分、风险分析

                                      三、金融和证券业:顾客利润率分析、信用管理

                                      四、制造业:市场营销、预测、采购分析

                                      五、电信业商业智能应用:客户管理、客户发展分析、业务量分析、收入分析、营销管理分析、市场竞争分析、服务质量分析、大客户分析、欠费和动态

                                                                                      防欺诈行为分析、代理商及渠道分析。

               未来CIO(Chief Information Officer)首席信息官们最先考虑实施的信息化项目,排在首位的是商业智能(37.2%),位列信息存储和灾难恢复系统

          (33.5%)、客户关系管理(29.8%)和网络安全系统(28.7%)之前。

               商业智能要向平台化发展:

                                      商业智能(BI)要向平台化发展

                                      将外部信息以BI服务方式提供,正和到公司内部BI应用程序中

                                      加强对非结构话数据的管理

                                      提高实时性

                                      将群众决策与现有的BI相结合

               BI开发过程:

               

                             数据-信息-知识-决策

               数据仓库技术:

                               定义:是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持

                                           管理决策(Decision Making Support)。

                               组成:数据仓库系统有数据仓库(DW)、仓库管理和分析工具三部分组成。

                               模型:大多数数据仓库都采用“星型模型”。

                                           星型模型是由“事实表”(大表)以及多个“维表”(小表)所组成

                                           事实表:存放大量关于企业的事实数据(数量数据)

                                           维表:存放描述性数据,维表是围绕事实表建立的较小的表

                                           除星型模型外,常见的数据仓库模型还有雪花、星网、3NF等

                                           

                                           数据集市:

                                                           根据数据的来源不同,数据集市可分为:从属数据集市、独立数据集市

                                           

                               过程:ETL

                                           数据仓库的数据获取需要经过抽取(Extration)、转换(Transform)、装载(Load)三个过程,即ETL过程

                                           ETL占有数据仓库开发过程的70%工作量

               联机分析处理(OLAP)技术:

                               联机分析处理又称多为分析,OLAP基本思想是从多方面和多角度以多维的形式来观察企业的状态、了解企业的变化、辅助决策。

                               技术核心:“维”这个概念,OLAP可以说是多为数据分析工具的集合

                               多维数据模型的存储形式:MOLAP(multi-dimensional OLAP,多维OLAP)、ROLAP(relation OLAP,关系OLAP)、WOLAP(Web OLAP)、

                                                                               HOLAP(hybrid OLAP,混合OLAP)


                              OLAP的多维分析:
                              在多维结构上进行切片、切块、钻取等操作。OLAP的典型应用,通过商业活动变化的查询发现问题,经过追踪查询找出问题出现的原因,达到辅助决策的作

                              用。


                              数据挖掘:
                              数据挖掘使用聚类(如神经网络聚类)、分类(如决策树分类)、预测、关联分析等带有探索性的建模功能。任务在于从海量数据中寻找不平常的且有用的商

                              业运作模型。
                              数据挖掘的任务包括关联分析、时序模式、聚类、分类、预测等。其中包含的典型算法有Aporior关联分析算法、 K-Mean聚类算法、ID3决策树分类算法、贝叶

                              斯分类算法等。


这篇关于数据仓库数据挖掘——商业智能概述的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/708504

相关文章

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

Java 创建图形用户界面(GUI)入门指南(Swing库 JFrame 类)概述

概述 基本概念 Java Swing 的架构 Java Swing 是一个为 Java 设计的 GUI 工具包,是 JAVA 基础类的一部分,基于 Java AWT 构建,提供了一系列轻量级、可定制的图形用户界面(GUI)组件。 与 AWT 相比,Swing 提供了许多比 AWT 更好的屏幕显示元素,更加灵活和可定制,具有更好的跨平台性能。 组件和容器 Java Swing 提供了许多

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

Java 多线程概述

多线程技术概述   1.线程与进程 进程:内存中运行的应用程序,每个进程都拥有一个独立的内存空间。线程:是进程中的一个执行路径,共享一个内存空间,线程之间可以自由切换、并发执行,一个进程最少有一个线程,线程实际数是在进程基础之上的进一步划分,一个进程启动之后,进程之中的若干执行路径又可以划分成若干个线程 2.线程的调度 分时调度:所有线程轮流使用CPU的使用权,平均分配时间抢占式调度

BIRT--商业智能和报表工具,从零开始

1.简介 BIRT (Business Intelligence and Reporting Tools), 是为 Web 应用程序开发的基于 Eclipse 的开源报表系统,特别之处在于它是以 Java 和 JavaEE 为基础。BIRT 有两个主要组件:基于 Eclipse 的报表设计器,以及部署到应用服务器上的运行时组件。 2.下载 官网下载网址:http://download.ec

java集合的概述

集合就是一个容器,我们可以把多个对象放入的容器中。就像水杯(假设容量可以不断扩大)一样,你可以往水杯中不断地添加水,既然是水杯,你就不能往里添加沙子,也就是说集合中添加的对象必须是同一个类型的(引用类型,而不能是基本类型)。 看到集合的介绍会让我们的想起数组,那么集合和数组有什么区别呢? 首先,数组的大小是固定的,而集合理论上大小是不限的。 其次,数组既可以存储基本数据类型的数据,也可以存储

【CSS in Depth 2 精译_023】第四章概述 + 4.1 Flexbox 布局的基本原理

当前内容所在位置(可进入专栏查看其他译好的章节内容) 第一章 层叠、优先级与继承(已完结) 1.1 层叠1.2 继承1.3 特殊值1.4 简写属性1.5 CSS 渐进式增强技术1.6 本章小结 第二章 相对单位(已完结) 2.1 相对单位的威力2.2 em 与 rem2.3 告别像素思维2.4 视口的相对单位2.5 无单位的数值与行高2.6 自定义属性2.7 本章小结 第三章 文档流与盒模型(已

《计算机视觉工程师养成计划》 ·数字图像处理·数字图像处理特征·概述~

1 定义         从哲学角度看:特征是从事物当中抽象出来用于区别其他类别事物的属性集合,图像特征则是从图像中抽取出来用于区别其他类别图像的属性集合。         从获取方式看:图像特征是通过对图像进行测量或借助算法计算得到的一组表达特性集合的向量。 2 认识         有些特征是视觉直观感受到的自然特征,例如亮度、边缘轮廓、纹理、色彩等。         有些特征需要通

Unity Adressables 使用说明(一)概述

使用 Adressables 组织管理 Asset Addressables 包基于 Unity 的 AssetBundles 系统,并提供了一个用户界面来管理您的 AssetBundles。当您使一个资源可寻址(Addressable)时,您可以使用该资源的地址从任何地方加载它。无论资源是在本地应用程序中可用还是存储在远程内容分发网络上,Addressable 系统都会定位并返回该资源。 您

Flutter 中的低功耗蓝牙概述

随着智能设备数量的增加,控制这些设备的需求也在增加。对于多种使用情况,期望设备在需要进行控制的同时连接到互联网会受到很大限制,因此是不可行的。在这些情况下,使用低功耗蓝牙(也称为 Bluetooth LE 或 BLE)似乎是最佳选择,因为它功耗低,在我们的手机中无处不在,而且无需连接到更广泛的网络。因此,蓝牙应用程序的需求也在不断增长。 通过阅读本文,您将了解如何开始在 Flutter 中开