大话商业智能

2024-05-23 02:58
文章标签 商业智能 大话

本文主要是介绍大话商业智能,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

摘要:

商业智能,英文名字叫Business Intelligence,英文简称BI。
BI这词看上去很神秘,给人很高科技的感觉,但真正了解的人不多,又加上某些厂商乱用BI来胡弄人,将好好的BI搞得不成人样。本文将会为大家分享我的粗浅理解,当然如果你是老鸟,请无视此文!
什么是BI?
 
BI是一个意义很广的词,没有标准的定义,简单说说我的理解:BI是一个对大量数据进行处理、分析、挖掘的框架,其目的就是希望得到有用的决策依据。
下图大致展示了这样的一个框架:
商业智能
该图由左到右依次划分为ETL集成数据、数据仓库建模、建立Cube(数据立方体)、数据呈现四部分。
ETL集成数据
ETL三个字母是Extract(数据抽取)、 Transform(转换)、 Loading(装载)三个单词的首字母。我们暂时不必去深究这三个词的意思,简单地说就是我们分析数据之前,需要将各处的数据汇总到一个地方,这个过程需要对原来的数据进行处理。
数据仓库建模
在这部分我们见到数据仓库(Dataware,简称DW)、数据集市这些概念,很多书将这两个概念说得很玄乎,实际上数据仓库、数据集市只是两个概念而已,在物理上往往就是一两个数据库甚至是数据表而已。数据仓库,你可以认为就是原数据经过ETL后集中存储的地方,数据仓库的存储结构需要精心设计。而数据集市只是将ETL后的数据分类存放而已,数据集市同样也需要精心设计存储结构。
建立Cube
我们先温习一下数据库存储的特点,一般来说数据库设计要尽量避免数据冗余,这样可提高数据库执行的效率也避免了数据不一致的问题。数据库上有大量的增加、删除、查找、修改等操作,要求快和具备实时性,数据库就是针对这些特点来设计的。数据库的CRUD操作(Create,Read,Update,Delete),被称为联机事务处理OLTP(on-line transaction processing)。
Cube是数据立方体,这是一种特殊的数据存储结构,它设计主要目的是方便读取,而不是方便写入。Cube中存在大量的冗余数据,以便可以快速地从不同角度、粒度来获取数据。这种面向数据分析的数据库操作,被称为联机分析处理OLAP(On-Line Analytical Processing)。
Cube是在数据仓库、数据集市的基础上建立的,建立Cube时需要指定维度、粒度等内容,设置是雪花型、星型等,这些内容比较复杂,不太熟悉的朋友先暂且了解到有这些名词就OK了,稍后再详细介绍。
数据呈现
建立数据仓库、数据集市、Cube,其目的有两:
1.为查询做好准备。
2.就是为数据挖掘做好准备。
市面上有很多做报表的工具,功能看上去很强大,能做柱状图、饼图等等,并且还戴上BI的帽子。其实这些工具并不是完整的BI工具,它们只做到数据展示这层而已。数据仓库、数据集市建好后,可用普通的SQL语句进行查询,而对于Cube,可用Cube专用的查询语句进行查询。
数据挖掘英文叫Data mining,那什么是数据挖掘呢?有很多说法,说说我的理解:是指用某些方法和工具,对数据进行分析,发现隐藏规律的一种方法。
数据挖掘有很多方法,如关联、聚类、分类、回归、序列分析、偏差分析等,这些内容都比较深奥。关于数据挖掘的详细内容,稍后我会再分享一篇文章。这里只需要知道,数据挖掘比一般的SQL查询不知道要强大多少倍,能得到超乎你想像的结果。
BI工具
 
BI工具我了解的不多,SQL Server 和 Oracle 两大数据库工具能完整地支持上述的BI框架,而大量充斥的BI小工具主要针对ETL和报表这两个层次的。如果大家遇到有人用BI的招牌来兜售软件,大家应该能识别出该软件的含金量。BI的核心技术在于数据存储、数据发掘,这两者都是高科技的玩意,我好像还没有见到这方面的国产优秀软件。
BI的应用
 
BI在国内的应用很多是门面工程,无论是去胡弄人的人还是被胡弄的人,其实都不知道什么是BI,一旦套上商业智能、决策分析这样的帽子,所有人都变成穿上“皇帝新衣”的人了。
要真正理解BI,关键一层是理解数据挖掘,熟悉各种数据挖掘算法的原理、特点和用途,运用这些知识来思考如何挖掘现存的数据。
举几个例子:
例1:据说若干年前麦当劳是没有套餐的,后来麦当劳对产品的销售数据进行分析,发现购买了汉堡包和薯条的客户,有70%以上的几率会购买可乐,所以麦当劳就将这三样东西捆绑来套餐来卖,结果销量大增。
例2:我经常在当当网购书,该网站很会推销,我看某本书时,它还会列出我可能感兴趣的书,很多时候我又忍不住去点了那些书看看,结果到了那本书的介绍页面,它又列出我其它可能感兴趣的书。这个“推荐”算法还是有一定技术含量的,这功能背后很可能应用了数据挖掘技术。
BI是很高技术含量的活,要在各行各业中应用,需要我们切实掌握BI的知识特别是数据挖掘的知识,为客户提供优秀的解决方案。

作者:张传波

创新工场创业课堂讲师

软件研发管理资深顾问

《火球——UML大战需求分析》作者

www.umlonline.org 创始人

这篇关于大话商业智能的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/996115

相关文章

BIRT--商业智能和报表工具,从零开始

1.简介 BIRT (Business Intelligence and Reporting Tools), 是为 Web 应用程序开发的基于 Eclipse 的开源报表系统,特别之处在于它是以 Java 和 JavaEE 为基础。BIRT 有两个主要组件:基于 Eclipse 的报表设计器,以及部署到应用服务器上的运行时组件。 2.下载 官网下载网址:http://download.ec

大话C++:第6篇 命名空间namespace作用域

1 命名空间概述 在一个大型的软件项目中,可能会有许多不同的代码文件,这些文件可能由不同的开发者编写,或者来自不同的库和模块。如果这些代码文件中存在同名的变量、函数、类或其他标识符,那么在编译或运行时就可能发生命名冲突,导致程序无法正确执行。 通过使用命名空间(namespace),开发者可以将相关的代码、变量、函数等组织在一起,形成一个独立的命名空间。这样,即使不同的代码片段中使用了相同的标

AIGC与数据分析融合,引领商业智能新变革(TOP企业实践)

AIGC与数据分析融合,引领商业智能新变革(TOP企业实践) 前言AIGC与数据分析融合 前言 在当今数字化时代,数据已成为企业发展的核心资产,而如何从海量数据中挖掘出有价值的信息,成为了企业面临的重要挑战。随着人工智能技术的飞速发展,AIGC(人工智能生成内容)与数据分析的融合为企业提供了新的解决方案。 阿里巴巴作为全球领先的科技公司,一直致力于探索和应用前沿技术,以提升企业

大话实时数据平台设计(上)

点击上方蓝色字体,选择“设为星标” 回复”资源“获取更多资源 大数据技术与架构 点击右侧关注,大数据开发领域最强公众号! 暴走大数据 点击右侧关注,暴走大数据! 一、相关概念背景 1从现代数仓架构角度看实时数据平台 现代数仓由传统数仓发展而来,对比传统数仓,现代数仓既有与其相同之处,也有诸多发展点。首先我们看一下传统数仓(图1)和现代数仓(图2)的模块架构: 图1 传统数仓 图2

大话实时数据平台设计(下)

在上篇点击上方蓝色字体,选择“设为星标” 回复”资源“获取更多资源 大数据技术与架构 点击右侧关注,大数据开发领域最强公众号! 暴走大数据 点击右侧关注,暴走大数据! 实时数据平台(RTDP,Real-time Data Platform)是一个重要且常见的大数据基础设施平台。在上篇中,我们从现代数仓架构角度和典型数据处理角度介绍了RTDP,并探讨了RTDP的整体设计架构。 本文作为下

Wyn 商业智能V8.0 新版本来袭,解锁“智造”的无限可能

Wyn商业智能V8.0 版本全新发布,聚焦制造业数字化升级痛点,深度赋能制造业数字化转型升级之路,从无缝集成物联网海量数据,到构建可视化实时分析、监控与预警大屏,全面打通生产制造全生命周期的数据脉络,为您开启工业智能新视界,一键解锁数字化工厂无限可能! Wyn商业智能 V8.0 版本亮点功能一览 1、支持MQTT等采集协议,接入物联网设备数据 全新引入”物联网数据”类型,支持MQTT,Web

大话C++:第1篇 C++语言概述

1 C++简介 C++是由C语言扩展升级而来,最早于1979年由本贾尼·斯特劳斯特卢普在AT&T贝尔工作室研发。C++在继承了C语言过程化程序设计特性的基础上,进一步扩充和完善了C语言,引入了面向对象的程序设计概念,如抽象数据类型、继承和多态等。这使得C++在面向对象程序设计方面具有强大的能力,同时它也可以进行基于过程的程序设计。 C++的发展历史是一个长期且充满变革的过程,它的主要发展历

大话数据结构之二叉树

一、概述 二叉树是一种非常重要的数据结构,它由节点组成,每个节点都包含三个部分:一个存储数据的元素(如整数、浮点数、字符、字符串等),一个指向左子节点的指针,以及一个指向右子节点的指针。二叉树的特点是每个节点最多有两个子节点,通常称为左子节点和右子节点。 二、常见类型 普通二叉树:没有额外约束的二叉树。二叉搜索树(BST):二叉搜索树(也称为二叉排序树、有序二叉树)是一种特殊的二叉树,它

《大话设计模式》之大总结

《大话设计模式》之大总结 前言:           有一种境界叫“持续的学习”,有一种生活叫讲故事,有一种人生叫好玩,这不,小编今天就为您献上设计模式之《大话设计模式》这本书,故事、原理、代码、好玩着呢,常常和同学交流中聊故事讲设计模式,下面是大话设计模式之大总结: 六大设计原则: “+”表示publi

大话设计模式的整体总结

大话设计模式通过2个人的对话,讲述了在软件设计中的23个重要的设计模式和6大开发原则在生活中的应用和思想升华的过程,其中的小菜也代表了对面向对象很“了解”但是却脱离了现实开发中各种束缚的入门编程人员,大鸟则代表了在软件开发行业方面有丰富经验,并且能在具体生活中运用的高级开发人才。新老人员之间的对话没有那么多的浮华和不切实际,一开口就是软件开发应该怎么怎么样的,都是从生活的平常角度来