什么是数据分析?数据分析概念如何推演?

2024-06-04 00:48
文章标签 概念 数据分析 推演

本文主要是介绍什么是数据分析?数据分析概念如何推演?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

什么是数据分析?

如何从概念去推演什么是数据分析,数据分析的本质是什么?

1.推演目的

  • 迷迷糊糊,每天都在做这件事,而没有去思考这件事件背后的定义和本质,走了很远的路,忘记了当初为什么出发,自己已经习惯性往前冲,忘记了为何而冲,为何而生,呜呼哀哉;生活如此,工作亦如此;
  • 不掌握分析本质,怎么样努力业务也是徒劳,原来人家指定的路,开始是一条阳光大道,但是慢慢经过演变,已经变成了崎岖野径;自己不知晓;
  • 模型是抽象后的结果,特别在工作中,如何做到分析后进行抽象、再进行二次抽象?这一个命题,这里面的方法论是什么?这里面其实个人没有很好的认知;

2.推演结论

  • 数据有可能没有真实反应事物包含的信息,要批判性选择和相信数据;
  • 数据分析的前置条件是需要有分析的目的,然后去找到有用的信息;分析的目的和最后找到的有用信息,在实际过程中,平台层很难发现和定位;

3.推演方法

  • 第一步使用拆解字和国内外的方法
  • 第二步使用Java的描述方式,去描述这个定义
  • 第三尝试抽象,看能不能产出一些新东西

3.推演过程~个人感觉是领域建模的过程

  • 数据的定义:

    • 数的定义:是一种图形符号,是表示自然界物质现象的一种方法。
    • 据的定义:按照;依据
    • wikipedia:Data are characteristics or information, usually numerical, that are collected through observation;
    • 百度百科:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合;
    • 我的定义:数据是是用来描述客观事物信息的符号,通过观察来描述的,这些信息可能是客观事物的性质、状态或者事物间关系;
      - 数据具有是通过一定的视角和方式来描述;
      - 数据不能完全代表事物本身;
    • Java 描述
        class Data{List<Object> lists ; //事物Information info;   //代表的信息Dimension  dimension;      //描述维度Method methon ;// 描述方法}
      
  • 分析定义

    • 分的定义:构成事物的不同的物质或因素;
    • 析 :其古字形像用斧子伐木,本义指劈开木头,引申指分开、离散。引申表示对事物进行解释和说明;
      - 斤:此字初文见于商代甲骨文,产生时间可能更早,其古字形像曲柄的斧头,斤的本义就是这一类的木工工具 ;
    • wikipedia:Analysis is the process of breaking a complex topic or substance into smaller parts in order to gain a better understanding of it;
    • 汉典: 将事物、现象、概念分门别类,离析出本质及其内在联系。反义词是:归纳﹑综合
    • 我的定义:分析目的是为了更好了解事物,它是一个过程,在这个过程中需要将事物、现象、概念分门别类,然后找到事物的信息(本质或者内在联系);
    • Java 描述
    class Analysis{List<Object> lists ; //事物Object  aim; //目标Information info;//获得信息Array<Method>  process;// 使用的方法和步骤}
    
  • 数据分析的定义

    • wikipedia:Data analysis is a process of inspecting, cleansing, transforming and modeling data with the goal of discovering useful information, informing conclusions and supporting decision-making;
    • 百度百科:数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程;
    • 我的定义:数据分析是一个过程,目前是为了去发现有用的信息(例如增长见闻的报告)然后去支持决策,这个过程中可能会对数据进行处理(比如:检查、清洗、转换、建模和统计分析);
    • Java 描述
    class DataAnalysis
    {List<Data> lists ; //事物Decision  aim; //需要支持的决策Information usefulInfo;//获得有用信息  Array<Method>  process;// 使用的方法和步骤
    } 
    
  • 模型的定义

    • wikipedia:a model is an informative representation of an object, person or system.
    • MBA智库:是对某个实际问题或者客观事物、规律进行抽象后一种形式化表达方式;
    • 我比较趋向于是:是对某个实际问题或者客观事物、规律进行抽象后一种形式化表达方式;
      • 比如对思维过程的抽象,就可以抽象为一个模型;
      • 对一个公司的提炼,也可以叫做一个模型;
      • 只要抽象化过后,使用形式化的表达,都可以叫做模型?好高大上啊?
      class Modeal{List<Object> lists ; //事物AbstractMethod  abm; //抽象方法Information info;//形式化的表达方式
      }
  • 抽象的定义:

    • “抽”就是抽离,“象”就是具象,字面上理解抽象,就是从具体中抽离出来

    • 英文的抽象——abstract来自拉丁文abstractio,它的原意是排除、抽出

    • 按照Wikipedia上的解释,抽象是指为了某种目的,对一个概念或一种现象包含的信息进行过滤,移除不相关的信息,只保留与某种最终目的相关的信息。例如,一个 皮质的足球 ,我们可以过滤它的质料等信息,得到更一般性的概念,也就是 球 。从另外一个角度看,抽象就是简化事物,抓住事物本质的过程。

    • 阿里云的一位工程师是如何理解抽象的:

      • https://developer.aliyun.com/article/714128
    • 我的理解:

      • 抽象是有目的的
      • 抽象是有对象的
      • 抽象是有过程的,比如过滤
      • 抽象最后的最终的结果的
    • 抽象的作用:我要习惯去抽象,然后去关联抽象,获得新的认知;

    • 抽象的方法
      - 归类分组,找到共性的地方
      - 提升抽象层次,如果第一个行不通,提升抽象层次金字塔结构

    • 金字塔结构

      • 书里说我们要自下而上的思考,总结概括;自上而下的表达,结论先行
    • 如何提升我们的抽象能力

      • 多阅读
      • 多总结和反思
      • 还有一个非常好的提升抽象能力的手段——领域建模
    • java 描述抽象

    class Abstract
    {List<Object> lists ; //单个、一组概念或者现象Aim  aim; //目的AbstractMethod  abm; //方法,比如过滤,比如尝试Information info;// 最后的结果,可能是一个符号,可能是一段文字(模型、定律)
    }
    

这篇关于什么是数据分析?数据分析概念如何推演?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1028593

相关文章

【VUE】跨域问题的概念,以及解决方法。

目录 1.跨域概念 2.解决方法 2.1 配置网络请求代理 2.2 使用@CrossOrigin 注解 2.3 通过配置文件实现跨域 2.4 添加 CorsWebFilter 来解决跨域问题 1.跨域概念 跨域问题是由于浏览器实施了同源策略,该策略要求请求的域名、协议和端口必须与提供资源的服务相同。如果不相同,则需要服务器显式地允许这种跨域请求。一般在springbo

【MRI基础】TR 和 TE 时间概念

重复时间 (TR) 磁共振成像 (MRI) 中的 TR(重复时间,repetition time)是施加于同一切片的连续脉冲序列之间的时间间隔。具体而言,TR 是施加一个 RF(射频)脉冲与施加下一个 RF 脉冲之间的持续时间。TR 以毫秒 (ms) 为单位,主要控制后续脉冲之前的纵向弛豫程度(T1 弛豫),使其成为显著影响 MRI 中的图像对比度和信号特性的重要参数。 回声时间 (TE)

Python:豆瓣电影商业数据分析-爬取全数据【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】

**爬取豆瓣电影信息,分析近年电影行业的发展情况** 本文是完整的数据分析展现,代码有完整版,包含豆瓣电影爬取的具体方式【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】   最近MBA在学习《商业数据分析》,大实训作业给了数据要进行数据分析,所以先拿豆瓣电影练练手,网络上爬取豆瓣电影TOP250较多,但对于豆瓣电影全数据的爬取教程很少,所以我自己做一版。 目

计算机网络基础概念 交换机、路由器、网关、TBOX

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、VLAN是什么?二 、交换机三、路由器四、网关五、TBOXTelematics BOX,简称车载T-BOX,车联网系统包含四部分,主机、车载T-BOX、手机APP及后台系统。主机主要用于车内的影音娱乐,以及车辆信息显示;车载T-BOX主要用于和后台系统/手机APP通信,实现手机APP的车辆信息显示与控

01 Docker概念和部署

目录 1.1 Docker 概述 1.1.1 Docker 的优势 1.1.2 镜像 1.1.3 容器 1.1.4 仓库 1.2 安装 Docker 1.2.1 配置和安装依赖环境 1.3镜像操作 1.3.1 搜索镜像 1.3.2 获取镜像 1.3.3 查看镜像 1.3.4 给镜像重命名 1.3.5 存储,载入镜像和删除镜像 1.4 Doecker容器操作 1.4

【机器学习-一-基础概念篇】

机器学习 定义分类算法 应用 定义 机器学习最早是被Arthur Samuel 提出的一个概念,指计算机无需明确编程即可学习的研究领域。1950年他发明的跳棋程序,这个人机对弈游戏让他的声名鹊起,机器学习这个概念才进入大众的是视线。 在这个跳棋程序里,他编程了一种算法,这个程序与Arthur下了数万次跳棋,计算机逐渐学会了下在哪里有更大的可能会赢得比赛,哪里会输,通过这种方法,最

【吊打面试官系列-Redis面试题】说说 Redis 哈希槽的概念?

大家好,我是锋哥。今天分享关于 【说说 Redis 哈希槽的概念?】面试题,希望对大家有帮助; 说说 Redis 哈希槽的概念? Redis 集群没有使用一致性 hash,而是引入了哈希槽的概念,Redis 集群有 16384 个哈希槽,每个 key 通过 CRC16 校验后对 16384 取模来决定放置哪个槽, 集群的每个节点负责一部分 hash 槽。

AI辅助编程里的 Atom Group 的概念和使用

背景 在我们实际的开发当中,一个需求往往会涉及到多个文件修改,而需求也往往有相似性。 举个例子,我经常需要在 auto-coder中需要添加命令行参数,通常是这样的: /coding 添加一个新的命令行参数 --chat_model 默认值为空 实际上这个需求涉及到以下文件列表: /Users/allwefantasy/projects/auto-coder/src/autocoder/auto

读软件设计的要素04概念的关系

1. 概念的关系 1.1. 概念是独立的,彼此间无须相互依赖 1.1.1. 一个概念是应该独立地被理解、设计和实现的 1.1.2. 独立性是概念的简单性和可重用性的关键 1.2. 软件存在依赖性 1.2.1. 不是说一个概念需要依赖另一个概念才能正确运行 1.2.2. 只有当一个概念存在时,包含另一个概念才有意义 1.3. 概念依赖关系图简要概括了软件的概念和概念存在的理

win7下安装Canopy(EPD) 及 Pandas进行python数据分析

先安装好canopy,具体安装版本看自己需要那种,我本来是打算安装win764位的,却发现下载总是出现错误,无奈只能下载了32位的! https://store.enthought.com/downloads/#default 安装好之后,参考如下连接,进行检验: 之后再根据下面提供的连接进行操作,一般是没问题的! http://jingyan.baidu.com/article/5d6