没有数据,咋做分析?偷偷给你三大法宝! by彭文华

2024-02-06 01:50

本文主要是介绍没有数据,咋做分析?偷偷给你三大法宝! by彭文华,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这是彭文华的第166篇原创

有个朋友私信我,找我抱怨他的苦恼。他花了5位数报了一个数据分析班,分析思路、方法论学了一大堆,结果在公司用不上!原因是因为没有相应的数据!

他一边哭诉无良培训班,一边心疼自己的血汗钱。搞的我这也很尴尬,同理心瞬间爆发,直接代入到培训班老师角色了,各种安慰起来。聊天记录就不发了,太尬了!

不过事后一想,这事情不是这么简单的,我不是给培训班洗地哈,因为这个问题还真值得说一说。

今天是春节最后一天假期了,我这春节不打烊、每天发原创的挑战也算完成了,感谢各位陪着我,支持我。接下来我也得赶紧定下新公司,继续奋斗!欢迎加我个人微信:shirenpengwh,加入数据分析群,咱一起唠唠数据分析那点事。

从斗地主说起

也是,都说数据分析师能开启上帝视角,统揽全局,然后进行科学决策,最大程度的提升企业竞争力。

但是哥们说了,没数据你说个毛线啊!没数据,这上帝视角仿佛也被乌云给遮住了,只看个只言片语,咋分析啊!

不过,谁说不能掌握全局信息就不能科学决策了?

各位过年斗地主赢钱了吗?

我整个假期都在赶稿,可没功夫玩斗地主。但是不妨碍咱拿斗地主说事儿。你是不是觉得有些搞笑,斗地主跟数据分析、科学决策有啥关系啊?

这关系可大了去了!可以说斗地主就是一个非常经典的数据分析应用场景啊!

你看:每个人抓牌之后,只有17张牌,地主20张牌。每个人都并不掌握全局的信息。目标又很清晰,需要三方决战,己方获胜才行。

每个人能看到的信息只有手上的17张+3张底牌。也就是说每个人都是在信息不足的情况下进行决策,期望率先出完手中的牌,获得胜利。

新手打牌呢,基本上就看着手上的牌机械的对应出牌,能管上就管,管不上就过。

老手打牌呢,就会拓展所有信息来源,扩充自己的信息资源。仅凭已知的牌就能推断出非常多的信息。比如,手上17张牌,起码能判断出自己的断张牌,这些都能识别为风险;根据手上的王、2、A、K的张数,能推断出大牌的大致牌力分布;根据手上的3带、4炸的分布,可以确定其他二位的断张情况,从而推断其他人的牌型。比如你手上有3张或者4张7,再根据自己手上的牌,那基本上可以确定上下手的小牌大概率会比较零散。

除了这些之外,老手还会看地主、农民的位置,3张底牌也是很重要的信息。到现在,才是观察自己的牌型分布,找到牌权,确定控场策略,规划出牌战术。

这还不算完!因为以上这些,都是刚拿到牌的时候可以了解的信息。在上下家不断出牌的时候,老手会不断的收集新的信息,帮助他不断确定上下家手中的牌。甚至还会主动出手试探。比如你是地主,手上有1个2,就可以先出一个A试探2的具体分布。出2管你的大概率也是一个2,另外一方基本上就是一对2了;如果有人直接出小王管,那基本上可以肯定外面3个2在一起了。这时候如果手中有大的3带,就得找机会出,消耗掉对方的3个2。这样我们其他稍微小一些的牌就能拿到牌权了。

你可能会说,这不够精准啊,会猜错的。万一就是有人有2就是不管咋办?咱推测的前提是大家都是正常人哈,捣乱的不算,但是更不怕了。我看过不少精彩牌局,有经典牌局霸气到直接判定逃跑的一方手中只剩对4,炸完对方打牌后,打对4挑衅对方的场面。他们判定的真的非常精准。

当然,超强的记牌能力也是必不可少的。2020经典牌局第一名,打到最后,三个人手上只有一张2,其他全是7以下的小牌。就这还惊心动魄的来了三四个来回,最后拿2的稳若泰山,巍然不动,坚决不出2,逼地主出对3,放队友对4赢得比赛。

数据生崽术

所以,没数据咋办?咱学斗地主啊!你看,斗地主也是缺乏数据对吧?我们是怎么做的?

1、充分读懂手上的牌。怎么读?区分牌权、大牌、7/10等关键牌、断张。

2、结合角色、位置、手牌和底牌,推测其他角色手牌牌型分布;

3、结合自己的牌型、牌权、单张、角色和位置,规划出牌战术,如果是农民,需要确定主跑还是配合。

4、在后续出牌的时候,一方面要记关键牌,另一方面可以不断推测其他双方手中剩余的牌力牌型,然后针对性的进行拦截、攻击、引诱和试探。

咱把这些抽象一下,然后应用到数据分析领域上:

1、充分读懂已有数据。怎么读?给现有数据打标签,让数据生个崽儿;

2、结合市场动态、业务场景、参与方等信息,推测其他参与方信息,作出粗略判断;

3、结合自己已有的信息,规划运营策略;

4、布置运营策略监测指标,不断观察其他参与方(如客户)的反应,推测其根因,然后针对性的进行运营策略调整。

比如最简单的一个场景,咱拿到了一个这样的数据,数据量有几十万:

乍一看,信息量太小了,啥也没有。根本啥也代表不了么。我先给你一个法宝:数据生崽儿术。咱先给让数据生个崽儿。咋生?

打标签

所有的日期可以打标签吧?月末、月尾、工作日、星期、周末、节假日,这些都是常规的,弄个日期维全都有了。

所有的时点也可以打标签吧?出行的:早高峰、晚高峰;吃饭的:午饭、晚饭、夜宵高峰;人群活动的:上午、中午、下午、夜晚、深夜、凌晨等等。

所有的地区也可以打标签的吧?一二三四线城市、旅游、文化等等。

订单数也是可以分级分类的吧?小单量、中等单量、大单量、爆单等等。

其他参考数据

打标签这件事情咱可以想很多很多。但是这还不够!咱还可以找到一些引子,引出更多可以参考的数据。

比如我们有时间,是不是可以引出去年同期的数据?

去年的数据没有啊?那我们还有城市,可以引出城市相关的其他数据,常住人口、人均收入、GDP等数据。同时,我们还能引出该城市的行业数据。如果咱分析的是餐饮数据,那就可以看看商圈、餐饮分布、平均消费能力、口味偏好等数据;如果咱分析的是出行数据,那就可以看看职住情况、平均拥堵、平均路程消耗、私有车保有量、天气情况等等数据。

这些都是公开数据,也不需要你花多少时间,都能拿到手。

业务数据

咱除了这一张表格之外,是不是还能获取更多的相关的数据?一方面可以横向拓展,这是业务表现,是最终结果。往前是业务运营,各种活动的数据,再往前是客户运营等等。单从业务表现往下深挖,订单的前后环节(访问、加购、下单、付款、退款等),订单的构成(产品类目、客单价、渠道等)。

啥?你说没权限拿到业务数据?行。没问题,咱还有招!

业务反推术

数据现在变多了吧?啥?你说好像还是没啥分析思路?这里我得多问你一句,什么叫分析思路?是分析套路?分析模型?我认为都太片面了。我理解的分析思路是用数据抽象、整理出真实业务场景的路径。你看AARRR、客户生命周期、杜邦分析法、OSM模型等。

所以想要分析思路,咱得逆向从数据中反推出真实业务场景。当然,但从数据上并不能完全推断出来,所以我们还得用另外一个法宝:业务反推术。

我们从数据上能反推出一些,但是现有数据不够啊。所以我们还得继续获取信息。获取这些信息最好的方式就是找业务人员聊。

哥们说了:我这是在面试啊,没办法访谈业务人员咋办?放心,面试本质上就是一个沟通、谈判的过程。不是高考答题,不让你问问题。没有业务人员,你可问面试官。

KPI分析法

问那些呢?一个取巧的方案:KPI。KPI有非常多的好处,一方面体现了公司的发现方向,另一方面也会告诉你当前业务的核心点。因为没有那个傻子把KPI设置成跟业务没关系的指标上的。而且最关键的是这些KPI之间是有非常重要的关联关系,并且有评判标准!这是非常有价值的数据。我们不仅可以反推商业模型,甚至连业务流程都能梳理出来了!

业务流程分析法

当然如果是在面试,问KPI就没啥用了。我们可以直接问背景、业务目的、业务流程和其他业务特征。

然后再结合数据,就能反推出完整的商业模型、业务框架、业务逻辑了。

分析模型构造大法

可能你还是会说:我现在非常理解公司的业务,但还是没有分析思路啊。更不用说上面那个例子中的那些数据了。

怎么说呢?你说在第一个数据分析模型/思路出来之前,这世界上是咋编出来数据分析模型/思路的呢?

这不是废话呢么?当然是人想出来的啊!

对啊,你我都是人,我们怎么不能想出来思路呢?分析模型/思路越通用,在使用的时候就越不得劲啊!来,我来给你第三个法宝:分析模型构造大法!

代入业务流程

一些数据摆在具体的业务场景中,这含义就会非常清楚。所以有一大类数据分析思路其实就是业务流程式分析。AARRR、生命周期等都是。

横向对比

如果还想进一步分析,那就做横对比,时间层面同比、环比,看增长;地区层面同级别对比、区域性对比,看差异。其他维度同理。

纵向深入

按照MECE的原则,一步步纵向拆分指标数据。其实杜邦分析法、构成、下钻等分析方都是纵向深入的好工具。

业务重构

根据我们对业务的理解,进行解构、重组,最后抽象出来,就有了各种业务分析套路,比如人货场、三流、OSM等等。只要业务理解深,抽象手段熟练,模型思路要多少有多少。

总结

完美的上帝视角是不存在的。因此数据分析永远是在缺少信息的情况下不断逼近真实情况,做出精准决策的过程。

斗地主其实就是一个非常典型的数据分析应用场景,同样没有完美的上帝视角,同样缺少信息,但是又得做出精准的判断。新手打牌只会看手中的牌,老手不但会分析手牌,还会看位置、角色,从而规划自己的战术,还会不断被动、主动收集各种信息,进行准确判断,不断修正出牌策略,最终获得胜利。

我们做数据分析也是一样一样的,用“数据生崽儿术”拓展更多数据,可以用打标签、获取参考数据和业务数据等方法;

再用“业务反推术”不断逼近真实业务场景,可以使用KPI分析法、业务流程分析法等方法;

最后用“分析模型构造法”建立分析思路,提炼对应策略,有代入业务流程、横向对比、纵向深入、业务重构等具体手段。

这些招数一用,再少点数据,我们也能说出个12345来,不信你试试?

集“在看”了!本推文集满30个“在看”,就在群里发大红包!

今天的分享就是这样。欢迎大家加我个人微信号:shirenpengwh ,一起探讨大数据、数据分析相关知识。每天分享一篇原创内容给大家,我们一起学习,共同进步。

配合以下文章享受更佳

热文 | 如何搭建一个数据分析体系

下载 | 大数据职业发展体系全解

干货 | 什么才叫做懂业务?分析的5个层次

思考 | 为什么说你的运营团队一定要有一名女生?

干货 | 月薪3000和30000的数据分析师差在哪?

我需要你的转发,小小的满足一下我的虚荣心

这篇关于没有数据,咋做分析?偷偷给你三大法宝! by彭文华的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/682825

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

豆包 MarsCode 不允许你还没有女朋友

在这个喧嚣的世界里,爱意需要被温柔地唤醒。为心爱的她制作每日一句小工具,就像是一场永不落幕的浪漫仪式,每天都在她的心田播撒爱的种子,让她的每一天都充满甜蜜与期待。 背景 在这个瞬息万变的时代,我们都在寻找那些能让我们慢下来,感受生活美好的瞬间。为了让这份浪漫持久而深刻,我们决定为女朋友定制一个每日一句小工具。这个工具会在她意想不到的时刻,为她呈现一句充满爱意的话语,让她的每一天都充满惊喜和感动

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X