没有数据,咋做分析?偷偷给你三大法宝! by彭文华

2024-02-06 01:50

本文主要是介绍没有数据,咋做分析?偷偷给你三大法宝! by彭文华,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这是彭文华的第166篇原创

有个朋友私信我,找我抱怨他的苦恼。他花了5位数报了一个数据分析班,分析思路、方法论学了一大堆,结果在公司用不上!原因是因为没有相应的数据!

他一边哭诉无良培训班,一边心疼自己的血汗钱。搞的我这也很尴尬,同理心瞬间爆发,直接代入到培训班老师角色了,各种安慰起来。聊天记录就不发了,太尬了!

不过事后一想,这事情不是这么简单的,我不是给培训班洗地哈,因为这个问题还真值得说一说。

今天是春节最后一天假期了,我这春节不打烊、每天发原创的挑战也算完成了,感谢各位陪着我,支持我。接下来我也得赶紧定下新公司,继续奋斗!欢迎加我个人微信:shirenpengwh,加入数据分析群,咱一起唠唠数据分析那点事。

从斗地主说起

也是,都说数据分析师能开启上帝视角,统揽全局,然后进行科学决策,最大程度的提升企业竞争力。

但是哥们说了,没数据你说个毛线啊!没数据,这上帝视角仿佛也被乌云给遮住了,只看个只言片语,咋分析啊!

不过,谁说不能掌握全局信息就不能科学决策了?

各位过年斗地主赢钱了吗?

我整个假期都在赶稿,可没功夫玩斗地主。但是不妨碍咱拿斗地主说事儿。你是不是觉得有些搞笑,斗地主跟数据分析、科学决策有啥关系啊?

这关系可大了去了!可以说斗地主就是一个非常经典的数据分析应用场景啊!

你看:每个人抓牌之后,只有17张牌,地主20张牌。每个人都并不掌握全局的信息。目标又很清晰,需要三方决战,己方获胜才行。

每个人能看到的信息只有手上的17张+3张底牌。也就是说每个人都是在信息不足的情况下进行决策,期望率先出完手中的牌,获得胜利。

新手打牌呢,基本上就看着手上的牌机械的对应出牌,能管上就管,管不上就过。

老手打牌呢,就会拓展所有信息来源,扩充自己的信息资源。仅凭已知的牌就能推断出非常多的信息。比如,手上17张牌,起码能判断出自己的断张牌,这些都能识别为风险;根据手上的王、2、A、K的张数,能推断出大牌的大致牌力分布;根据手上的3带、4炸的分布,可以确定其他二位的断张情况,从而推断其他人的牌型。比如你手上有3张或者4张7,再根据自己手上的牌,那基本上可以确定上下手的小牌大概率会比较零散。

除了这些之外,老手还会看地主、农民的位置,3张底牌也是很重要的信息。到现在,才是观察自己的牌型分布,找到牌权,确定控场策略,规划出牌战术。

这还不算完!因为以上这些,都是刚拿到牌的时候可以了解的信息。在上下家不断出牌的时候,老手会不断的收集新的信息,帮助他不断确定上下家手中的牌。甚至还会主动出手试探。比如你是地主,手上有1个2,就可以先出一个A试探2的具体分布。出2管你的大概率也是一个2,另外一方基本上就是一对2了;如果有人直接出小王管,那基本上可以肯定外面3个2在一起了。这时候如果手中有大的3带,就得找机会出,消耗掉对方的3个2。这样我们其他稍微小一些的牌就能拿到牌权了。

你可能会说,这不够精准啊,会猜错的。万一就是有人有2就是不管咋办?咱推测的前提是大家都是正常人哈,捣乱的不算,但是更不怕了。我看过不少精彩牌局,有经典牌局霸气到直接判定逃跑的一方手中只剩对4,炸完对方打牌后,打对4挑衅对方的场面。他们判定的真的非常精准。

当然,超强的记牌能力也是必不可少的。2020经典牌局第一名,打到最后,三个人手上只有一张2,其他全是7以下的小牌。就这还惊心动魄的来了三四个来回,最后拿2的稳若泰山,巍然不动,坚决不出2,逼地主出对3,放队友对4赢得比赛。

数据生崽术

所以,没数据咋办?咱学斗地主啊!你看,斗地主也是缺乏数据对吧?我们是怎么做的?

1、充分读懂手上的牌。怎么读?区分牌权、大牌、7/10等关键牌、断张。

2、结合角色、位置、手牌和底牌,推测其他角色手牌牌型分布;

3、结合自己的牌型、牌权、单张、角色和位置,规划出牌战术,如果是农民,需要确定主跑还是配合。

4、在后续出牌的时候,一方面要记关键牌,另一方面可以不断推测其他双方手中剩余的牌力牌型,然后针对性的进行拦截、攻击、引诱和试探。

咱把这些抽象一下,然后应用到数据分析领域上:

1、充分读懂已有数据。怎么读?给现有数据打标签,让数据生个崽儿;

2、结合市场动态、业务场景、参与方等信息,推测其他参与方信息,作出粗略判断;

3、结合自己已有的信息,规划运营策略;

4、布置运营策略监测指标,不断观察其他参与方(如客户)的反应,推测其根因,然后针对性的进行运营策略调整。

比如最简单的一个场景,咱拿到了一个这样的数据,数据量有几十万:

乍一看,信息量太小了,啥也没有。根本啥也代表不了么。我先给你一个法宝:数据生崽儿术。咱先给让数据生个崽儿。咋生?

打标签

所有的日期可以打标签吧?月末、月尾、工作日、星期、周末、节假日,这些都是常规的,弄个日期维全都有了。

所有的时点也可以打标签吧?出行的:早高峰、晚高峰;吃饭的:午饭、晚饭、夜宵高峰;人群活动的:上午、中午、下午、夜晚、深夜、凌晨等等。

所有的地区也可以打标签的吧?一二三四线城市、旅游、文化等等。

订单数也是可以分级分类的吧?小单量、中等单量、大单量、爆单等等。

其他参考数据

打标签这件事情咱可以想很多很多。但是这还不够!咱还可以找到一些引子,引出更多可以参考的数据。

比如我们有时间,是不是可以引出去年同期的数据?

去年的数据没有啊?那我们还有城市,可以引出城市相关的其他数据,常住人口、人均收入、GDP等数据。同时,我们还能引出该城市的行业数据。如果咱分析的是餐饮数据,那就可以看看商圈、餐饮分布、平均消费能力、口味偏好等数据;如果咱分析的是出行数据,那就可以看看职住情况、平均拥堵、平均路程消耗、私有车保有量、天气情况等等数据。

这些都是公开数据,也不需要你花多少时间,都能拿到手。

业务数据

咱除了这一张表格之外,是不是还能获取更多的相关的数据?一方面可以横向拓展,这是业务表现,是最终结果。往前是业务运营,各种活动的数据,再往前是客户运营等等。单从业务表现往下深挖,订单的前后环节(访问、加购、下单、付款、退款等),订单的构成(产品类目、客单价、渠道等)。

啥?你说没权限拿到业务数据?行。没问题,咱还有招!

业务反推术

数据现在变多了吧?啥?你说好像还是没啥分析思路?这里我得多问你一句,什么叫分析思路?是分析套路?分析模型?我认为都太片面了。我理解的分析思路是用数据抽象、整理出真实业务场景的路径。你看AARRR、客户生命周期、杜邦分析法、OSM模型等。

所以想要分析思路,咱得逆向从数据中反推出真实业务场景。当然,但从数据上并不能完全推断出来,所以我们还得用另外一个法宝:业务反推术。

我们从数据上能反推出一些,但是现有数据不够啊。所以我们还得继续获取信息。获取这些信息最好的方式就是找业务人员聊。

哥们说了:我这是在面试啊,没办法访谈业务人员咋办?放心,面试本质上就是一个沟通、谈判的过程。不是高考答题,不让你问问题。没有业务人员,你可问面试官。

KPI分析法

问那些呢?一个取巧的方案:KPI。KPI有非常多的好处,一方面体现了公司的发现方向,另一方面也会告诉你当前业务的核心点。因为没有那个傻子把KPI设置成跟业务没关系的指标上的。而且最关键的是这些KPI之间是有非常重要的关联关系,并且有评判标准!这是非常有价值的数据。我们不仅可以反推商业模型,甚至连业务流程都能梳理出来了!

业务流程分析法

当然如果是在面试,问KPI就没啥用了。我们可以直接问背景、业务目的、业务流程和其他业务特征。

然后再结合数据,就能反推出完整的商业模型、业务框架、业务逻辑了。

分析模型构造大法

可能你还是会说:我现在非常理解公司的业务,但还是没有分析思路啊。更不用说上面那个例子中的那些数据了。

怎么说呢?你说在第一个数据分析模型/思路出来之前,这世界上是咋编出来数据分析模型/思路的呢?

这不是废话呢么?当然是人想出来的啊!

对啊,你我都是人,我们怎么不能想出来思路呢?分析模型/思路越通用,在使用的时候就越不得劲啊!来,我来给你第三个法宝:分析模型构造大法!

代入业务流程

一些数据摆在具体的业务场景中,这含义就会非常清楚。所以有一大类数据分析思路其实就是业务流程式分析。AARRR、生命周期等都是。

横向对比

如果还想进一步分析,那就做横对比,时间层面同比、环比,看增长;地区层面同级别对比、区域性对比,看差异。其他维度同理。

纵向深入

按照MECE的原则,一步步纵向拆分指标数据。其实杜邦分析法、构成、下钻等分析方都是纵向深入的好工具。

业务重构

根据我们对业务的理解,进行解构、重组,最后抽象出来,就有了各种业务分析套路,比如人货场、三流、OSM等等。只要业务理解深,抽象手段熟练,模型思路要多少有多少。

总结

完美的上帝视角是不存在的。因此数据分析永远是在缺少信息的情况下不断逼近真实情况,做出精准决策的过程。

斗地主其实就是一个非常典型的数据分析应用场景,同样没有完美的上帝视角,同样缺少信息,但是又得做出精准的判断。新手打牌只会看手中的牌,老手不但会分析手牌,还会看位置、角色,从而规划自己的战术,还会不断被动、主动收集各种信息,进行准确判断,不断修正出牌策略,最终获得胜利。

我们做数据分析也是一样一样的,用“数据生崽儿术”拓展更多数据,可以用打标签、获取参考数据和业务数据等方法;

再用“业务反推术”不断逼近真实业务场景,可以使用KPI分析法、业务流程分析法等方法;

最后用“分析模型构造法”建立分析思路,提炼对应策略,有代入业务流程、横向对比、纵向深入、业务重构等具体手段。

这些招数一用,再少点数据,我们也能说出个12345来,不信你试试?

集“在看”了!本推文集满30个“在看”,就在群里发大红包!

今天的分享就是这样。欢迎大家加我个人微信号:shirenpengwh ,一起探讨大数据、数据分析相关知识。每天分享一篇原创内容给大家,我们一起学习,共同进步。

配合以下文章享受更佳

热文 | 如何搭建一个数据分析体系

下载 | 大数据职业发展体系全解

干货 | 什么才叫做懂业务?分析的5个层次

思考 | 为什么说你的运营团队一定要有一名女生?

干货 | 月薪3000和30000的数据分析师差在哪?

我需要你的转发,小小的满足一下我的虚荣心

这篇关于没有数据,咋做分析?偷偷给你三大法宝! by彭文华的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/682825

相关文章

Go标准库常见错误分析和解决办法

《Go标准库常见错误分析和解决办法》Go语言的标准库为开发者提供了丰富且高效的工具,涵盖了从网络编程到文件操作等各个方面,然而,标准库虽好,使用不当却可能适得其反,正所谓工欲善其事,必先利其器,本文将... 目录1. 使用了错误的time.Duration2. time.After导致的内存泄漏3. jsO

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

Spring事务中@Transactional注解不生效的原因分析与解决

《Spring事务中@Transactional注解不生效的原因分析与解决》在Spring框架中,@Transactional注解是管理数据库事务的核心方式,本文将深入分析事务自调用的底层原理,解释为... 目录1. 引言2. 事务自调用问题重现2.1 示例代码2.2 问题现象3. 为什么事务自调用会失效3

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

找不到Anaconda prompt终端的原因分析及解决方案

《找不到Anacondaprompt终端的原因分析及解决方案》因为anaconda还没有初始化,在安装anaconda的过程中,有一行是否要添加anaconda到菜单目录中,由于没有勾选,导致没有菜... 目录问题原因问http://www.chinasem.cn题解决安装了 Anaconda 却找不到 An

Spring定时任务只执行一次的原因分析与解决方案

《Spring定时任务只执行一次的原因分析与解决方案》在使用Spring的@Scheduled定时任务时,你是否遇到过任务只执行一次,后续不再触发的情况?这种情况可能由多种原因导致,如未启用调度、线程... 目录1. 问题背景2. Spring定时任务的基本用法3. 为什么定时任务只执行一次?3.1 未启用

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个