像做菜一样简单的数据分析

2023-10-12 15:59
文章标签 简单 数据分析 做菜

本文主要是介绍像做菜一样简单的数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

    

公众号后台回复“图书“,了解更多号主新书内容

 作者:Rain0808

 来源:DS数据科学之美

一、写在前面

    

    大概有几个星期没有更新文章了, 一直没有很长的完整时间可以静下心来 写数据分析的方法论系列文章,还有 excel 数据分析等等, 我一直觉得不单单人人都是产品经理, 其实人人都是数据分析师.

    假如你是还在为前途茫茫担忧不知道做什么, 假如你是一线城市 面试屡屡碰壁, 假如你对现在的工作很不满意, 假如你想要转行, 无论你是学什么专业的, 请相信数据分析都是一个可以很快可以让你在一个城市立足, 同时看到未来希望的职业。

   为什么呢?

    因为每个人都会做菜吧, 因为数据分析和做菜一样简单。

   

二、从做菜中说起什么是数据分析

    我们每天在做菜的时候, 其实再每次想着怎么样做的更好吃的时候, 就是一次数据分析的过程, 不断的根据自己的经验对选料, 调味, 摆盘, 制作工序等进行调整, 慢慢的从黑暗料理到神仙料理的过渡

    那么, 到底什么是数据分析呢,  正经的解释就像下面那样, 其实说白了, 就是 数据分析 = 数据 + 分析。

    首先我们要知道我们要解决的问题是什么, 然后就想我们这些问题大概需要那些数据, 然后再去寻找对应的数据, 然后根据专业的分析方法, 分析出结论可以解决问题, 这就是一个数据分析的过程

三、从做菜的工序聊聊数据分析完整流程

    在《向往的生活》, 黄磊老师的炸牛奶 可谓是深入人心, 颜值与味道齐飞, 牛奶共盘子一色。

    

    辣么我们在重温炸牛奶中 领悟一下  数据分析的完整流程吧

    1.首先是目标: 以炸牛奶为例, 我们的分析目标就是我们怎么通过调整配方和工艺, 让我们的炸牛奶 好吃到飞起, 这就跟数据分析一样, 每一个数据分析的最开始都是有一个分析的目标, 后续所有的分析都是围绕这个目标开展的

    2. 准备分析数据: 像炸牛奶的材料一样, 我们要分析出结论, 就需要提前准备好对应的数据, 我们在炸牛奶之前, 会通过网上的各种美食博主去查询对应的材料准备,  相对应的 我们也会通过大量的 相同的分析case 去了解大概需要哪些数据, 保证数据的完整性。

    从材料中我们可以看出每一种材料我们都加了计量单位, 这在数据分析中是非常重要的, 除了需要知道准备哪些数据, 还需要知道准备数据的维度, 比如我们分析微信表情发送是否下降, 我们选取多长时间周期的数据, 太短了就会受到时间波动的影响, 太长了就浪费数据了

    就跟材料的数量多少很影响最后的成功率, 我们选取的数据如果时间周期没有选取完整 或者其他维度选取不完整, 是会影响到最后的分析的

    3. 分析过程

    准备好了材料, 我们就可以开始我们炸牛奶制作啦, 500g 牛奶+50g 白砂糖 +50g 玉米淀粉, 搅拌均匀, 数据也是一样的,我们要把不同的数据进行组合

    比如我们有表情的发送用户, 和这部分用户的年龄 性别 好友进行组合就可以得到: 不同年龄的发送次数, 不同好友数的发送次数等, 还可以进行多个数据的组合 比如 不同年龄 不同好友数 下的发送次数。

   

    我们就可以分析出 oh 是不是随着好友数的增加, 发送表情的次数也会随之增加, 还是说人的精力是有限的, 随着好友数的增多, 能发表情的都固定是那一波人。

    搅拌好以后, 将搅拌好的奶糊倒入到平底锅中搅拌, 一定要搅拌均匀后开小火, 继续搅拌, 这里一定是要小火, 不然底部容易焦, 这里也是数据分析需要借鉴的地方, 要有足够的耐心的去慢慢挖掘

    然后把奶糊倒入冰箱中冷藏四个小时, 让它定型, 因为需要定型就需要放入冰箱, 对于数据分析来说, 要得到某个结论有对应的固定的分析方法。

    比如分析用户在打开 面板发送表情的转化率, 我们就会利用漏斗分析的方法, 先计算打开面板 有多少人, 点击表情发送了有多少人, 最后成功发送的有多少人

    分析用户发送表情下降了, 我们会通过维度下钻分析法, 拆分不同的年龄, 性别,  地域, 不同活跃度。

    我们就可以得到结论: 是小学生发送下降了还是大学生发送下降了

                                    是一线城市下降了还是二线城市下降了

                                   是男的发送下降了还是女的下降了

                                    是有多少个好友的用户发送下降了

                                    是高活跃下降了还是低活跃下降了

    分析发送表情的用户特征 我们会通过 用户画像法,  我们就得到 发送表情的用户主要是 : 18-24岁年轻人  一线城市  好友数较多  朋友圈活跃 聊天活跃等等  这些就是用户画像法

    

    

    将定型后的奶糊进行切块裹上鸡蛋液和面包糠, 鸡蛋液是否需要加糖加多少糖, 我们可以对比加不同的糖以及是否加糖以后最后的口味对比。

    就像数据分析一样, 我们想要知道用户的年龄是否是 会影响他发表情的 活跃度, 那我们就会对比这个用户 在他年龄增加的时候和他过去的发表情的活跃度进行对比。

    这也是数据分析过程中经常用到的叫 多维分析+ 对比分析,多维分析就是会拆多个维度, 对比分析是会把这些维度都跟指标联系在一起进行对比,。

    比如上周每一天 和这周每一天(时间维度) + 下载表情次数(指标)差异, 又比如不同好友数+ 设备(好友维度和设备维度)+ 进入商店的次数(指标) 差异, 维度和指标都可以无限扩展和无限组合。


    放入油锅中炸到金黄, 捞出放入盘中, Q 弹 Q弹的, 好吃到弹起, 这也就是我们已经做好前面利用专门的数据分析方法去分析出结论, 然后输出结论总结如下hhh

   4. 结论呈现

    就像炸牛奶 需要一个好的摆盘呈现, 我们数据分析的结论也需要一个好的结果呈现形式, 一般来说我们都是利用图表去表达我们的分析结论。

    当观众还没有吃到你的炸牛奶的时候只能通过外观摆盘去判断, 同样的道理, 如果没有一个好的呈现的形式, 每一个看到你的数据分析的报告可能没有了解下去的动力, 同时可能也不能清晰的指导你在分析什么。

四、写在最后

    假如你正在学做菜 那一起来学数据分析把, 假如你在学习数据分析没有头绪, 不防停下来学学做菜, 从每一道菜中沉淀数据分析的精髓。

    

◆ ◆ ◆  ◆ ◆
麟哥新书已经在京东上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行400-240活动,大家可以用相当于原价4折的预购价格购买,还是非常划算的,扫描下方小程序即可进入购买页面:
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。管理员二维码:猜你喜欢● 麟哥拼了!!!亲自出镜推荐自己新书《数据分析师求职面试指南》● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗

这篇关于像做菜一样简单的数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/196939

相关文章

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu2289(简单二分)

虽说是简单二分,但是我还是wa死了  题意:已知圆台的体积,求高度 首先要知道圆台体积怎么求:设上下底的半径分别为r1,r2,高为h,V = PI*(r1*r1+r1*r2+r2*r2)*h/3 然后以h进行二分 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#includ

usaco 1.3 Prime Cryptarithm(简单哈希表暴搜剪枝)

思路: 1. 用一个 hash[ ] 数组存放输入的数字,令 hash[ tmp ]=1 。 2. 一个自定义函数 check( ) ,检查各位是否为输入的数字。 3. 暴搜。第一行数从 100到999,第二行数从 10到99。 4. 剪枝。 代码: /*ID: who jayLANG: C++TASK: crypt1*/#include<stdio.h>bool h

uva 10387 Billiard(简单几何)

题意是一个球从矩形的中点出发,告诉你小球与矩形两条边的碰撞次数与小球回到原点的时间,求小球出发时的角度和小球的速度。 简单的几何问题,小球每与竖边碰撞一次,向右扩展一个相同的矩形;每与横边碰撞一次,向上扩展一个相同的矩形。 可以发现,扩展矩形的路径和在当前矩形中的每一段路径相同,当小球回到出发点时,一条直线的路径刚好经过最后一个扩展矩形的中心点。 最后扩展的路径和横边竖边恰好组成一个直

poj 1113 凸包+简单几何计算

题意: 给N个平面上的点,现在要在离点外L米处建城墙,使得城墙把所有点都包含进去且城墙的长度最短。 解析: 韬哥出的某次训练赛上A出的第一道计算几何,算是大水题吧。 用convexhull算法把凸包求出来,然后加加减减就A了。 计算见下图: 好久没玩画图了啊好开心。 代码: #include <iostream>#include <cstdio>#inclu

uva 10130 简单背包

题意: 背包和 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <stack>#include <vector>#include <queue>#include <map>

JAVA用最简单的方法来构建一个高可用的服务端,提升系统可用性

一、什么是提升系统的高可用性 JAVA服务端,顾名思义就是23体验网为用户提供服务的。停工时间,就是不能向用户提供服务的时间。高可用,就是系统具有高度可用性,尽量减少停工时间。如何用最简单的方法来搭建一个高效率可用的服务端JAVA呢? 停工的原因一般有: 服务器故障。例如服务器宕机,服务器网络出现问题,机房或者机架出现问题等;访问量急剧上升,导致服务器压力过大导致访问量急剧上升的原因;时间和

简单的角色响应鼠标而移动

actor类 //处理移动距离,核心是找到角色坐标在世界坐标的向量的投影(x,y,z),然后在世界坐标中合成,此CC是在地面行走,所以Y轴投影始终置为0; using UnityEngine; using System.Collections; public class actor : MonoBehaviour { public float speed=0.1f; CharacterCo

Python:豆瓣电影商业数据分析-爬取全数据【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】

**爬取豆瓣电影信息,分析近年电影行业的发展情况** 本文是完整的数据分析展现,代码有完整版,包含豆瓣电影爬取的具体方式【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】   最近MBA在学习《商业数据分析》,大实训作业给了数据要进行数据分析,所以先拿豆瓣电影练练手,网络上爬取豆瓣电影TOP250较多,但对于豆瓣电影全数据的爬取教程很少,所以我自己做一版。 目

docker-compose安装和简单使用

本文介绍docker-compose的安装和使用 新版docker已经默认安装了docker-compose 可以使用docker-compose -v 查看docker-compose版本 如果没有的话可以使用以下命令直接安装 sudo curl -L https://github.com/docker/compose/releases/download/1.16.1/docker-c