像做菜一样简单的数据分析

2023-10-12 15:59
文章标签 简单 数据分析 做菜

本文主要是介绍像做菜一样简单的数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

    

公众号后台回复“图书“,了解更多号主新书内容

 作者:Rain0808

 来源:DS数据科学之美

一、写在前面

    

    大概有几个星期没有更新文章了, 一直没有很长的完整时间可以静下心来 写数据分析的方法论系列文章,还有 excel 数据分析等等, 我一直觉得不单单人人都是产品经理, 其实人人都是数据分析师.

    假如你是还在为前途茫茫担忧不知道做什么, 假如你是一线城市 面试屡屡碰壁, 假如你对现在的工作很不满意, 假如你想要转行, 无论你是学什么专业的, 请相信数据分析都是一个可以很快可以让你在一个城市立足, 同时看到未来希望的职业。

   为什么呢?

    因为每个人都会做菜吧, 因为数据分析和做菜一样简单。

   

二、从做菜中说起什么是数据分析

    我们每天在做菜的时候, 其实再每次想着怎么样做的更好吃的时候, 就是一次数据分析的过程, 不断的根据自己的经验对选料, 调味, 摆盘, 制作工序等进行调整, 慢慢的从黑暗料理到神仙料理的过渡

    那么, 到底什么是数据分析呢,  正经的解释就像下面那样, 其实说白了, 就是 数据分析 = 数据 + 分析。

    首先我们要知道我们要解决的问题是什么, 然后就想我们这些问题大概需要那些数据, 然后再去寻找对应的数据, 然后根据专业的分析方法, 分析出结论可以解决问题, 这就是一个数据分析的过程

三、从做菜的工序聊聊数据分析完整流程

    在《向往的生活》, 黄磊老师的炸牛奶 可谓是深入人心, 颜值与味道齐飞, 牛奶共盘子一色。

    

    辣么我们在重温炸牛奶中 领悟一下  数据分析的完整流程吧

    1.首先是目标: 以炸牛奶为例, 我们的分析目标就是我们怎么通过调整配方和工艺, 让我们的炸牛奶 好吃到飞起, 这就跟数据分析一样, 每一个数据分析的最开始都是有一个分析的目标, 后续所有的分析都是围绕这个目标开展的

    2. 准备分析数据: 像炸牛奶的材料一样, 我们要分析出结论, 就需要提前准备好对应的数据, 我们在炸牛奶之前, 会通过网上的各种美食博主去查询对应的材料准备,  相对应的 我们也会通过大量的 相同的分析case 去了解大概需要哪些数据, 保证数据的完整性。

    从材料中我们可以看出每一种材料我们都加了计量单位, 这在数据分析中是非常重要的, 除了需要知道准备哪些数据, 还需要知道准备数据的维度, 比如我们分析微信表情发送是否下降, 我们选取多长时间周期的数据, 太短了就会受到时间波动的影响, 太长了就浪费数据了

    就跟材料的数量多少很影响最后的成功率, 我们选取的数据如果时间周期没有选取完整 或者其他维度选取不完整, 是会影响到最后的分析的

    3. 分析过程

    准备好了材料, 我们就可以开始我们炸牛奶制作啦, 500g 牛奶+50g 白砂糖 +50g 玉米淀粉, 搅拌均匀, 数据也是一样的,我们要把不同的数据进行组合

    比如我们有表情的发送用户, 和这部分用户的年龄 性别 好友进行组合就可以得到: 不同年龄的发送次数, 不同好友数的发送次数等, 还可以进行多个数据的组合 比如 不同年龄 不同好友数 下的发送次数。

   

    我们就可以分析出 oh 是不是随着好友数的增加, 发送表情的次数也会随之增加, 还是说人的精力是有限的, 随着好友数的增多, 能发表情的都固定是那一波人。

    搅拌好以后, 将搅拌好的奶糊倒入到平底锅中搅拌, 一定要搅拌均匀后开小火, 继续搅拌, 这里一定是要小火, 不然底部容易焦, 这里也是数据分析需要借鉴的地方, 要有足够的耐心的去慢慢挖掘

    然后把奶糊倒入冰箱中冷藏四个小时, 让它定型, 因为需要定型就需要放入冰箱, 对于数据分析来说, 要得到某个结论有对应的固定的分析方法。

    比如分析用户在打开 面板发送表情的转化率, 我们就会利用漏斗分析的方法, 先计算打开面板 有多少人, 点击表情发送了有多少人, 最后成功发送的有多少人

    分析用户发送表情下降了, 我们会通过维度下钻分析法, 拆分不同的年龄, 性别,  地域, 不同活跃度。

    我们就可以得到结论: 是小学生发送下降了还是大学生发送下降了

                                    是一线城市下降了还是二线城市下降了

                                   是男的发送下降了还是女的下降了

                                    是有多少个好友的用户发送下降了

                                    是高活跃下降了还是低活跃下降了

    分析发送表情的用户特征 我们会通过 用户画像法,  我们就得到 发送表情的用户主要是 : 18-24岁年轻人  一线城市  好友数较多  朋友圈活跃 聊天活跃等等  这些就是用户画像法

    

    

    将定型后的奶糊进行切块裹上鸡蛋液和面包糠, 鸡蛋液是否需要加糖加多少糖, 我们可以对比加不同的糖以及是否加糖以后最后的口味对比。

    就像数据分析一样, 我们想要知道用户的年龄是否是 会影响他发表情的 活跃度, 那我们就会对比这个用户 在他年龄增加的时候和他过去的发表情的活跃度进行对比。

    这也是数据分析过程中经常用到的叫 多维分析+ 对比分析,多维分析就是会拆多个维度, 对比分析是会把这些维度都跟指标联系在一起进行对比,。

    比如上周每一天 和这周每一天(时间维度) + 下载表情次数(指标)差异, 又比如不同好友数+ 设备(好友维度和设备维度)+ 进入商店的次数(指标) 差异, 维度和指标都可以无限扩展和无限组合。


    放入油锅中炸到金黄, 捞出放入盘中, Q 弹 Q弹的, 好吃到弹起, 这也就是我们已经做好前面利用专门的数据分析方法去分析出结论, 然后输出结论总结如下hhh

   4. 结论呈现

    就像炸牛奶 需要一个好的摆盘呈现, 我们数据分析的结论也需要一个好的结果呈现形式, 一般来说我们都是利用图表去表达我们的分析结论。

    当观众还没有吃到你的炸牛奶的时候只能通过外观摆盘去判断, 同样的道理, 如果没有一个好的呈现的形式, 每一个看到你的数据分析的报告可能没有了解下去的动力, 同时可能也不能清晰的指导你在分析什么。

四、写在最后

    假如你正在学做菜 那一起来学数据分析把, 假如你在学习数据分析没有头绪, 不防停下来学学做菜, 从每一道菜中沉淀数据分析的精髓。

    

◆ ◆ ◆  ◆ ◆
麟哥新书已经在京东上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行400-240活动,大家可以用相当于原价4折的预购价格购买,还是非常划算的,扫描下方小程序即可进入购买页面:
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。管理员二维码:猜你喜欢● 麟哥拼了!!!亲自出镜推荐自己新书《数据分析师求职面试指南》● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗

这篇关于像做菜一样简单的数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/196939

相关文章

利用Python编写一个简单的聊天机器人

《利用Python编写一个简单的聊天机器人》这篇文章主要为大家详细介绍了如何利用Python编写一个简单的聊天机器人,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 使用 python 编写一个简单的聊天机器人可以从最基础的逻辑开始,然后逐步加入更复杂的功能。这里我们将先实现一个简单的

使用IntelliJ IDEA创建简单的Java Web项目完整步骤

《使用IntelliJIDEA创建简单的JavaWeb项目完整步骤》:本文主要介绍如何使用IntelliJIDEA创建一个简单的JavaWeb项目,实现登录、注册和查看用户列表功能,使用Se... 目录前置准备项目功能实现步骤1. 创建项目2. 配置 Tomcat3. 项目文件结构4. 创建数据库和表5.

使用PyQt5编写一个简单的取色器

《使用PyQt5编写一个简单的取色器》:本文主要介绍PyQt5搭建的一个取色器,一共写了两款应用,一款使用快捷键捕获鼠标附近图像的RGB和16进制颜色编码,一款跟随鼠标刷新图像的RGB和16... 目录取色器1取色器2PyQt5搭建的一个取色器,一共写了两款应用,一款使用快捷键捕获鼠标附近图像的RGB和16

四种简单方法 轻松进入电脑主板 BIOS 或 UEFI 固件设置

《四种简单方法轻松进入电脑主板BIOS或UEFI固件设置》设置BIOS/UEFI是计算机维护和管理中的一项重要任务,它允许用户配置计算机的启动选项、硬件设置和其他关键参数,该怎么进入呢?下面... 随着计算机技术的发展,大多数主流 PC 和笔记本已经从传统 BIOS 转向了 UEFI 固件。很多时候,我们也

基于Qt开发一个简单的OFD阅读器

《基于Qt开发一个简单的OFD阅读器》这篇文章主要为大家详细介绍了如何使用Qt框架开发一个功能强大且性能优异的OFD阅读器,文中的示例代码讲解详细,有需要的小伙伴可以参考一下... 目录摘要引言一、OFD文件格式解析二、文档结构解析三、页面渲染四、用户交互五、性能优化六、示例代码七、未来发展方向八、结论摘要

MyBatis框架实现一个简单的数据查询操作

《MyBatis框架实现一个简单的数据查询操作》本文介绍了MyBatis框架下进行数据查询操作的详细步骤,括创建实体类、编写SQL标签、配置Mapper、开启驼峰命名映射以及执行SQL语句等,感兴趣的... 基于在前面几章我们已经学习了对MyBATis进行环境配置,并利用SqlSessionFactory核

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu2289(简单二分)

虽说是简单二分,但是我还是wa死了  题意:已知圆台的体积,求高度 首先要知道圆台体积怎么求:设上下底的半径分别为r1,r2,高为h,V = PI*(r1*r1+r1*r2+r2*r2)*h/3 然后以h进行二分 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#includ

usaco 1.3 Prime Cryptarithm(简单哈希表暴搜剪枝)

思路: 1. 用一个 hash[ ] 数组存放输入的数字,令 hash[ tmp ]=1 。 2. 一个自定义函数 check( ) ,检查各位是否为输入的数字。 3. 暴搜。第一行数从 100到999,第二行数从 10到99。 4. 剪枝。 代码: /*ID: who jayLANG: C++TASK: crypt1*/#include<stdio.h>bool h

uva 10387 Billiard(简单几何)

题意是一个球从矩形的中点出发,告诉你小球与矩形两条边的碰撞次数与小球回到原点的时间,求小球出发时的角度和小球的速度。 简单的几何问题,小球每与竖边碰撞一次,向右扩展一个相同的矩形;每与横边碰撞一次,向上扩展一个相同的矩形。 可以发现,扩展矩形的路径和在当前矩形中的每一段路径相同,当小球回到出发点时,一条直线的路径刚好经过最后一个扩展矩形的中心点。 最后扩展的路径和横边竖边恰好组成一个直