读者来信:我是数学专业的女生,想转数据分析,该怎么办?

2024-02-10 15:20

本文主要是介绍读者来信:我是数学专业的女生,想转数据分析,该怎么办?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=jpeg


以上是关注我的一个读者的提问,说下个人看法,各位读者若是有什么更好的建议,欢迎留言区留言。

第一点 ,首先恭喜你是数学专业的。因为我们都知道,数学是一门自然科学,是一切工程学科的理论基础。如果你平时已经注重利用数学理论,去建模,去解决一些实际问题,那你的逻辑思维应该很强,而这恰恰是计算机科学最需要的,并且数学和计算机科学关系真的很紧密。所以你具备了学好数据分析的前置条件,这也是你的一个独特优势。

第二点 ,数据分析到底是干啥的?目前,大多数公司对这个岗位的实际要求是什么,我想这是一个大家都比较关心的问题。实话讲,我也没有对这个问题做过详细统计分析,只是根据自己所见所闻,说一下对此理解。首先,数据分析有狭隘的定义,也有一些广义的定义。

放眼目前的数据竞赛领域,数据分析的角色可定义为:分析数据原有的分布和内容,进而为特征工程环节提供支持。这就是一种 “微观” 意义上的数据分析定义。毕竟是竞赛,环境还是很理想的。

640?wx_fmt=png

那么,企业里的数据分析岗也仅仅是比划比划数据分析和内容吗?大多数不是的。我不是数据岗,但是通过朋友那里了解到,他们的日常是去公司自己的大数据平台提数,一个稍微大点的公司,业务数据表多的让人眼花缭乱,光根据一个关键词,比如 order ,就能搜索出上百个业务表。这意味着什么呢?你就必须要对数据背后的业务背景、业务逻辑有一个清晰的了解,这些工作大多又是沟通类的,可能我们程序员们不太擅长沟通,但是这个步骤的确不能省。

接下来,当你知道需要根据哪些字段去串需要的表,根据哪些字段筛选过滤时,你可以动手写SQL了,所以SQL相关的知识,比如最重要的各个关键词的逻辑执行顺序要了解,这是不管哪门SQL都是通用的。如果你的目标是做挑战性的任务,建议你掌握一些:hiveSql + spark + 流式处理,这些都是大点公司处理大数据的必备技能。

当你拿到这些"第一手"的数据后,最重要的,你要知道你要用这些数据干啥?是要为了实现什么目的?比如分析数据是为了提升用户对某个产品的关注度,是为了拟合出一个更加合理的服务用户时长。抱着这些问题,做出假设,验证你的想法,再次修正假设,重复这个过程。

当然, 要区分结构化数据和非结构化数据,因为他们各自有各自的常用处理技巧。数据清洗,异常值、缺失值处理,等等工作,都是在这一步要解决的。

这些工作都搞定后,选一些合适的模型,从最基础的模型开始验证自己的假设,现在很多都是需要组成一个模型栈,或者模型融合,去实现更好的效果。可能每一步都要涉及到数据可视化技术,常用的包多多了解下。

第三点 ,如何增加项目经验?或者实战经验。可能在学校读书的还好,时间充裕,组个队,参加个比赛,大半个月就能混出一个"经验". 还能去找实习,每三个月换一个,毕业校招时,4,5个实习公司,写到简历上"很好看"。虽然我觉得这不是一种最好的方法,但的确有人这么做过。但是对于工作党,就没有类似的机会了,你做的工作可能目前只有和数据分析有一点关系,可能还得加班,那么项目经验从哪里来呢? 利用周末时间,动手写写代码,搜索一些别人已经做过的项目,最好带有较为详细的分析过程和代码的那种。自己动手敲一遍代码,理解数据分析的整个过程,理解透一些基本概念。如果实在没时间,反正也工作了,可以报一个课程,用投资来换取时间。最后,祝你早日找上自己想做的工作。

关于数据分析的更多文章:

Python从新手到大师,100天完整学习路线

640?wx_fmt=jpeg
Python与算法社区
长按二维码,关注我的公众号

这篇关于读者来信:我是数学专业的女生,想转数据分析,该怎么办?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/697447

相关文章

uva 10014 Simple calculations(数学推导)

直接按照题意来推导最后的结果就行了。 开始的时候只做到了第一个推导,第二次没有继续下去。 代码: #include<stdio.h>int main(){int T, n, i;double a, aa, sum, temp, ans;scanf("%d", &T);while(T--){scanf("%d", &n);scanf("%lf", &first);scanf

uva 10025 The ? 1 ? 2 ? ... ? n = k problem(数学)

题意是    ?  1  ?  2  ?  ...  ?  n = k 式子中给k,? 处可以填 + 也可以填 - ,问最小满足条件的n。 e.g k = 12  - 1 + 2 + 3 + 4 + 5 + 6 - 7 = 12 with n = 7。 先给证明,令 S(n) = 1 + 2 + 3 + 4 + 5 + .... + n 暴搜n,搜出当 S(n) >=

uva 11044 Searching for Nessy(小学数学)

题意是给出一个n*m的格子,求出里面有多少个不重合的九宫格。 (rows / 3) * (columns / 3) K.o 代码: #include <stdio.h>int main(){int ncase;scanf("%d", &ncase);while (ncase--){int rows, columns;scanf("%d%d", &rows, &col

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

Python:豆瓣电影商业数据分析-爬取全数据【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】

**爬取豆瓣电影信息,分析近年电影行业的发展情况** 本文是完整的数据分析展现,代码有完整版,包含豆瓣电影爬取的具体方式【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】   最近MBA在学习《商业数据分析》,大实训作业给了数据要进行数据分析,所以先拿豆瓣电影练练手,网络上爬取豆瓣电影TOP250较多,但对于豆瓣电影全数据的爬取教程很少,所以我自己做一版。 目

CSP-J基础之数学基础 初等数论 一篇搞懂(一)

文章目录 前言声明初等数论是什么初等数论历史1. **古代时期**2. **中世纪时期**3. **文艺复兴与近代**4. **现代时期** 整数的整除性约数什么样的整数除什么样的整数才能得到整数?条件:举例说明:一般化: 判断两个数能否被整除 因数与倍数质数与复合数使用开根号法判定质数哥德巴赫猜想最大公因数与辗转相除法计算最大公因数的常用方法:举几个例子:例子 1: 计算 12 和 18

2024年AMC10美国数学竞赛倒计时两个月:吃透1250道真题和知识点(持续)

根据通知,2024年AMC10美国数学竞赛的报名还有两周,正式比赛还有两个月就要开始了。计划参赛的孩子们要记好时间,认真备考,最后冲刺再提高成绩。 那么如何备考2024年AMC10美国数学竞赛呢?做真题,吃透真题和背后的知识点是备考AMC8、AMC10有效的方法之一。通过做真题,可以帮助孩子找到真实竞赛的感觉,而且更加贴近比赛的内容,可以通过真题查漏补缺,更有针对性的补齐知识的短板。

一些数学经验总结——关于将原一元二次函数增加一些限制条件后最优结果的对比(主要针对公平关切相关的建模)

1.没有分段的情况 原函数为一元二次凹函数(开口向下),如下: 因为要使得其存在正解,必须满足,那么。 上述函数的最优结果为:,。 对应的mathematica代码如下: Clear["Global`*"]f0[x_, a_, b_, c_, d_] := (a*x - b)*(d - c*x);(*(b c+a d)/(2 a c)*)Maximize[{f0[x, a, b,

2024年高教社杯数学建模国赛最后一步——结果检验-事关最终奖项

2024年国赛已经来到了最后一天,有必要去给大家讲解一下,我们不需要过多的去关注模型的结果,因为模型的结果的分值设定项最多不到20分。但是如果大家真的非常关注的话,那有必要给大家讲解一下论文结果相关的问题。很多的论文,上至国赛优秀论文下至不获奖的论文并不是所有的论文都可以进行完整的复现求解,大部分数模论文都为存在一个灰色地带。         白色地带即认为所有的代码均可运行、公开