莫笑专题

一文过pandas入门(前篇)——才疏学浅的莫笑天

前篇主要是讲明pandas到底是什么,pandas中的常用的基本数据方法,数据交互方式,需要注意的踩坑点等。 之前整理了numpy部分的知识点,numpy的numpy.array对于python的数组运算做了很大贡献,使得python程序员可以用接近c语言的速度对矩阵数据进行运算吗,这对于后置的机器学习模块包括深度学习模块的贡献非常大,但对于数据分析来说,例如一个excel文件中,它并不是单独的包

一文过pandas入门(中篇)——才疏学浅的莫笑天

本篇核心内容为数据清洗。 数据清洗 数据工作的步骤应该为: 数据获取数据清洗数据分析数据可视化与建模 因此,上一篇博文中,本人说过,下一篇博文会讲一下数据分析中重要的一步 我们要知道,数据清洗本着为下一步数据分析服务的目的进行,因此,数据处理要根据数据分析确定它是否需要处理,需要怎样的处理,才能适应接下来的分析工作和挖掘工作。 整体分为几个不同的步骤来看。 import pandas a