本文主要是介绍Dataframe 的基本操作-- 030,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
内容目录
一、初窥数据二、数据清洗三、数据预处理四、数据获取五、数据筛选六、数据汇总七、数据合并八、数据输出
一、初窥数据
我们先说一下DataFrame是什么:
1、DataFrame是一种数据框结构,相当于是一个矩阵形式,单元格可以存放数值、字符串等,这和excel表很像;
2、DataFrame是有 行(index)和 列(columns)可以设置的;
df.shape #查看数据维度
df.info() #查看数据信息
describe() #函数对于数据的快速统计汇总
describe(include = 'all')对每一列数据进行统计,包括计数,均值,std,各个分位数等。
len(df) #查看行数
df.dtypes df['B'].dtype df.B.dtype #查看列的数据类型
df.isnull() df['B'].isnull() df.B.isnull() #空值检查
df['B'].unique() #查看列中的唯一值
df.values #查看数据值
df.columns #查看各列的名称df.sort_values(by = ['a','b']) #必须指定by参数,即必须指定哪几行或哪几列;无法根据index名和columns名排序
df.sort_index(axis=0) #df. sort_index()可以完成和df. sort_values()完全相同的功能,但python更推荐用只用df. sort_index()对“根据行标签”和“根据列标签”排序,其他排序方式用df.sort_values()。axis:0按照行名排序;1按照列名排序
df.sort_index(by
这篇关于Dataframe 的基本操作-- 030的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!