常用数据探查函数

本文主要是介绍常用数据探查函数，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Task01–data structure@TOC

glimps()

library(dplyr)
library(readr)
h1n1_flu<-read_csv('/Users/shixinjin/Desktop/h1n1_flu.csv')
glimpse(h1n1_flu)

最终得到的结果为
在这里插入图片描述
从这里就可以看出，glimpse()起到了一个print()的转置功能，有时候，如果列数太多，用print()打印出来看不出来数据的全部列，这时候为了能看到所有列数，就可以使用glimpse()

str(h1n1_flu)

最后得到的结果为
在这里插入图片描述
从这个结果我们可以看到每一列的名称，每一列的数据类型，以及总长度。看出来这是一个dataframe,共有26707行，33列。
他能够紧密的展示R的内在结构，是summary的替代品。对于任何类型的R数据结构都能用它来查看结构。

head(h1n1_flu)

最终得到的结果为：
在这里插入图片描述
这个函数可以显示dataframe的前几行，可以设置参数n,来明确需要显示到底是前面几行。

tail(h1n1_flu)

最后得到的结果为
在这里插入图片描述
从这里就可以看出tail()这个函数显示的dataframe的后几行，和head()的用法相同。

View(h1n1_flu)

得到的结果为
在这里插入图片描述
使用这个函数之后，它会自动跳转到看原始数据的界面中去.它能够唤起数据表格式的数据。

summary(h1n1_flu)

得到的结果为
在这里插入图片描述
从这个结果可以看出，它能够显示每一列中的最大值，最小值一分位数，三分位数和平均值。以及含有NA的个数。如果是字符型的列的话，会显示总长度，类型和模式。例如

nrow(h1n1_flu)

得到的结果为
在这里插入图片描述
从这里可以看出，它能够显示一个dataframe的总行数。本来认为会有ncolumn,但实际情况下却发现并没有。总列数是用length()这个函数得到的

length(h1n1_flu)

最后得到的结果为
在这里插入图片描述
length()可以显示dataframe的总列数。

class(h1n1_flu)

最后得到的结果为
在这里插入图片描述
这个函数应该是可以显示数据类型。

table(h1n1_flu$sex)

得到的结果为
在这里插入图片描述
如果某一列是因子的话，它可以统计不同水平的因子的个数。

这篇关于常用数据探查函数的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！