本文主要是介绍pandas库入门 北理工嵩天老师python数据分析与展示 单元7随堂笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
pandas库入门 北理工嵩天老师python数据分析与展示 单元7随堂笔记
Pandas是Python第三方库,提供高性能易用数据类型和分析工具。
import pandas as pd
Pandas基于NumPy实现,常与Numpy和Matplotlib一同使用。
d = pd.Series(range(20))
d #第一列是索引,第二列是值
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
11 11
12 12
13 13
14 14
15 15
16 16
17 17
18 18
19 19
dtype: int64
d.cumsum() #计算前N项的累加和
0 0
1 1
2 3
3 6
4 10
5 15
6 21
7 28
8 36
9 45
10 55
11 66
12 78
13 91
14 105
15 120
16 136
17 153
18 171
19 190
dtype: int64
Pandas库的理解
两个数据类型:Series 、DataFrame
基于上述数据类型的各类操作:
基本操作,运算操作,特征类操作,关联类操作
NumPy Pandas基础数据类型 基于np.array的扩展数据类型 Series 、DataFrame
关注数据的结构表达(即数据之间的维度表达) 关注数据的应用表达(如何提取、运算)维度:数据之间 数据与索引间关系
Series类型
Series类型由一组数据及与之相关的数据索引组成
图四
a = pd.Series([9,8,7,6]) #自动索引
a
0 9
1 8
2 7
3 6
dtype: int64
b=pd.Series([9,8,7,6],index=['a','b','c','d']) #指定索引
b
a 9
b 8
c 7
d 6
dtype: int64
Series类型可以由如下类型创建
(1)标量值
s=pd.Series(25,index=['a','b','c']) #通过标量值创建,不能省略index,index表达了Series类型的尺寸
s
a 25
b 25
c 25
dtype: int64
(2)python 字典
d=pd.Series({'a':9,'b':8,'c':7})# 用字典创建,键变为原来值的索引
d
a 9
b 8
c 7
dtype: int64
e=pd.Series({'a':9,'b':8,'c':7},index=['c','a','b','d'])#通过index指定Series结构
e
c 7.0
a 9.0
b 8.0
d NaN
dtype: float64
(3)ndarray
import numpy as np
n=pd.Series(np.arange(5))
n
0 0
1 1
2 2
3 3
4 4
dtype: int32
m=pd.Series(np.arange(5),index=np.arange(9,4,-1))
m
9 0
8 1
7 2
6 3
5 4
dtype: int32
(4)其他函数
如range()
o=pd.Series(range(5),index=np.arange(9,4,-1))
o
9 0
8 1
7 2
6 3
5 4
dtype: int64
可以看到pandas与很多数据都具有兼容性
Series类型的基本操作
Series类型包括index和values两部分。
Series类型的操作类似ndarray类型。
Series类型的操作类似Python字典类型
b=pd.Series([9,8,7,6],['a','b','c','d'
这篇关于pandas库入门 北理工嵩天老师python数据分析与展示 单元7随堂笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!