pandas库入门 北理工嵩天老师python数据分析与展示 单元7随堂笔记

本文主要是介绍pandas库入门 北理工嵩天老师python数据分析与展示 单元7随堂笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

pandas库入门 北理工嵩天老师python数据分析与展示 单元7随堂笔记

Pandas是Python第三方库,提供高性能易用数据类型和分析工具。

import pandas as pd

Pandas基于NumPy实现,常与Numpy和Matplotlib一同使用。

d = pd.Series(range(20))  
d  #第一列是索引,第二列是值
0      0
1      1
2      2
3      3
4      4
5      5
6      6
7      7
8      8
9      9
10    10
11    11
12    12
13    13
14    14
15    15
16    16
17    17
18    18
19    19
dtype: int64
d.cumsum() #计算前N项的累加和
0       0
1       1
2       3
3       6
4      10
5      15
6      21
7      28
8      36
9      45
10     55
11     66
12     78
13     91
14    105
15    120
16    136
17    153
18    171
19    190
dtype: int64

Pandas库的理解

两个数据类型:Series 、DataFrame
基于上述数据类型的各类操作:
基本操作,运算操作,特征类操作,关联类操作

       NumPy                              Pandas基础数据类型             基于np.array的扩展数据类型 Series 、DataFrame
关注数据的结构表达(即数据之间的维度表达)     关注数据的应用表达(如何提取、运算)维度:数据之间                       数据与索引间关系

Series类型

Series类型由一组数据及与之相关的数据索引组成
图四

a = pd.Series([9,8,7,6])  #自动索引
a
0    9
1    8
2    7
3    6
dtype: int64
b=pd.Series([9,8,7,6],index=['a','b','c','d']) #指定索引
b
a    9
b    8
c    7
d    6
dtype: int64

Series类型可以由如下类型创建

(1)标量值
s=pd.Series(25,index=['a','b','c'])  #通过标量值创建,不能省略index,index表达了Series类型的尺寸
s
a    25
b    25
c    25
dtype: int64
(2)python 字典
d=pd.Series({'a':9,'b':8,'c':7})# 用字典创建,键变为原来值的索引
d
a    9
b    8
c    7
dtype: int64
e=pd.Series({'a':9,'b':8,'c':7},index=['c','a','b','d'])#通过index指定Series结构
e
c    7.0
a    9.0
b    8.0
d    NaN
dtype: float64
(3)ndarray
import numpy as np
n=pd.Series(np.arange(5))
n
0    0
1    1
2    2
3    3
4    4
dtype: int32
m=pd.Series(np.arange(5),index=np.arange(9,4,-1))
m
9    0
8    1
7    2
6    3
5    4
dtype: int32
(4)其他函数

如range()

o=pd.Series(range(5),index=np.arange(9,4,-1))
o
9    0
8    1
7    2
6    3
5    4
dtype: int64

可以看到pandas与很多数据都具有兼容性

Series类型的基本操作

Series类型包括index和values两部分。
Series类型的操作类似ndarray类型。
Series类型的操作类似Python字典类型

b=pd.Series([9,8,7,6],['a','b','c','d'

这篇关于pandas库入门 北理工嵩天老师python数据分析与展示 单元7随堂笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/749761

相关文章

Python FastAPI入门安装使用

《PythonFastAPI入门安装使用》FastAPI是一个现代、快速的PythonWeb框架,用于构建API,它基于Python3.6+的类型提示特性,使得代码更加简洁且易于绶护,这篇文章主要介... 目录第一节:FastAPI入门一、FastAPI框架介绍什么是ASGI服务(WSGI)二、FastAP

Python中Windows和macOS文件路径格式不一致的解决方法

《Python中Windows和macOS文件路径格式不一致的解决方法》在Python中,Windows和macOS的文件路径字符串格式不一致主要体现在路径分隔符上,这种差异可能导致跨平台代码在处理文... 目录方法 1:使用 os.path 模块方法 2:使用 pathlib 模块(推荐)方法 3:统一使

一文教你解决Python不支持中文路径的问题

《一文教你解决Python不支持中文路径的问题》Python是一种广泛使用的高级编程语言,然而在处理包含中文字符的文件路径时,Python有时会表现出一些不友好的行为,下面小编就来为大家介绍一下具体的... 目录问题背景解决方案1. 设置正确的文件编码2. 使用pathlib模块3. 转换路径为Unicod

Python结合Flask框架构建一个简易的远程控制系统

《Python结合Flask框架构建一个简易的远程控制系统》这篇文章主要为大家详细介绍了如何使用Python与Flask框架构建一个简易的远程控制系统,能够远程执行操作命令(如关机、重启、锁屏等),还... 目录1.概述2.功能使用系统命令执行实时屏幕监控3. BUG修复过程1. Authorization

Python使用DeepSeek进行联网搜索功能详解

《Python使用DeepSeek进行联网搜索功能详解》Python作为一种非常流行的编程语言,结合DeepSeek这一高性能的深度学习工具包,可以方便地处理各种深度学习任务,本文将介绍一下如何使用P... 目录一、环境准备与依赖安装二、DeepSeek简介三、联网搜索与数据集准备四、实践示例:图像分类1.

Python中__new__()方法适应及注意事项详解

《Python中__new__()方法适应及注意事项详解》:本文主要介绍Python中__new__()方法适应及注意事项的相关资料,new()方法是Python中的一个特殊构造方法,用于在创建对... 目录前言基本用法返回值单例模式自定义对象创建注意事项总结前言new() 方法在 python 中是一个

Python批量调整Word文档中的字体、段落间距及格式

《Python批量调整Word文档中的字体、段落间距及格式》这篇文章主要为大家详细介绍了如何使用Python的docx库来批量处理Word文档,包括设置首行缩进、字体、字号、行间距、段落对齐方式等,需... 目录关键代码一级标题设置  正文设置完整代码运行结果最近关于批处理格式的问题我查了很多资料,但是都没

Python依赖库的几种离线安装方法总结

《Python依赖库的几种离线安装方法总结》:本文主要介绍如何在Python中使用pip工具进行依赖库的安装和管理,包括如何导出和导入依赖包列表、如何下载和安装单个或多个库包及其依赖,以及如何指定... 目录前言一、如何copy一个python环境二、如何下载一个包及其依赖并安装三、如何导出requirem

python中列表list切分的实现

《python中列表list切分的实现》列表是Python中最常用的数据结构之一,经常需要对列表进行切分操作,本文主要介绍了python中列表list切分的实现,文中通过示例代码介绍的非常详细,对大家... 目录一、列表切片的基本用法1.1 基本切片操作1.2 切片的负索引1.3 切片的省略二、列表切分的高

基于Python实现一个PDF特殊字体提取工具

《基于Python实现一个PDF特殊字体提取工具》在PDF文档处理场景中,我们常常需要针对特定格式的文本内容进行提取分析,本文介绍的PDF特殊字体提取器是一款基于Python开发的桌面应用程序感兴趣的... 目录一、应用背景与功能概述二、技术架构与核心组件2.1 技术选型2.2 系统架构三、核心功能实现解析