Pandas.DataFrame.cummax() 累积最大值 详解 含代码 含测试数据集 随Pandas版本持续更新

本文主要是介绍Pandas.DataFrame.cummax() 累积最大值 详解 含代码 含测试数据集 随Pandas版本持续更新,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关于Pandas版本: 本文基于 pandas2.2.0 编写。

关于本文内容更新: 随着pandas的stable版本更迭,本文持续更新,不断完善补充。

传送门: Pandas API参考目录

传送门: Pandas 版本更新及新特性

传送门: Pandas 由浅入深系列教程

本节目录

  • Pandas.DataFrame.cummax()
    • 计算公式:
    • 语法:
    • 返回值:
    • 参数说明:
      • axis 指定计算方向(行或列)
      • skipna 忽略缺失值
      • *args,**kwargs
    • 相关方法:
    • 示例:
      • 例1:如果是 `Series` 始终保持 `axis=0`,即计算 `Series` 所有元素的累积最大值。
      • 例2:字符串求累积最大值,其实是字符串编码的大小比较
      • 例3、计算每列累积最大值
      • 例4、计算每行累积最大值
      • 例5、默认会跳过缺失值,以缺失值上面的最近有效值,进行后面的计算
      • 例6、如果不忽略缺失值,后面所有的结果,将都是缺失值。

Pandas.DataFrame.cummax()

Pandas.DataFrame.cummax 方法用于返回行或列每一个元素与前面所有元素的累积最大值

⚠️ 注意 :

  1. 字符串可以求累积最大值,其大小是根据字符编码决定的。 例2

    • 字符串不能和任何其他类型数据混用,比如 缺失值、数值,否则报错 TypeError

计算公式:

  • 累积最大值计算公式:

    M i = max ⁡ ( x 1 , x 2 , … , x i ) M_i = \max(x_1, x_2, \ldots, x_i) Mi=max(x1,x2,,xi)

    M i M_i Mi 表示当前位置的累积最大值, max ⁡ ( x 1 , x 2 , … , x i ) \max(x_1, x_2, \ldots, x_i) max(x1,x2,,xi) 表示从起始位置到当前位置的所有元素的最大值。

语法:

DataFrame.cummax(axis=None, skipna=True, *args, **kwargs)

返回值:

  • Series or DataFrame

参数说明:

axis 指定计算方向(行或列)

  • axis : {0 or ‘index’, 1 or ‘columns’}, default 0

    axis 参数,用于指定计算方向,即按行计算或按列计算累积最大值:

    • 如果是 Series 此参数无效,将始终保持 axis=0,即计算整列的累积最大值。例1
    • 如果是 DataFrame 默认为 axis=0 即计算每一列的累积最大值。并有以下参值可选:
      • 0 or ‘index’: 计算每列的累积最大值。 例3
      • 1 or ‘columns’: 计算每行的累积最大值。例4

skipna 忽略缺失值

  • skipna : bool, default True >

    skipna 参数,用于指定求累积最大值的时候是否忽略缺失值,默认 skipna=True 表示忽略缺失值:

    • True: 忽略缺失值。当遇到缺失值,会跳过缺失值,以缺失值上面的最近有效值继续后面的计算。 例5
    • False: 不忽略缺失。但是后面的所有结果将都是缺失值。例6

*args,**kwargs

  • 为了保持与 Numpy 的兼容性而保留的参数,一般不需要传递任何内容。

相关方法:

➡️ 相关方法


  • Series.cummax

    Series 累积最大值

  • DataFrame.max

    最大值

  • DataFrame.cummin

    累积最小值

  • DataFrame.cumsum

    累积和

  • DataFrame.cumprod

    累积乘积

示例:

测试文件下载:

本文所涉及的测试文件,如有需要,可在文章顶部的绑定资源处下载。

若发现文件无法下载,应该是资源包有内容更新,正在审核,请稍后再试。或站内私信作者索要。

测试文件下载位置.png

测试文件下载位置

例1:如果是 Series 始终保持 axis=0,即计算 Series 所有元素的累积最大值。

import numpy as np
import pandas as pds = pd.Series([24.0, np.nan, 21.0, 33, 26], name="age")
s.cummax()
0    24.0
1     NaN
2    24.0
3    33.0
4    33.0
Name: age, dtype: float64

例2:字符串求累积最大值,其实是字符串编码的大小比较

import numpy as np
import pandas as pddf = pd.DataFrame({"第一列": ["一", "二", "三"], "第二列": ["四", "五", "六"]})df.cummax()
第一列第二列
0
1
2

由上面结果可见,字符串是支持累积最大值计算的,只不过是根据其字符编码比较大小。

例3、计算每列累积最大值

import numpy as np
import pandas as pddf = pd.DataFrame([[2.0, 1.0],[3.0, np.nan],[1.0, 0.0]],columns=list('AB'))df.cummax()
AB
02.01.0
13.0NaN
23.01.0

例4、计算每行累积最大值

import numpy as np
import pandas as pddf = pd.DataFrame([[2.0, 1.0, 3.0], [3.0, np.nan, 5.0], [1.0, 1.0, 1.0], [1.0, 0.0, 2.0]],columns=list("ABC"),
)df.cummax(axis=1)
ABC
02.02.03.0
13.0NaN5.0
21.01.01.0
31.01.02.0

例5、默认会跳过缺失值,以缺失值上面的最近有效值,进行后面的计算

import numpy as np
import pandas as pddf = pd.DataFrame([[2.0, 1.0],[3.0, np.nan],[1.0, 1.0],[1.0, 0.0]],columns=list('AB'))df.cummax()
AB
02.01.0
13.0NaN
23.01.0
33.01.0

例6、如果不忽略缺失值,后面所有的结果,将都是缺失值。

import numpy as np
import pandas as pddf = pd.DataFrame([[2.0, 1.0],[3.0, np.nan],[1.0, 1.0],[1.0, 0.0]],columns=list('AB'))df.cummax(skipna=False)
AB
02.01.0
13.0NaN
23.0NaN
33.0NaN

这篇关于Pandas.DataFrame.cummax() 累积最大值 详解 含代码 含测试数据集 随Pandas版本持续更新的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/685700

相关文章

Java内存分配与JVM参数详解(推荐)

《Java内存分配与JVM参数详解(推荐)》本文详解JVM内存结构与参数调整,涵盖堆分代、元空间、GC选择及优化策略,帮助开发者提升性能、避免内存泄漏,本文给大家介绍Java内存分配与JVM参数详解,... 目录引言JVM内存结构JVM参数概述堆内存分配年轻代与老年代调整堆内存大小调整年轻代与老年代比例元空

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

mysql表操作与查询功能详解

《mysql表操作与查询功能详解》本文系统讲解MySQL表操作与查询,涵盖创建、修改、复制表语法,基本查询结构及WHERE、GROUPBY等子句,本文结合实例代码给大家介绍的非常详细,感兴趣的朋友跟随... 目录01.表的操作1.1表操作概览1.2创建表1.3修改表1.4复制表02.基本查询操作2.1 SE

MySQL中的锁机制详解之全局锁,表级锁,行级锁

《MySQL中的锁机制详解之全局锁,表级锁,行级锁》MySQL锁机制通过全局、表级、行级锁控制并发,保障数据一致性与隔离性,全局锁适用于全库备份,表级锁适合读多写少场景,行级锁(InnoDB)实现高并... 目录一、锁机制基础:从并发问题到锁分类1.1 并发访问的三大问题1.2 锁的核心作用1.3 锁粒度分

MySQL数据库中ENUM的用法是什么详解

《MySQL数据库中ENUM的用法是什么详解》ENUM是一个字符串对象,用于指定一组预定义的值,并可在创建表时使用,下面:本文主要介绍MySQL数据库中ENUM的用法是什么的相关资料,文中通过代码... 目录mysql 中 ENUM 的用法一、ENUM 的定义与语法二、ENUM 的特点三、ENUM 的用法1

MySQL count()聚合函数详解

《MySQLcount()聚合函数详解》MySQL中的COUNT()函数,它是SQL中最常用的聚合函数之一,用于计算表中符合特定条件的行数,本文给大家介绍MySQLcount()聚合函数,感兴趣的朋... 目录核心功能语法形式重要特性与行为如何选择使用哪种形式?总结深入剖析一下 mysql 中的 COUNT

一文详解Git中分支本地和远程删除的方法

《一文详解Git中分支本地和远程删除的方法》在使用Git进行版本控制的过程中,我们会创建多个分支来进行不同功能的开发,这就容易涉及到如何正确地删除本地分支和远程分支,下面我们就来看看相关的实现方法吧... 目录技术背景实现步骤删除本地分支删除远程www.chinasem.cn分支同步删除信息到其他机器示例步骤

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

Visual Studio 2022 编译C++20代码的图文步骤

《VisualStudio2022编译C++20代码的图文步骤》在VisualStudio中启用C++20import功能,需设置语言标准为ISOC++20,开启扫描源查找模块依赖及实验性标... 默认创建Visual Studio桌面控制台项目代码包含C++20的import方法。右键项目的属性:

Go语言数据库编程GORM 的基本使用详解

《Go语言数据库编程GORM的基本使用详解》GORM是Go语言流行的ORM框架,封装database/sql,支持自动迁移、关联、事务等,提供CRUD、条件查询、钩子函数、日志等功能,简化数据库操作... 目录一、安装与初始化1. 安装 GORM 及数据库驱动2. 建立数据库连接二、定义模型结构体三、自动迁