pandas27 merge(数据库风格合并indicator参数实例)( tcy)

2024-03-20 09:38

本文主要是介绍pandas27 merge(数据库风格合并indicator参数实例)( tcy),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

# 实例6:indicator添加分类到输出df1 = pd.DataFrame({'no': [10, 11], 'name':['Tom', 'Bob']})
df2 = pd.DataFrame({'no': [11, 12],'weight':[20, 20]})pd.merge(df1, df2, on='no', how='outer', indicator=True)   #添加分类到输出
pd.merge(df1, df2, on='no', how='outer', indicator='分类') #indicator参数为字符串no name  weight      _merge             no name  weight  分类
0  10  Tom     NaN       left_only       0  10  Tom   NaN    left_only
1  11  Bob     20.0      both            1  11  Bob   20.0   both
2  12  NaN     20.0      right_only      2  12  NaN   20.0   right_only============================================================
# 实例7:连接多个DataFrame或Panel对象
# DataFrames传递列表或元组,join() 在它们的索引上将它们连接在一起left = pd.DataFrame({'k': ['K0', 'K1', 'K2'], 'v': [1, 2, 3]})
right = pd.DataFrame({'k': ['K0', 'K0', 'K3'], 'v': [4, 5, 6]})
left = left.set_index('k')
right = right.set_index('k')
right2 = pd.DataFrame({'v': [7, 8, 9]}, index=['K1', 'K1', 'K2'])result = left.join([right, right2])# left       right        right2           v_x  v_y    vv            v            v        K0    1  4.0  NaN
k            k            K1  7        K0    1  5.0  NaN
K0  1        K0  4        K1  8        K1    2  NaN  7.0
K1  2        K0  5        K2  9        K1    2  NaN  8.0
K2  3        K3  6                     K2    3  NaN  9.0============================================================
备注:
# 合并将保留连接键,保留连接键的dtype# 实例1:
left = pd.DataFrame({'key': [1], 'v1': [10]})
right = pd.DataFrame({'key': [1, 2], 'v1': [20, 30]})result1=pd.merge(left, right, how='outer')           #保留连接键key  v1
pd.merge(left, right, how='outer').dtypes
reslult2=pd.merge(left, right, how='outer', on='key')#缺少引入值生成的dtype将是向上兼容
pd.merge(left, right, how='outer', on='key').dtypes# result1                result2key  v1                    key  v1_x  v1_y
0    1  10                0     1  10.0    20
1    1  20                1     2   NaN    30
2    2  30int64 int64              int64  float64 int64# 实例2:from pandas.api.types import CategoricalDtypeX = pd.Series(np.random.choice(['a', 'b'], size=(4,)))
X = X.astype(CategoricalDtype(categories=['a', 'b']))left = pd.DataFrame({'X': X,'Y': np.random.choice(['ss1', 'ss2'], size=(4,))})
right = pd.DataFrame({ 'X': pd.Series(['a', 'b'],dtype=CategoricalDtype(['a', 'b'])), 'Z': [1, 2] })result = pd.merge(left, right, how='outer')left.dtypes
right.dtypes
result.dtypes# left           right            resultX    Y           X  Z             X    Y  Z
0  a  ss2        0  a  1          0  a  ss2  1
1  b  ss1        1  b  2          1  a  ss2  1
2  a  ss2                         2  b  ss1  2
3  b  ss2                         3  b  ss2  2X  category   X  category      X    category
Y  object     Z  int64         Y    objectZ    int64# 注意 类别dtypes必须完全相同,即相同的类别和有序属性。否则结果将强制转换为objectdtype。
# 注意 与categorydtype 合并相比,在相同的dtypes上合并可以非常高效
============================================================

 

这篇关于pandas27 merge(数据库风格合并indicator参数实例)( tcy)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/829048

相关文章

Spring Boot项目部署命令java -jar的各种参数及作用详解

《SpringBoot项目部署命令java-jar的各种参数及作用详解》:本文主要介绍SpringBoot项目部署命令java-jar的各种参数及作用的相关资料,包括设置内存大小、垃圾回收... 目录前言一、基础命令结构二、常见的 Java 命令参数1. 设置内存大小2. 配置垃圾回收器3. 配置线程栈大小

SpringBoot利用@Validated注解优雅实现参数校验

《SpringBoot利用@Validated注解优雅实现参数校验》在开发Web应用时,用户输入的合法性校验是保障系统稳定性的基础,​SpringBoot的@Validated注解提供了一种更优雅的解... 目录​一、为什么需要参数校验二、Validated 的核心用法​1. 基础校验2. php分组校验3

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

Ubuntu中远程连接Mysql数据库的详细图文教程

《Ubuntu中远程连接Mysql数据库的详细图文教程》Ubuntu是一个以桌面应用为主的Linux发行版操作系统,这篇文章主要为大家详细介绍了Ubuntu中远程连接Mysql数据库的详细图文教程,有... 目录1、版本2、检查有没有mysql2.1 查询是否安装了Mysql包2.2 查看Mysql版本2.

Oracle数据库常见字段类型大全以及超详细解析

《Oracle数据库常见字段类型大全以及超详细解析》在Oracle数据库中查询特定表的字段个数通常需要使用SQL语句来完成,:本文主要介绍Oracle数据库常见字段类型大全以及超详细解析,文中通过... 目录前言一、字符类型(Character)1、CHAR:定长字符数据类型2、VARCHAR2:变长字符数

Win11安装PostgreSQL数据库的两种方式详细步骤

《Win11安装PostgreSQL数据库的两种方式详细步骤》PostgreSQL是备受业界青睐的关系型数据库,尤其是在地理空间和移动领域,:本文主要介绍Win11安装PostgreSQL数据库的... 目录一、exe文件安装 (推荐)下载安装包1. 选择操作系统2. 跳转到EDB(PostgreSQL 的

SpringBoot实现数据库读写分离的3种方法小结

《SpringBoot实现数据库读写分离的3种方法小结》为了提高系统的读写性能和可用性,读写分离是一种经典的数据库架构模式,在SpringBoot应用中,有多种方式可以实现数据库读写分离,本文将介绍三... 目录一、数据库读写分离概述二、方案一:基于AbstractRoutingDataSource实现动态

C# WinForms存储过程操作数据库的实例讲解

《C#WinForms存储过程操作数据库的实例讲解》:本文主要介绍C#WinForms存储过程操作数据库的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、存储过程基础二、C# 调用流程1. 数据库连接配置2. 执行存储过程(增删改)3. 查询数据三、事务处

springboot security验证码的登录实例

《springbootsecurity验证码的登录实例》:本文主要介绍springbootsecurity验证码的登录实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录前言代码示例引入依赖定义验证码生成器定义获取验证码及认证接口测试获取验证码登录总结前言在spring

tomcat多实例部署的项目实践

《tomcat多实例部署的项目实践》Tomcat多实例是指在一台设备上运行多个Tomcat服务,这些Tomcat相互独立,本文主要介绍了tomcat多实例部署的项目实践,具有一定的参考价值,感兴趣的可... 目录1.创建项目目录,测试文China编程件2js.创建实例的安装目录3.准备实例的配置文件4.编辑实例的