pandas27 merge-数据库风格合并/join索引连接(列操作)( tcy)

2024-03-20 09:38

本文主要是介绍pandas27 merge-数据库风格合并/join索引连接(列操作)( tcy),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据库风格的DataFrame加入/合并merge/join  2018/12/31

1.函数

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,left_index=False, right_index=False, sort=True,suffixes=('_x', '_y'),copy=True, indicator=False,validate=None)
left.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)#在索引上的合并连接   
用途:# 可根据一个或多个键将不同DataFrame中的行连接起来。# 数据集的合并( merge ) 或连接(join )运算是通过一个或多个键将行键接起来的。# 这些运算是关系型数据库的核心。
left.join(right, on=key_or_keys)#完全等效于下面
pd.merge(left, right, left_on=key_or_keys, right_index=True,how='left', sort=False)

merge参数

参数:
# left:       参与合并的左侧DataFrame
# right:      参与合并的右侧DataFrame
# on:         列名或列名的列表。必须存在于左右DataFrame中。# on,left_on,right_on均未指定以left和right列名交集作为连接键
# left_on:    左侧Data Frame 中用作连接键的列# 列或索引用作键。可是列名,索引名,也可是长度等于DataFrame长度的数组
# right_on:   右侧Data F rame 中用作连续键的列# left_index: True用左侧DataFrame行索引作为其连接键。# 对于分层索引数据左右索引必须相匹配。
# right_index:右侧行索引作为其连接键
# how='inner':{'left','right','outer','inner'}。合并方式;如何确定要在结果表中包含哪些键
# sort=True:  通过连接键对结果DataFrame进行排序。False会显着提高性能。
# suffixes:   用于重叠列的字符串后缀元组。默认('_x', '_y')
# copy=True:  True复制数据# 可以避免复制的情况在某种程度上是病态的,但仍然提供了这种选择。
# indicator:  输出添加一列,包含每行源的信息分类类型结果为{'left_only','both','right_only'}之一
# validate=None:string如指定检查merge是否为指定类型。# “one_to_one”或“1:1”:检查合并键是否在左右数据集中都是唯一的。# “one_to_many”或“1:m”:检查合并键是否在左数据集中是唯一的。# “many_to_one”或“m:1”:检查合并键在右侧数据集中是否唯一。# “many_to_many”或“m:m”:允许,但不会导致检查

2.实例

1.merge数据库风格合并on参数实例 - https://mp.csdn.net/postedit/85492655
2.merge合并left_index, right_index参数实例- https://mp.csdn.net/postedit/85493634
3.merge数据库风格合并how参数实例- https://mp.csdn.net/postedit/85494066
4.merge数据库风格合并列名后缀实例- https://mp.csdn.net/postedit/85494314
5.merge数据库风格合并validate参数实例- https://mp.csdn.net/postedit/85494615

6.merge数据库风格合并indicator参数实例- https://mp.csdn.net/postedit/85495046

 

这篇关于pandas27 merge-数据库风格合并/join索引连接(列操作)( tcy)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/829049

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

W外链微信推广短连接怎么做?

制作微信推广链接的难点分析 一、内容创作难度 制作微信推广链接时,首先需要创作有吸引力的内容。这不仅要求内容本身有趣、有价值,还要能够激起人们的分享欲望。对于许多企业和个人来说,尤其是那些缺乏创意和写作能力的人来说,这是制作微信推广链接的一大难点。 二、精准定位难度 微信用户群体庞大,不同用户的需求和兴趣各异。因此,制作推广链接时需要精准定位目标受众,以便更有效地吸引他们点击并分享链接

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

hdu2241(二分+合并数组)

题意:判断是否存在a+b+c = x,a,b,c分别属于集合A,B,C 如果用暴力会超时,所以这里用到了数组合并,将b,c数组合并成d,d数组存的是b,c数组元素的和,然后对d数组进行二分就可以了 代码如下(附注释): #include<iostream>#include<algorithm>#include<cstring>#include<stack>#include<que

day-51 合并零之间的节点

思路 直接遍历链表即可,遇到val=0跳过,val非零则加在一起,最后返回即可 解题过程 返回链表可以有头结点,方便插入,返回head.next Code /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode() {}*

Java 连接Sql sever 2008

Java 连接Sql sever 2008 /Sql sever 2008 R2 import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.Statement; public class TestJDBC

实例:如何统计当前主机的连接状态和连接数

统计当前主机的连接状态和连接数 在 Linux 中,可使用 ss 命令来查看主机的网络连接状态。以下是统计当前主机连接状态和连接主机数量的具体操作。 1. 统计当前主机的连接状态 使用 ss 命令结合 grep、cut、sort 和 uniq 命令来统计当前主机的 TCP 连接状态。 ss -nta | grep -v '^State' | cut -d " " -f 1 | sort |

【每日一题】LeetCode 2181.合并零之间的节点(链表、模拟)

【每日一题】LeetCode 2181.合并零之间的节点(链表、模拟) 题目描述 给定一个链表,链表中的每个节点代表一个整数。链表中的整数由 0 分隔开,表示不同的区间。链表的开始和结束节点的值都为 0。任务是将每两个相邻的 0 之间的所有节点合并成一个节点,新节点的值为原区间内所有节点值的和。合并后,需要移除所有的 0,并返回修改后的链表头节点。 思路分析 初始化:创建一个虚拟头节点

深入理解数据库的 4NF:多值依赖与消除数据异常

在数据库设计中, "范式" 是一个常常被提到的重要概念。许多初学者在学习数据库设计时,经常听到第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及 BCNF(Boyce-Codd范式)。这些范式都旨在通过消除数据冗余和异常来优化数据库结构。然而,当我们谈到 4NF(第四范式)时,事情变得更加复杂。本文将带你深入了解 多值依赖 和 4NF,帮助你在数据库设计中消除更高级别的异常。 什么是