pandas concat

2024-09-01 19:44

文章标签 pandas concat

本文主要是介绍pandas concat，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

pandas.concat 是一个用于沿指定轴连接多个 DataFrame 或 Series 对象的函数。它是 pandas 库中用于合并数据的强大工具，可以处理不同的合并场景，如垂直（按行）或水平（按列）连接，以及处理索引和层次索引。

基本语法

pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)

参数说明

objs: 要连接的 Series 或 DataFrame 对象的序列或映射。
axis: 连接的轴，0 表示按行连接，1 表示按列连接。
join: 连接的方式，'inner' 表示内连接，'outer' 表示外连接。
ignore_index: 如果为 True，则不使用连接轴上的索引值，结果轴将被重新索引。
keys: 用于构建层次索引的序列或元组。
levels 和 names: 用于构建和命名层次索引的参数。
verify_integrity: 检查新轴是否包含重复值。
sort: 按字典顺序对非连接轴进行排序。
copy: 如果为 False，则尝试避免不必要的数据复制。

使用场景

垂直连接多个 DataFrame 或 Series 对象。
水平连接多个 DataFrame 对象，将它们的列合并。
合并时添加层次索引，以区分不同数据集的来源。
合并时忽略索引，重新创建索引。

示例

import pandas as pd# 创建两个DataFrame
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'C': [7, 8]})# 垂直连接（按行）
result_vertical = pd.concat([df1, df2], axis=0)# 水平连接（按列）
result_horizontal = pd.concat([df1, df2], axis=1)# 合并时添加层次索引
result_with_keys = pd.concat([df1, df2], keys=['df1', 'df2'])