【Python】处理 scikit-learn 中的 SettingWithCopyWarning

本文主要是介绍【Python】处理 scikit-learn 中的 SettingWithCopyWarning，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

那年夏天我和你躲在这一大片宁静的海
直到后来我们都还在对这个世界充满期待
今年冬天你已经不在我的心空出了一块
很高兴遇见你让我终究明白
回忆比真实精彩
🎵 王心凌《那年夏天宁静的海》

这不是一个错误，而是一个 SettingWithCopyWarning 警告。这个警告在你尝试修改一个从 DataFrame 的切片（子集）上创建的副本时出现。这个警告是为了提醒你可能没有修改原始 DataFrame。

为什么会出现这个警告？

这个警告的目的是避免潜在的陷阱，当你试图在切片上进行操作时，有时可能会无意中创建副本而不是在原始数据上进行操作，从而导致修改没有生效。

示例

假设你有一个 DataFrame 并尝试修改其中的一部分：

import pandas as pddata = {'A': [1, 2, 3, 4],'B': [5, 6, 7, 8]
}
df = pd.DataFrame(data)# 创建一个切片
df_slice = df[df['A'] > 2]# 尝试修改切片
df_slice['B'] = df_slice['B'] * 2

上面的代码可能会触发 SettingWithCopyWarning，因为 df_slice 可能是 df 的一个副本，而不是视图。

如何解决这个警告？

使用 .loc 索引器进行修改，确保操作在原始 DataFrame 上完成。以下是修改上述代码以避免警告的示例：

# 正确的方法
df.loc[df['A'] > 2, 'B'] = df['B'] * 2

更具体的例子

假设你遇到了以下警告：

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

你可以按以下方式进行修改：

import pandas as pd# 示例数据
data = {'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]}
df = pd.DataFrame(data)# 错误的方法 - 可能触发 SettingWithCopyWarning
df_slice = df[df['A'] > 2]
df_slice['B'] = df_slice['B'] * 2# 正确的方法 - 使用 .loc 索引器
df.loc[df['A'] > 2, 'B'] = df['B'] * 2