本文主要是介绍python之dataframe需要注意的细节,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
(1)通过as_index=False,groupby的列名'GLBDOMAIN'将不作为索引出现在结果中
agv_1930_df=data_1930_df.groupby(['GLBDOMAIN'],as_index=False)[['EDGE_BW']].mean()
(2)按行删除存在缺失数据的行(dataframe)
data_1930_df.dropna(axis=0,how='any',inplace=True)
(3)设置其中一列或者多列为dataframe的索引
data_1930_df=data_1930_df.set_index('GLBDOMAIN')
data_1930_df=data_1930_df.set_index(['GLBDOMAIN','Time'])
(4)Axis=0为行,axis=1为列,特别注意在对数据进行操作的时候要进行指定
original_avg_1930_bw=data_1930_df.apply(lambda x:x.mean(),axis=1)
(5)更改dataframe的列名
data_1930_df.columns=['GLBDOMAIN','2019-06-01 19:30']
(6)对dataframe的每一行分别进行归一化,先对数据进行行列转置,然后在对每一列进行归一化处理
def regularit(df):
newDataFrame = pd.DataFrame(index=df.index)
columns = df.columns.tolist()
for c in columns:
d = df[c]
MAX = d.max()
MIN = d.min()
newDataFrame[c] = ((d - MIN) / (MAX - MIN)).tolist()
return newDataFrame
##########
data_1930_df=data_1930_df.T
data_1930_df=regularit(data_1930_df)
(7)统计次数并且修改列名
peakPOP_num_df=peakPOP_df.groupby(['date','POP英文名'])[['POP英文名']].size().reset_index(name='counts')
这篇关于python之dataframe需要注意的细节的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!