本文主要是介绍pandas 数据归一化以及行删除例程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
pandas 数据归一化以及行删除例程
#coding:utf8
import pandas as pd
import numpy as np
from pandas import Series,DataFrame# 如果有id列,则需先删除id列再进行对应操作,最后再补上
# 统计的时候不需要用到id列,删除的时候需要考虑
# delete row
def row_del(df, num_percent, label_len = 0):#print list(df.count(axis=1))col_num = len(list(list(df.values)[1])) - label_len # -1为考虑带标签if col_num<0:print 'Error'#print int(col_num*num_percent)return df.dropna(axis=0, how='any', thresh=int(col_num*num_percent))# 如果有字符串类型,则报错
# data normalization -1 to 1
# label_col: 不需考虑的类标,可以为字符串或字符串列表
# 数值类型统一到float64
def data_normalization(df, label_col = []):lab_len = len(label_col)print label_colif lab_len>0:df_temp = df.drop(label_col, axis = 1)df_lab = df[label_col]print df_labelse:df_temp = dfmax_val = list(df_temp.max(axis=0))min_val =
这篇关于pandas 数据归一化以及行删除例程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!