反独专题

pandas数据分析36——快速独热和反独热处理

做数据预处理的时候,很多文本分类变量需要变为数值型。 下面提供一些方法,就以最经典的泰但尼克号数据集作为例子。 先导包读取数据 import numpy as npimport pandas as pd data=pd.read_csv('train.csv')data=data.drop(columns=['Name','Ticket','Cabin'],axis=1)data['