本文主要是介绍[Sklearn应用] Preprocessing data (三)编码分类特征 Encoding categorical features,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
此内容在sklearn官网地址: http://scikit-learn.org/stable/modules/preprocessing.html#
sklearn版本:0.18.2
one-hot-encode
有时特征内容并不是数值,而是字符串类型。如果直接将字符串转成一个对应的数值,造成原本的特征具有大小关系。这是需要使用 one-hot-encode编码格式。
两种转化方式:
- pandas.get_dummies():常用方法,功能强大,操作简单;
- sklearn.preprocessing.OneHotEncoder():用法复杂且易报错,较少使用。
pandas.get_dummies(data, columns=["one",
这篇关于[Sklearn应用] Preprocessing data (三)编码分类特征 Encoding categorical features的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!