本文主要是介绍sklearn.preprocessing 特征编码汇总,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文章目录
- 常见特征种类
- one-hot编码
- 特征哈希(`Feature hashing`)
- 基于统计的类别编码
- 对循环特征的编码
- 目标编码(Target encoding)
- K折目标编码(K-Fold Target encoding)
用于数据分析的特征可能有多种形式,需要将其合理转化成模型能够处理的形式,特别是对非数值的特征,特征编码就是在做这样的工作。
常见特征种类
- 二值数据:只有两种取值的变量(不一定是0/1,但是可以映射到{ 0 , 1 } {0,1}{0,1}上)
- 类别数据:多类的数据,如星期一/星期二/…,不一定是非数值的
- 有序数据:如对电影的打分,分数之间是有大小关系的
- 标称(
No
这篇关于sklearn.preprocessing 特征编码汇总的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!