本文主要是介绍数据预处理-独热编码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
独热编码
- 介绍
- 优点
- 举例说明
介绍
独热编码通常是用来处理稀疏而又散乱的分布空间的数值。其方法是使用N状态寄存器来对N个状态进行编码,每个状态都有独自的寄存器位,在任意时候只有一位有效,只有一位是1,其余的都为0。
优点
1.能够处理非连续型数值特征。
2.在一定程度上也扩充了特征,比如:将性别这个特征经过独热编码后变为男、女这两个特征。
举例说明
在数字0-9中,6的独热编码为0000001000。
也就是说对一个特征进行独热编码的时候,这个特征含有多少个数值,就将其映射到几维的空间里,如:教育等级:小学教育、中学教育、高等大学教育。那么将其独热编码,结果为小学教育[0,0,1],中学教育[0,1,0],高等大学教育[1,0,0]。
参考文献:
https://blog.csdn.net/a595130080/article/details/64442800
如果文章有什么错误的地方,欢迎在评论区留言,感谢大家的支持。
这篇关于数据预处理-独热编码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!