本文主要是介绍特征工程(归一化、特征编码、特征组合、数据扩充),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
特征工程
- 归一化
- 特征编码
- 组合特征
- 数据扩充
归一化
- 为什么要归一化
直观操作是将各维特征转到同一个量级,平均对学习器的权重,同时还能加快基于梯度下降算法的收敛速度 - 归一化适用范围
归一化在基于梯度下降的算法(SVM, DNNs)中能起到以上作用,不适用于决策树模型,决策树学习基于信息增益 - 常见归一化方法
- 线性函数归一化 f n o r m = ( f − f m i n ) / ( f m a x − f m i n ) f_{norm}=(f-f_{min})/(f_{max}-f_{min}) f
这篇关于特征工程(归一化、特征编码、特征组合、数据扩充)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!