本文主要是介绍样本不平衡--SMOTE算法-学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1 SMOTE算法的简单理解
一个数集中的数据是分布在特征空间中的,假设数据是2维的,那么数据的就是一个平面上的点。对于类别不平衡数据来说,假设负样本数据是少量的,那么这个数据只占据了空间的一小部分。SMOTE 算法就是对这些小样本数据占据的空间中进行插值。 而不影响到正样本的空间。
2 如何插值
SMOTE算法采取了一种策略,选择两个距离接近的点进行插值。
这篇关于样本不平衡--SMOTE算法-学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!