本文主要是介绍处理数据失衡问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
首先看一组失衡数据:
这组数据01比率严重失调这会对我们以后的预测值大大减小所以我们需要对它进行处理
#进行失衡处理
perc.over=100:表示少类别样本数=151+151*100%=302
perc.under=200:表示多类样本数(新增少数样本数200%=151200%=302)
hyper_new <- SMOTE(target~.,hyper,perc.over = 100,
perc.under = 200)
利用SOMTE函数可以对我们的两组数据进行处理
最后会形成两组是1:1的情况
如果不想是1:1可以根据改变perc.over和perc.under的参数来处理二者分别代表网上调比例和往下调比例
这篇关于处理数据失衡问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!