本文主要是介绍迹象权数WOE、信息值IV、kS值、GINI系数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
WOE和IV使用来衡量变量的预测能力,值越大,表示此变量的预测能力越强。
WOE=ln(累计正样本占比/累计坏样本占比)
IV=(累计正样本占比-累计坏样本占比)*WOE
信息值(IV) | 预测能力 |
<0.03 | 无预测能力 |
0.03~0.09 | 低 |
0.1~0.29 | 中 |
0.3~0.49 | 高 |
0.5~ | 极高 |
KS和GINI系数用来衡量数据对好坏样本的区分能力
KS 值,累计客户分布百分比,由小到大排列,两者之间的最大差距值即为KS值,其值越大表示模型的区分能力越强。
K-S值 | 解释能力 |
<0.20 | No |
0.21 ~0.40 | 低 |
0.41~0.50 | 中 |
0.51~0.60 | 高 |
0.61~0.75 | 极高 |
>0.9 | 太高,可能有问题 |
GINI系数
分别以纵轴及横轴表示分数由高至低及好坏客户的累积百分比,用以显示各分数下好坏客户的累积差异。
基尼系数 | 解释能力 |
0 | NO |
0~0.4 | 低 |
0.4~0.6 | 中 |
0.6~0.8 | 高 |
>0.8 | 极高 |
这篇关于迹象权数WOE、信息值IV、kS值、GINI系数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!