权数专题

6、特征选择(filter):WOE迹象权数与IV值检验

WOE(Weight of Evidence)迹象权数,表示当前分箱中好坏客户的各自占总体好坏客户比例的差异,描述了预测变量与目标变量之间的关系。   IV(information value)信息值,又称VOI(Value Of Information),用来表示变量预测能力的强度,可用于单变量筛选。   其数学表达为: I V = ∑ i = 1 N I V i = ∑ i =

负权数

1 问题描述 当我们写一个10进制正数时,其值可以用各位的数码乘以10的幂来表示。例如: 123=1 +2 +3        一般来说,对R进制数N,其绝对值可以表示为: N= 这里R可以是正数也可以是负数。当R是负数时,我们称之为负权数。使用负权数的一个好处是在表示负数时,我们不需要用到符号“-”。举例来说,10进制-15用-2进制数来表示就是110001。

迹象权数WOE、信息值IV、kS值、GINI系数

WOE和IV使用来衡量变量的预测能力,值越大,表示此变量的预测能力越强。 WOE=ln(累计正样本占比/累计坏样本占比) IV=(累计正样本占比-累计坏样本占比)*WOE 信息值(IV)预测能力<0.03无预测能力0.03~0.09低0.1~0.29中0.3~0.49高0.5~极高 KS和GINI系数用来衡量数据对好坏样本的区分能力 KS 值,累计客户分布百分比,由小到大排列,两者之间的