本文主要是介绍评分卡制作过程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1、明确目的,要用评分卡去对什么打分;
2、对数据进行分析:
- 对每一个变量进行分析。例如分析其缺失率,分析其缺失的原因,尤其是在多个变量缺失率相同的情况下,是否由于其他变量取某值而造成无法避免的缺失,如果是这样需要针对该种情况单独建模。例如申请借款时,企业(法人)用户通常不会填写“职业”、“工资”、“工作年限”等信息。所以这些信息通常为空,所以要考虑为企业(法人)用户单独建立评分卡模型;
- 明确哪些量构成自变量,即哪些量是“在样本拿到手之后就可以看到的”,哪些量是“在等待一段时间后才能获取”。例如待客订单的申请人填写的信息、贷款金额和使用期限信息、个人历史信用信息等属于样本拿到手之后就能获取的信息,而订单有没有卖出、降了几次价之后才卖出、从上线到卖出的时间间隔等属于在等待一段时间之后才能获取的信息,在等待一段时间之后才能获取的信息共同决定了样本应该打标为0还是1。
3、缺失值处理。计算缺失率,对于缺失率低的变量,如果该变量有值的样本与其他变量相馆较高,足以建立一个模型进行预测,则可建立模型进行预测;否则可根据情况,用众数、均值填充,或者单独赋一个值;
4、构造衍生变量。根据已知变量和实际情况构造对因变量可能有影响的衍生变量。构造衍生变量的时候,注意原始变量的数据类型和单位。
5、将样本分为训练样本、测试样本和跨期样本,用训练样本进行训练。
6、评分。评分的目的是为了便于对样本进行排序。如果样本量很大,则也应该给评分找一个较大的取值范围。反之亦然。
7、对于分类型变量,需要首先统计每个类别中“坏”样本所占的比重,然后根据比重对类别进行排序。
这篇关于评分卡制作过程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!