信贷评分卡

2024-02-02 13:18
文章标签 评分 信贷

本文主要是介绍信贷评分卡,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

信贷评分卡

96
eryesanye 关注
2017.09.07 13:51* 字数 1858 阅读 960 评论 2

年初的时候,我参考SAS评分卡指南整理了一份如何设计评分卡的文档,后来请同事用 R语言重新写了一遍。评分卡还有一个很高大上的名字,叫规则引擎。按说规则引擎要复杂得多,至少还要有模型性能评估与监测、模型管理等内容,但在国内,无论是监管部门还是信贷机构,对风控模型的管理要求都不高,所以很多信贷机构、特别是非银信贷机构的规则引擎里,除了评分卡之外,就没有其他内容了。

评分卡是什么样子的?

摘自:http://www.sas.com/technologies/analytics/datamining/miner/trial/,下同

上图是一个典型的贷前审批评分卡。

有三个特征:年龄、居住情况、收入。每个特征又分为若干个属性,例如,居住情况有两个属性,自有房或租房。

如果一名新用户来申请贷款,年龄35岁,收入38K,有房,对应的信用分数分别是210、225、225,加起来等于660。该信贷机构定义600以上授信,600以下不授信,因此该机构会给这名用户授信。

那么,问题来了。。。

所以,评分卡设计围绕三个问题开展:

- Attributes : 如何对年龄、收入这样的连续变量进行分组?

- Score Points :有了分组的结果后,每个分组应该给多少信用分?

- Cut-off : 如何定义一个合适的授信门槛分数?

如何对变量进行分组?

这个问题有点难,为什么这么说呢?不同的分组方法会影响评分卡的性能,其中最重要的一个性能是,评分卡可以尽可能地拒绝潜在的违约申请者。

SAS 给变量分组起了一个很好听的名字:Interactive Grouping Node (IGN),交互式分组节点。

在没有科学分组之前,“机械式”分组方法是比较常用的做法,例如,年龄每隔10年分一组,收入每两万元为一组等等。但这种分组并没有考虑对评分卡性能的影响。实际上,有些分组是可以合并的,而有些分组又必须得拆开。

例如,假设15岁~25岁区间的违约率和26岁~35岁区间的违约率相同,那为什么不合并为一个区间呢?收入1万~3万区间违约率在2万5有一个突然的下降,那是不是在2万5这个点重新分组比较合理呢?

于是,人们开始寻找解决办法,设法建立变量分组和评分卡性能之间的关系。变量分组可以有无数种方案,哪一种方案最能改善评分卡性能呢?也就是说我们需要一种测量工具,帮助我们对每一种方案进行评估,然后确定最好的分组方案。

好在信息论领域给我们提供了一些很好的测量工具。例如:

- WOE:Weight of Evidence 证据权重值

- IV:Information Value 信息价值

- GINI:基尼系数

还有很多工具,例如熵指数等等。这里只讲 WOE 和 IV,这也是 SAS 进行变量分组的默认工具。

WOE 公式、IV 公式

举例说明 WOE 和 IV 的计算:

21岁~24岁区间,有 82 个好用户,在全部好用户中占 82/700 = 0.11714,有 52 个坏用户,在全部坏用户中占 52/300 = 0.17333,那么WOE = ln (0.11714/0.17333) x 100 = -39.18,WOE 越小越好,表明这个分组可以更有效地识别出坏用户。年龄的 IV 等于 0.089。IV 的标准如下:

IV 的标准并非绝对的

计算 IV 的目的是保留对性能提升有帮助的变量,删除影响较小的变量。如下图所示。

然后才到了对变量进行分组的步骤,如下图所示。

经过反复的精细分组,得到单调的WOE曲线,如下图所示。

如何给变量分组赋分?

截止到变量分组,所有的工作都还是数据预处理,包括数据清洗、变量分组、特征工程等等,这些工作是极其重要的工作,SAS 的评分卡指南有41页,其中27页是描述数据预处理的,差不多占了67%的篇幅。

变量分组和信用分数之间是靠模型联系在一起的,SAS 使用的是 Logistic 回归模型,这是工业界常用的一种算法。以某信贷机构评分卡为例。

WOE、模型系数、Score之间的关系

我们千辛万苦搞定变量分组,引入了能够和评分卡性能提升扯上关系的 WOE,但我们发现这还不够,还得引入模型,而模型的好坏又间接地影响了评分卡性能。

怎么评价模型好坏呢? 有很多工具可以评价模型好坏。例如杠杆比。如下图所示。

如果模型有效,排序后的申请者中,一定百分位应该包含大部分需要被拒绝的用户

或者观察odds和信用得分的关系,如下图所示。

odds 和信用分数呈单调关系,说明模型是有效的

我们解释了变量分组问题,引入了 WOE,然后通过建模,解决了变量分组转化为信用分数的问题。里面有很多细节,需要用到不同的工具。这里只讲了 SAS 的作法,其实还有很多方法。我们来解决最后一个问题:

授信门槛分数(Cutoff Score)是怎么算出来的?

Cut-off Score 与 KS 之间的关系,通常选择曲线最高点对应的 Cutoff -Score

关于评分卡的讨论

评分卡是舶来品,对信用基础数据有一定要求,国内信用基础数据建设刚刚起步,开发出一个可以应用的评分卡,还有很多困难,但设计思路大体一致,都是设法对申请人的还款能力和还款意愿进行定量评估。除了上面提到的算法,非监督算法、贝叶斯算法、深度学习算法等都可以用来开发评分卡。

除了要关注算法,还要关注业务和产品。不同产品的风险是不同的,例如,1000元以下现金贷和6000元以下现金贷的违约风险是不同的,不同获客渠道的申请人违约风险是不同的。评分卡和模型都是风险测量工具,整个风控体系是由数个评分卡及相应的策略(新产品设计、审批、账户管理、催收、核销)组合而成,维持各个环节的平衡并不是一件很容易的事情。


参考

http://www.sas.com/technologies/analytics/datamining/miner/trial/

http://www.statsoft.com/Textbook/Credit-Scoring

L. C. Thomas, Jonathan Crook, David Edelman, Lyn Thomas (2002) Credit Scoring & Its Applications

Building Credit Scoring Models with SAS ® Enterprise Miner

Anderson, R. The Credit Scoring Toolkit. Oxford University Press, 2007

这篇关于信贷评分卡的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/670816

相关文章

使用Python实现智能信用评分系统

1. 项目简介 本教程将带你一步步实现一个智能信用评分系统。我们将使用Python和一些常用的深度学习库,如TensorFlow和Keras。最终,我们将实现一个可以预测信用评分的模型。 2. 环境准备 首先,你需要安装以下库: TensorFlowKeraspandasnumpyscikit-learn 你可以使用以下命令安装这些库: pip install tensorflow

18044 成绩等级评分

### 思路 1. 从键盘输入一个整数成绩。 2. 判断成绩是否在0到100之间:    - 如果不在范围内,输出“error”。    - 如果在范围内,根据成绩范围输出对应的等级:      - 90分以上为A      - 80到89分为B      - 70到79分为C      - 60到69分为D      - 60分以下为E ### 伪代码 1. 读取输入的整数成绩。 2. 判

考试评分系统设计与实现/基于django的在线考试系统

摘要 随着互联网技术的不断发展,各行各业的工作学习的模式都发生了不小的变化,们通过互联网技术不仅能够提高工作效率还能够降低出错的几率。而对于考试评分,一个专业的系统可以帮助管理者更加有效管理在考试评分,可以帮助提高克服人工管理带来的错误等不利因素。所以一个优秀的考试评分系统能够带来很大的作用。 本考试评分系统使用了计算机语言Python和存放数据的仓库MySQL。本系统使用了框架Django和V

怎么选开放式耳机?五款高评分爆款机型汇总!

蓝牙耳机广为人知,而对耳机有更多了解的人可能也听说过开放式耳机。这类耳机的优势在于它们不会完全堵塞耳道,允许用户在享受音乐的同时,也能感知周围环境的声音,这对于骑行或跑步时尤为重要,因为它有助于保持对周围环境的警觉。同时,开放式耳机在通话时也能提供一定程度的隐私保护。尽管如此,许多人可能对如何选择高质量的开放式耳机感到困惑。我将推荐几款优质的开放式耳机,希望对你们有所帮助。 开放式耳机选

【Material-UI】Rating组件:如何使用Basic Rating实现多种评分方式

文章目录 一、`Rating` 组件概述1. 组件介绍2. `Basic rating` 的核心功能 二、`Basic rating` 的详细使用方法1. 受控组件(Controlled)2. 只读模式(Read-only)3. 禁用状态(Disabled)4. 无评分状态(No rating given) 三、`Basic rating` 的应用场景与最佳实践1. 产品或内容评分2. 交互

信贷业务流程优化与风控系统深度集成

一、申请提交:多渠道便捷接入 资金需求者可通过多样化的渠道(APP、官方网站、线下门店等)轻松提交贷款申请,实现申请流程的便捷与高效。 二、智能审批:自动化与人工智慧的融合 系统采用先进的自动化技术与专业人工审核相结合的方式,对贷款申请进行初步筛选与深入审批。这一过程确保了审批的准确性和效率。 三、策略判断:精准风控,深度洞察 基于精心设计的风控策略,系统运用SQL、SAS、Python等工具

打卡学习Python爬虫第五天|使用Xpath爬取豆瓣电影评分

思路:使用Xpath爬取豆瓣即将上映的电影评分,首先获取要爬取页面的url,查看页面源代码是否有我们想要的数据,如果有,直接获取HTML文件后解析HTML内容就能提取出我们想要的数据。如果没有则需要用到浏览器抓包工具,二次才能爬取到。其次观察HTML代码的标签结构,通过层级关系找到含有我们想要的数据的标签,提取出数据。最后保存我们的数据。   1、获取url 这里我们可以看到,有的电影是

2010-2022年 上市公司彭博ESG披露评分、分项得分(披露评分、ESG披露评分、环境披露评分、社会信息披露评分、治理披露)

彭博ESG披露评分是彭博公司推出的评估工具,用于衡量全球上市公司在环境(E)、社会(S)和公司治理(G)方面的信息公开程度。评分依据公司年报和可持续发展报告等公开文件,满分为100分。原始数据涵盖2010至2022年间的披露评分及其分项得分。 数据指标  股票代码、年份、 ESG 、 E 、 S 、 G、代码、简称、ESG披露评分、环境披露评分、社会信息披露评分、治理披露评分。 https:

(分析篇章)从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系

从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(分析篇章) 流程说明: 分析流程的输入同样是网站的文章ID。借助Workflow内置的HTTP调用节点和代码节点,我们能够方便地调用网站的API,从而获取到文章的元数据(涵盖标题、来源、链接、语言等信息)以及全文内容。为了确保不遗漏文章中的任何关键信息,分析流程首先会判断文章的长度。如果文

评分卡构建学习

关于评分卡构建的学习,复现实验。参考文章:基于Python的信用评分卡模型分析(一)(二) 虽然是重现但还是很激动呀~ 利用jupyter notebook中代码断点运行的特点,非常方便学习和做笔记。 我将数据集中的属性名称转换为中文,便于观察,代码打印了许多中间结果,便于自己理解评分卡构建的整体过程。难点在于,分箱和分数计算(公式还在琢磨) 数据处理和分析 import panda