本文主要是介绍一文完全理解模型ks指标含义并画出ks曲线(包含代码和详细解释),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估, 指标衡量的是好坏样本累计分部之间的差值。
好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。
k s = m a x ( C u m . B i B a d t o t a l − C u m . G i G o o d t o t a l ) ks = max(\frac{Cum. B_i}{Bad_{total}} - \frac{Cum.G_i}{Good_{total}}) ks=max(BadtotalCum.Bi−GoodtotalCum.Gi)
上面是ks的简单介绍,相信大家看了这几句话和一个公式,肯定还是不懂ks到底是个什么。我也是研究了一下,终于搞清楚了ks的具体计算方式。搞清楚了计算方式后,ks的含义自然就清楚了。
下面我会详细讲解实现方法,相信如果你看完本文章,肯定可以理解ks。以下内容均为个人纯手打,难免有些疏漏,如有错误,请大家指出。
本文会介绍两种计算ks的方法:
第一种是我自己手动写代码实现的,可以帮助你理解ks含义;
第二种是sklearn模块里面的roc_curve函数计算,通过第一种方法理解了ks后,实际应用中使用第二种方法,更方便。
ks的计算流程
话不多说,先看代码,后面会解释代码,顺便解释清楚ks含义。
import numpy as np
import pandas as pddef ks(df, y_true, y_pre, num=10, good=0, bad=
这篇关于一文完全理解模型ks指标含义并画出ks曲线(包含代码和详细解释)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!