
大数据风控
文章平均质量分 93
scxyz_
机器学习/深度学习/大数据风控/编程技巧/学习笔记
展开
-
【评分卡】评分卡入门与创建原则——分箱、WOE、IV、分值分配
本文主要讲“变量选择”“模型开发”“评分卡创建和刻度”变量分析首先,需要确定变量之间是否存在共线性,若存在高度相关性,只需保存最稳定、预测能力最高的那个。需要通过 VIF(variance inflation factor)也就是 方差膨胀因子进行检验。 变量分为连续变量和分类变量。在评分卡建模中,变量分箱(binning)是对连续变量离散化(discretization)的一种称呼原创 2017-11-22 17:41:59 · 102835 阅读 · 16 评论 -
一文完全理解模型ks指标含义并画出ks曲线(包含代码和详细解释)
KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估, 指标衡量的是好坏样本累计分部之间的差值。好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。 ——神秘的KS值和GINI系数上面是ks的简单介绍,相信大家看了这几句话,肯定还是不懂ks到底是个什么。我也是研究了比较久,终于搞清楚了ks的具体计算方式。搞清楚了计算方式后,ks的含义自然就清楚了。下面...原创 2019-01-31 11:44:20 · 78238 阅读 · 13 评论