洛伦兹曲线(Lorenz curve)也叫提升图或收益曲线

提升图主要通过随机选择比较模型表现。



绿色曲线比黄色曲线更加不平衡

基尼系数=A/(A+B)

A+B为正方形一半恒定面积,A区间面积越大,基尼系数越大

Lift, Lift Table, and Lift Chart

提升指数、提升表和提升图

  1. 什么是Lift?

I) Lift(提升指数)是评估一个预测模型是否有效的一个度量;这个比值由运用和不运用这个模型所得来的结果计算而来。

II) 一个简单的数字例子:

i. 比如说你要向选定的1000人邮寄调查问卷。以往的经验告诉你大概20%的人会把填好的问卷寄回给你,即1000人中有200人会对你的问卷作出回应(response),用统计学的术语,我们说baseline response rate是20%;

ii. 如果你现在就邮寄问卷,1000份你期望能收回200份,这可能达不到一次问卷调查所要求的回收率,比如说工作手册规定邮寄问卷回收率要在25%以上;

iii. 通过以前的问卷调查,你收集了关于问卷采访对象的相关资料,比如说年龄、教育程度之类。利用这些数据,你确定了哪类被访问者对问卷反应积极。假设你已经利用这些过去的数据建立了模型,这个模型把这1000人分了类,现在你可以从你的千人名单中挑选出反应最积极的100人来,这10%的人的反应率(response rate)为60%。那么,对这100人的群体(我们称之为Top 10%),通过运用我们的模型,相对的提升(gain or lift value)就为60%/20%=3;换句话说,与不运用模型而随机选择相比,运用模型而挑选有3倍的好处;

iv. 类似地,对占总样本的任何比例的人群,我们都可以计算出相应的提升指数,比如说我们可以计算Top 20%的群体的提升指数。

III) 一个结论就是,提升指数越大,模型的运行效果越好。

  1. 建立Lift Table 的步骤(并画出Lift Chart),以验证信用评分模型为例:

I) 利用已经建立的评分模型,对我们要验证的样本进行评分。样本下的每一个个体都将得到一个分数,或者是违约概率,或者是一个分值;

II) 对样本按照上面计算好的分数进行降序排序;

III) 把已经排好序的样本依次分成10个数量相同的群体,我们就建立了一个叫decile的变量,它依次取10个值,1、2、3、4、5、6、7、8、9、10,diclie1包括违约概率值较高的10%的个体,diclie2包括下一个10%的群体,以此类推;

IV) 帐户总数是每个decile下的样本数,它是整个样本数的10%;

V) 边际坏账数是每个decile内违约的人数,就是说,利用我们的评分模型,在decile1,有25个人违约,以此类推;

VI) 累计坏账数,45表明前两个decile内共有45个人违约,以此类推;

VII) 边际坏账率是每个decile内坏账的比率。对decile1,边际坏账率由25/100得来;

VIII) 对每一个加总的decile,都计算一个累计坏账率,比如说,对前两个decile,也就是整个样本的20%,累计坏账率等于(25+20)/(100+100);

IX) 在每个decile里,提升指数(Lift)就是相应的累计坏账率与平均坏账率的偏离程度,计算公式是(累计坏账率-平均坏账率)/平均坏账率,习惯上还会乘上一个100。

X) 注:在一些处理中,提升指数直接由每个decile的累计坏账率除以平均坏账率得来,它们之间就相差1,一个是相对偏离,一个是偏离。

XI) 就我们考察的信用评分模型,它的目的就是尽可能把人群区别来开来,比如说“好”的顾客、 “坏”的顾客。提升指数越大,表明模型运作效果越好。

表1:Lift Table

欢迎各位同学学习python金融风控评分卡模型和数据分析微专业课
https://edu.51cto.com/sd/f2e9b

©著作权归作者所有:来自51CTO博客作者PythonEducation的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 算法与数据结构-综合提升 C++版
  2. 一次内存性能提升的项目实践
  3. 装机必备!网页管理Chrome扩展四大神器,让浏览器效率提升十倍!
  4. 数据挖掘入门指南!!!
  5. 太赞了!机器学习基础核心算法:贝叶斯分类!(附西瓜书案例及代码实现)
  6. CV学习笔记(二十九):活体检测总结②
  7. 小白跟学系列之手把手搭建NLP经典模型(含代码)
  8. 小白跟学系列之手把手搭建NLP经典模型-2(含代码)
  9. 师妹问我:如何在7分钟内彻底搞懂word2vec?

随机推荐

  1. php的use和require的区别
  2. php实现简单MVC
  3. PHP数组合并之array_merge和数组相加
  4. PHP操作数据库
  5. php代码连不上mysql
  6. php final关键字的应用
  7. php错误屏蔽
  8. PHP开发APP接口全过程(二)
  9. 30 个 php 操作 redis 常用方法代码示例
  10. 用php生成HTML文件的类