第1章 评分卡的开发过程 1
1.1 标准评分卡 1
1.2 评分卡开发流程 5
1.3 问题准备 6
1.4 数据获取与整合 6
1.5 EDA与数据描述 7
1.6 数据准备 7
1.7 变量选择 8
1.8 模型开发 9
1.9 模型验证 9
1.10 评分卡创建和刻度 10
1.11 评分卡实施 10
1.12 拒绝演绎 10
1.13 监测和报告 11
1.14 关于SAS代码的注意事项 11
第2章 数据获取和整合 15
2.1 引言 15
2.2 变量类型 15
2.3 建模(数据挖掘)视图 16
2.4 数据来源 18
2.5 建模和实施窗口 19
2.6 数据校准 19
2.7 数据合并 21
2.8 数据整合 26
2.9 完整性检验 29
第3章 EDA和数据描述 32
3.1 引言 32
3.2 单变量统计量 33
3.3 变量分布 36
3.4 特征分析 38
3.5 列联表 40
3.6 极端值的识别 43
第4章 预测力指标 51
4.1 引言 51
4.2 符号 53
4.3 皮尔森相关系数 57
4.4 斯皮尔曼相关系数 60
4.5 皮尔森卡方统计量 62
4.6 似然比检验统计量 65
4.7 概率比 67
4.8 F检验 73
4.9 基尼方差 74
4.10 熵方差 79
4.11 信息值 81
4.12 变量选择的自动化 83
第5章 数据准备 90
5.1 引言 90
5.2 降低基数 91
5.3 连续变量的分段 96
5.4 抽样和权重计算 99
第6章 信用卡样本数据集 106
6.1 引言 106
6.2 数据字典 106
第7章 logistic回归 109
7.1 引言 109
7.2 基本公式 109
7.3 似然方程 113
7.4 信息矩阵 116
7.5 参数估计 118
7.6 模型拟合统计量 121
7.7 Hosmer-Lemeshow检验 124
7.8 全局零假设的检验 126
7.9 分数统计量 128
7.10 模型参数的解释 128
7.11 概率比的置信区间 130
7.12 先验概率和权重 131
第8章 粗分类和WOE 132
8.1 引言 132
8.2 WOE的定义 132
8.3 WOE的含义 134
8.4 证据权重与标准评分卡 136
8.5 SAS实现 138
8.6 连续变量的WOE 139
第9章 变量选择的方法 145
9.1 引言 145
9.2 选择方法概述 145
9.3 逐步变量选择 149
9.4 强制变量进入模型 154
9.5 控制变量选择顺序 156
9.6 logistic回归的结果 157
第10章 模型评估 160
10.1 引言 160
10.2 验证和混合矩阵 161
10.3 提升图和洛伦兹曲线 166
10.4 基尼系数 170
10.5 K-S曲线和统计量 173
10.6 ROC曲线和c-统计量 175
10.7 整体模型评估 179
第11章 评分卡刻度和实施 181
11.1 标准格式 181
11.2 评分卡刻度 182
11.3 分值分配 184
11.4 SAS实施 187
11.5 设定临界值水平 195
第12章 监测和报告 198
12.1 报告的目的 198
12.2 稳定性报告 199
12.3 评分卡要素分析 202
第13章 拒绝演绎 204
13.1 定义和理由 204
13.2 拒绝演绎的方法 205
13.3 简单赋值法 206
13.4 强化法 208
13.5 拒绝演绎的应用 215
参考文献 216
附录 218