第1章 服刑人员再犯罪预测 1
1.1 服刑人员再犯罪概述 1
1.1.1 再犯罪概念的界定 1
1.1.2 再犯罪危险的界定 6
1.1.3 服刑人员再犯罪现状 8
1.1.4 服刑人员再犯罪原因分析 10
1.1.5 服刑人员再犯罪防控新机制 13
1.2 服刑人员危险性评估 16
1.2.1 服刑人员危险性评估定义 17
1.2.2 国内服刑人员危险性评估 18
1.2.3 国外服刑人员危险性评估 21
1.3 服刑人员再犯罪预测 29
1.3.1 国外服刑人员再犯罪预测 30
1.3.2 国内服刑人员再犯罪预测研究 34
第2章 服刑人员再犯罪数据挖掘流程 37
2.1 服刑人员再犯罪数据挖掘概述 37
2.1.1 数据挖掘的定义 37
2.1.2 数据挖掘的对象 38
2.2 服刑人员再犯罪数据挖掘目标 43
2.2.1 数据挖掘目标的定义 43
2.2.2 数据挖掘方法 44
2.2.3 数据挖掘目标的团队构成 48
2.3 国外跨行业数据挖掘标准过程(CRISP-DM) 50
2.3.1 商业理解阶段 51
2.3.2 数据理解阶段 54
2.3.3 数据准备阶段 56
2.3.4 建模阶段 59
2.3.5 模型评估阶段 61
2.3.6 模型发布阶段 63
2.4 国内数据挖掘预测流程 66
2.4.1 定义问题 67
2.4.2 准备数据 68
2.4.3 选择模型 71
2.4.4 构建模型 73
2.4.5 评估与优化模型 81
2.4.6 部署模型 99
第3章 服刑人员再犯罪预测数据准备 101
3.1 服刑人员再犯罪数据的收集 101
3.1.1 认识数据 101
3.1.2 大数据 111
3.1.3 服刑人员再犯罪预测的数据源 127
3.1.4 大数据时代下的服刑人员再犯罪数据抽样 133
3.2 读取数据 136
3.2.1 从CSV文件中读取数据 137
3.2.2 从Microsoft Excel文件中读取数据 140
3.2.3 从XML文件中读取数据 141
3.2.4 从JSON数据源读取数据 143
3.2.5 从数据库文件中读取数据 143
3.3 服刑人员再犯罪数据质量分析 144
3.3.1 数据质量分析指标 145
3.3.2 数据质量基本理论 146
3.3.3 数据质量分析 154
第4章 数据预处理 158
4.1 数据预处理概述 158
4.2 数据清洗 160
4.2.1 缺失数据处理 161
4.2.2 冗余数据处理 165
4.2.3 噪声数据处理 167
4.3 数据集成 171
4.3.1 数据集成基本类型 171
4.3.2 数据集成存在的问题 172
4.3.3 数据集成方法 174
4.4 隐私数据脱敏 177
4.4.1 隐私数据泄露类型 178
4.4.2 隐私数据脱敏概述 179
4.4.3 服刑人员隐私数据脱敏算法 182
4.4.4 数据脱敏方法 187
4.4.5 大数据脱敏平台 190
4.5 数据变换 191
4.5.1 简单函数变换 191
4.5.2 数据标准化 192
4.5.3 特征离散化 196
4.6 数据规约 205
4.6.1 维数灾难与过拟合 206
4.6.2 维规约 213
4.6.3 数值规约 220
第5章 服刑人员再犯罪数据挖掘建模 224
5.1 服刑人员再犯罪数据挖掘概述 224
5.2 关联规则挖掘 227
5.2.1 关联规则挖掘概述 227
5.2.2 Apriori算法 232
5.2.3 FP-Growth算法 237
5.3 回归分析方法 245
5.3.1 回归分析方法概述 246
5.3.2 线性回归 248
5.3.3 非线性回归 252
5.3.4 回归方法检验 254
5.4 分类方法 254
5.4.1 分类方法概述 255
5.4.2 逻辑回归 256
5.4.3 K近邻分类 260
5.4.4 贝叶斯分类 265
5.4.5 支持向量机 269
5.4.6 决策树分类 285
5.4.7 神经网络分类 300
5.5 集成学习 312
5.5.1 集成学习概述 312
5.5.2 Bagging 316
5.5.3 Boosting 320
5.5.4 Stacking 324
5.6 聚类分析方法 329
5.6.1 聚类分析方法概述 329
5.6.2 聚类分析方法 330
5.6.3 相似度的度量 331
5.6.4 K-means聚类 333
5.6.5 K-medoids聚类算法 338
5.6.6 聚类分析总结 340
5.7 基于离群点检测的服刑人员安全监管改造分析 341
5.7.1 离群点概述 341
5.7.2 离群点类型 342
5.7.3 离群点检测方法 343
第6章 基于大数据挖掘的服刑人员再犯罪预测 349
6.1 基于大数据的服刑人员危险性预测研究 349
6.1.1 监狱监管改造安全的现状 350
6.1.2 服刑人员再犯罪预测与危险性评估 351
6.1.3 监狱大数据分享中的隐私保护 354
6.1.4 基于大数据的服刑人员危险性识别与预测 357
6.1.5 未来展望 365
6.2 机器学习模型在预测服刑人员再犯罪危险性中的效用 366
6.2.1 服刑人员危险性评估现状 366
6.2.2 机器学习模型 369
6.2.3 机器学习模型数据源 374
6.2.4 经典机器学习模型在预测服刑人员再犯罪危险性中的效用 375
6.2.5 未来展望 383