《基于大数据挖掘的服刑人员再犯罪预测》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:马国富著
  • 出 版 社:北京:中国政法大学出版社
  • 出版年份:2018
  • ISBN:9787562087304
  • 页数:384 页
图书介绍:监狱作为国家刑罚执行机关,既是法治建设的实践之地,更是法治文明的浓缩之所。新形势下,监狱的职能发生了重大变化,从而对监狱的管理水平提出了更高要求。而要想实现对服刑人员的科学性和精准性教育改造和监管,就必须更深入、更全面的掌握服刑人员的相关信息,这势必给监狱有限的警力造成更大的负担。随着监狱信息化建设在在监狱的深入推进,监狱积累了大量的数据,因此,利用数据分析、数据挖掘、模式识别、机器学习等大数据技术从监狱信息资源库、安防等系统及服刑人员的在监日常行为中收集服刑人员相关数据并整合成数据集,然后进行分析,提取模式和规律,建立模型来对服刑人员的再犯罪危险性进行模式识别、分类和预测,从而将有限的警力用于重点服刑人员,提高服刑人员的教育改造质量和监管水平。

第1章 服刑人员再犯罪预测 1

1.1 服刑人员再犯罪概述 1

1.1.1 再犯罪概念的界定 1

1.1.2 再犯罪危险的界定 6

1.1.3 服刑人员再犯罪现状 8

1.1.4 服刑人员再犯罪原因分析 10

1.1.5 服刑人员再犯罪防控新机制 13

1.2 服刑人员危险性评估 16

1.2.1 服刑人员危险性评估定义 17

1.2.2 国内服刑人员危险性评估 18

1.2.3 国外服刑人员危险性评估 21

1.3 服刑人员再犯罪预测 29

1.3.1 国外服刑人员再犯罪预测 30

1.3.2 国内服刑人员再犯罪预测研究 34

第2章 服刑人员再犯罪数据挖掘流程 37

2.1 服刑人员再犯罪数据挖掘概述 37

2.1.1 数据挖掘的定义 37

2.1.2 数据挖掘的对象 38

2.2 服刑人员再犯罪数据挖掘目标 43

2.2.1 数据挖掘目标的定义 43

2.2.2 数据挖掘方法 44

2.2.3 数据挖掘目标的团队构成 48

2.3 国外跨行业数据挖掘标准过程(CRISP-DM) 50

2.3.1 商业理解阶段 51

2.3.2 数据理解阶段 54

2.3.3 数据准备阶段 56

2.3.4 建模阶段 59

2.3.5 模型评估阶段 61

2.3.6 模型发布阶段 63

2.4 国内数据挖掘预测流程 66

2.4.1 定义问题 67

2.4.2 准备数据 68

2.4.3 选择模型 71

2.4.4 构建模型 73

2.4.5 评估与优化模型 81

2.4.6 部署模型 99

第3章 服刑人员再犯罪预测数据准备 101

3.1 服刑人员再犯罪数据的收集 101

3.1.1 认识数据 101

3.1.2 大数据 111

3.1.3 服刑人员再犯罪预测的数据源 127

3.1.4 大数据时代下的服刑人员再犯罪数据抽样 133

3.2 读取数据 136

3.2.1 从CSV文件中读取数据 137

3.2.2 从Microsoft Excel文件中读取数据 140

3.2.3 从XML文件中读取数据 141

3.2.4 从JSON数据源读取数据 143

3.2.5 从数据库文件中读取数据 143

3.3 服刑人员再犯罪数据质量分析 144

3.3.1 数据质量分析指标 145

3.3.2 数据质量基本理论 146

3.3.3 数据质量分析 154

第4章 数据预处理 158

4.1 数据预处理概述 158

4.2 数据清洗 160

4.2.1 缺失数据处理 161

4.2.2 冗余数据处理 165

4.2.3 噪声数据处理 167

4.3 数据集成 171

4.3.1 数据集成基本类型 171

4.3.2 数据集成存在的问题 172

4.3.3 数据集成方法 174

4.4 隐私数据脱敏 177

4.4.1 隐私数据泄露类型 178

4.4.2 隐私数据脱敏概述 179

4.4.3 服刑人员隐私数据脱敏算法 182

4.4.4 数据脱敏方法 187

4.4.5 大数据脱敏平台 190

4.5 数据变换 191

4.5.1 简单函数变换 191

4.5.2 数据标准化 192

4.5.3 特征离散化 196

4.6 数据规约 205

4.6.1 维数灾难与过拟合 206

4.6.2 维规约 213

4.6.3 数值规约 220

第5章 服刑人员再犯罪数据挖掘建模 224

5.1 服刑人员再犯罪数据挖掘概述 224

5.2 关联规则挖掘 227

5.2.1 关联规则挖掘概述 227

5.2.2 Apriori算法 232

5.2.3 FP-Growth算法 237

5.3 回归分析方法 245

5.3.1 回归分析方法概述 246

5.3.2 线性回归 248

5.3.3 非线性回归 252

5.3.4 回归方法检验 254

5.4 分类方法 254

5.4.1 分类方法概述 255

5.4.2 逻辑回归 256

5.4.3 K近邻分类 260

5.4.4 贝叶斯分类 265

5.4.5 支持向量机 269

5.4.6 决策树分类 285

5.4.7 神经网络分类 300

5.5 集成学习 312

5.5.1 集成学习概述 312

5.5.2 Bagging 316

5.5.3 Boosting 320

5.5.4 Stacking 324

5.6 聚类分析方法 329

5.6.1 聚类分析方法概述 329

5.6.2 聚类分析方法 330

5.6.3 相似度的度量 331

5.6.4 K-means聚类 333

5.6.5 K-medoids聚类算法 338

5.6.6 聚类分析总结 340

5.7 基于离群点检测的服刑人员安全监管改造分析 341

5.7.1 离群点概述 341

5.7.2 离群点类型 342

5.7.3 离群点检测方法 343

第6章 基于大数据挖掘的服刑人员再犯罪预测 349

6.1 基于大数据的服刑人员危险性预测研究 349

6.1.1 监狱监管改造安全的现状 350

6.1.2 服刑人员再犯罪预测与危险性评估 351

6.1.3 监狱大数据分享中的隐私保护 354

6.1.4 基于大数据的服刑人员危险性识别与预测 357

6.1.5 未来展望 365

6.2 机器学习模型在预测服刑人员再犯罪危险性中的效用 366

6.2.1 服刑人员危险性评估现状 366

6.2.2 机器学习模型 369

6.2.3 机器学习模型数据源 374

6.2.4 经典机器学习模型在预测服刑人员再犯罪危险性中的效用 375

6.2.5 未来展望 383