《机器学习中的不平衡分类方法》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:康琦,吴启迪著
  • 出 版 社:上海:同济大学出版社
  • 出版年份:2017
  • ISBN:9787560869803
  • 页数:185 页
图书介绍:本书共12章,主要讲述不平衡分类学习的基本理论、特征选择与降维学习、模型评估与选择、重采样与代价敏感学习、贝叶斯分类器、决策树与随机森林、集成学习与强化学习等重要的不平衡分类学习方法,为不平衡分类问题提供了新的解决方法和思路,具有一定的理论研究和工程参考价值。本书适合计算机科学、信息科学、大数据科学等领域以及相关工程技术人员,对机器学习感兴趣的其他人员也能从中受益。

第1章 绪论 1

1.1 概述 1

1.2 分类问题概述 1

1.3 不平衡分类问题概述 2

1.4 研究背景 2

1.5 发展历程 3

1.6 应用现状 5

参考文献 6

第2章 模型评估与选择 8

2.1 训练误差与测试误差 8

2.2 过拟合与欠拟合 9

2.3 模型选择 10

2.4 评估方法 11

2.5 假设检验 14

2.5.1 T-test检验 14

2.5.2 Wilcoxon秩和检验 15

2.5.3 方差分析(ANOVA) 15

第3章 不平衡分类学习策略 17

3.1 重采样策略 17

3.1.1 经典过采样技术 17

3.1.2 经典欠采样方法 18

3.2 代价敏感学习 19

3.3 单类别学习 20

3.4 集成学习方法 20

3.5 新型采样策略 21

3.5.1 基于KNN降噪滤波的不平衡分类框架 21

3.5.2 KNN噪声滤波器 22

3.5.3 基于欠采样方法的KF噪声滤波器 22

3.5.4 算法复杂度分析 24

3.5.5 实验与结果分析 24

3.5.6 基于迭代分割滤波器的降噪不平衡分类算法 32

参考文献 34

第4章 贝叶斯分类器 35

4.1 贝叶斯理论 35

4.1.1 条件概率和乘法公式 35

4.1.2 全概率公式和贝叶斯公式 35

4.1.3 极大后验假设与极大似然假设 36

4.1.4 事件的独立性 36

4.2 朴素贝叶斯分类器 37

4.2.1 朴素贝叶斯分类器描述 37

4.2.2 性能分析 39

4.2.3 NBC特征分析 41

4.3 代价敏感朴素贝叶斯分类器 41

4.3.1 二类不平衡分类 41

4.3.2 多类不平衡分类 43

4.4 参数选择 44

4.4.1 二类不平衡分类 44

4.4.2 多类不平衡分类 45

4.5 仿真实验与比较分析 45

4.5.1 二类不平衡分类 45

4.5.2 多类不平衡分类 48

4.6 本章小结 56

参考文献 57

第5章 决策树与随机森林 58

5.1 基本流程 58

5.1.1 决策树定义及结构 58

5.1.2 决策树学习步骤 58

5.2 划分选择 59

5.2.1 信息增益 59

5.2.2 增益率 59

5.2.3 基尼基数 60

5.3 剪枝处理 60

5.4 随机森林 60

5.5 随机森林集成 62

5.5.1 融合的基本原则 62

5.5.2 不平衡数据的模型集成方案 62

5.6 本章小结 64

参考文献 64

第6章 支持向量机 65

6.1 支持向量机原理 65

6.1.1 超平面与几何间隔最大化 65

6.1.2 拉格朗日对偶函数 67

6.1.3 核函数的引入 68

6.2 序列最小优化算法 70

6.3 不平衡分类SVM研究 71

6.4 基于距离的多子域加权欠采样SVM算法 71

6.4.1 基于几何间距的多子域加权欠采样算法 71

6.4.2 WU-SVM算法 73

6.4.3 小结 75

6.5 基于GA过采样的SVM算法 76

6.5.1 基于GA的过采样 76

6.5.2 递归支持向量机(R-SVM) 76

6.5.3 GR-SVM算法 77

6.6 WU-SVM仿真实验与结果分析 78

6.6.1 二类不平衡分类 78

6.6.2 多类不平衡分类 88

6.7 本章小结 90

参考文献 90

第7章 集成学习与强化学习 92

7.1 个体与集成 92

7.2 Boosting 93

7.3 Bagging 95

7.4 强化学习 96

7.4.1 强化学习的基本元素 97

7.4.2 策略选择 98

7.4.3 有模型学习 99

7.4.4 免模型学习 100

7.5 本章小结 102

参考文献 102

第8章 遗传规划分类 104

8.1 进化计算基本理论 104

8.2 遗传规划理论 106

8.2.1 遗传规划基本流程 106

8.2.2 遗传规划的特点 107

8.2.3 个体表示和适应度函数 107

8.2.4 种群的产生方法 108

8.2.5 遗传操作 109

8.2.6 终止准则与结果判定 110

8.3 遗传规划分类器 111

8.3.1 遗传规划分类模型 111

8.3.2 两类问题 112

8.3.3 多类问题 114

8.4 遗传规划分类器集成 115

8.4.1 利用遗传规划进行集成的基本原理 115

8.4.2 遗传规划集成学习的相关设置 116

8.4.3 算法描述 117

8.5 遗传规划不平衡分类器 118

8.5.1 多目标遗传规划 118

8.5.2 不平衡分类问题中的多目标问题 119

8.5.3 基于多目标的遗传规划用于不平衡分类 120

8.6 遗传规划用于不平衡分类实例 120

8.6.1 MOGP进化搜索算法 120

8.6.2 分类器集成选择 121

8.6.3 实验结果 122

8.6.4 分类器集成改进 124

8.7 本章小结 124

参考文献 124

第9章 非平稳环境学习 126

9.1 非平稳环境下的变化检测 126

9.1.1 检测变量与检验方法 126

9.1.2 非平稳环境检测的最新研究进展 130

9.2 增量式学习算法的研究 130

9.2.1 增量学习方式 131

9.2.2 最新动态 134

9.2.3 经典测试数据集及评估指标 135

9.3 本章小结 137

参考文献 137

第10章 迁移学习 139

10.1 迁移学习 139

10.2 迁移学习类型 140

10.2.1 同构迁移学习 140

10.2.2 异构迁移学习 140

10.3 迁移学习方法 141

10.3.1 实例权重法 141

10.3.2 特征表示法 142

10.3.3 参数迁移法 148

10.3.4 知识关联法 149

10.4 迁移学习运用 149

10.5 本章小结 150

参考文献 151

第11章 典型应用案例 153

11.1 网络入侵检测 153

11.1.1 背景 153

11.1.2 网络入侵检测数据 153

11.1.3 GA过采样 154

11.1.4 SVM参数寻优 154

11.1.5 特征提取分析 157

11.1.6 实验结果及分析 157

11.2 医疗诊断 160

11.2.1 不平衡分类在医疗诊断中的应用 160

11.2.2 乳腺癌诊断 161

11.2.3 仿真结果与分析 162

11.3 短文本分类 163

11.3.1 短文本分类概述 163

11.3.2 文本表示相关的主要模型 163

11.3.3 特征降维 165

11.3.4 基于WU-SVM的短文本分类 168

11.3.5 小结 174

第12章 人工智能平台——AIThink 175

12.1 AIThink平台介绍 175

12.2 平台功能及用途 176

12.3 平台内容 178