机器学习中的不平衡分类方法PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:康琦,吴启迪著
- 出 版 社:上海:同济大学出版社
- 出版年份:2017
- ISBN:9787560869803
- 页数:185 页
第1章 绪论 1
1.1 概述 1
1.2 分类问题概述 1
1.3 不平衡分类问题概述 2
1.4 研究背景 2
1.5 发展历程 3
1.6 应用现状 5
参考文献 6
第2章 模型评估与选择 8
2.1 训练误差与测试误差 8
2.2 过拟合与欠拟合 9
2.3 模型选择 10
2.4 评估方法 11
2.5 假设检验 14
2.5.1 T-test检验 14
2.5.2 Wilcoxon秩和检验 15
2.5.3 方差分析(ANOVA) 15
第3章 不平衡分类学习策略 17
3.1 重采样策略 17
3.1.1 经典过采样技术 17
3.1.2 经典欠采样方法 18
3.2 代价敏感学习 19
3.3 单类别学习 20
3.4 集成学习方法 20
3.5 新型采样策略 21
3.5.1 基于KNN降噪滤波的不平衡分类框架 21
3.5.2 KNN噪声滤波器 22
3.5.3 基于欠采样方法的KF噪声滤波器 22
3.5.4 算法复杂度分析 24
3.5.5 实验与结果分析 24
3.5.6 基于迭代分割滤波器的降噪不平衡分类算法 32
参考文献 34
第4章 贝叶斯分类器 35
4.1 贝叶斯理论 35
4.1.1 条件概率和乘法公式 35
4.1.2 全概率公式和贝叶斯公式 35
4.1.3 极大后验假设与极大似然假设 36
4.1.4 事件的独立性 36
4.2 朴素贝叶斯分类器 37
4.2.1 朴素贝叶斯分类器描述 37
4.2.2 性能分析 39
4.2.3 NBC特征分析 41
4.3 代价敏感朴素贝叶斯分类器 41
4.3.1 二类不平衡分类 41
4.3.2 多类不平衡分类 43
4.4 参数选择 44
4.4.1 二类不平衡分类 44
4.4.2 多类不平衡分类 45
4.5 仿真实验与比较分析 45
4.5.1 二类不平衡分类 45
4.5.2 多类不平衡分类 48
4.6 本章小结 56
参考文献 57
第5章 决策树与随机森林 58
5.1 基本流程 58
5.1.1 决策树定义及结构 58
5.1.2 决策树学习步骤 58
5.2 划分选择 59
5.2.1 信息增益 59
5.2.2 增益率 59
5.2.3 基尼基数 60
5.3 剪枝处理 60
5.4 随机森林 60
5.5 随机森林集成 62
5.5.1 融合的基本原则 62
5.5.2 不平衡数据的模型集成方案 62
5.6 本章小结 64
参考文献 64
第6章 支持向量机 65
6.1 支持向量机原理 65
6.1.1 超平面与几何间隔最大化 65
6.1.2 拉格朗日对偶函数 67
6.1.3 核函数的引入 68
6.2 序列最小优化算法 70
6.3 不平衡分类SVM研究 71
6.4 基于距离的多子域加权欠采样SVM算法 71
6.4.1 基于几何间距的多子域加权欠采样算法 71
6.4.2 WU-SVM算法 73
6.4.3 小结 75
6.5 基于GA过采样的SVM算法 76
6.5.1 基于GA的过采样 76
6.5.2 递归支持向量机(R-SVM) 76
6.5.3 GR-SVM算法 77
6.6 WU-SVM仿真实验与结果分析 78
6.6.1 二类不平衡分类 78
6.6.2 多类不平衡分类 88
6.7 本章小结 90
参考文献 90
第7章 集成学习与强化学习 92
7.1 个体与集成 92
7.2 Boosting 93
7.3 Bagging 95
7.4 强化学习 96
7.4.1 强化学习的基本元素 97
7.4.2 策略选择 98
7.4.3 有模型学习 99
7.4.4 免模型学习 100
7.5 本章小结 102
参考文献 102
第8章 遗传规划分类 104
8.1 进化计算基本理论 104
8.2 遗传规划理论 106
8.2.1 遗传规划基本流程 106
8.2.2 遗传规划的特点 107
8.2.3 个体表示和适应度函数 107
8.2.4 种群的产生方法 108
8.2.5 遗传操作 109
8.2.6 终止准则与结果判定 110
8.3 遗传规划分类器 111
8.3.1 遗传规划分类模型 111
8.3.2 两类问题 112
8.3.3 多类问题 114
8.4 遗传规划分类器集成 115
8.4.1 利用遗传规划进行集成的基本原理 115
8.4.2 遗传规划集成学习的相关设置 116
8.4.3 算法描述 117
8.5 遗传规划不平衡分类器 118
8.5.1 多目标遗传规划 118
8.5.2 不平衡分类问题中的多目标问题 119
8.5.3 基于多目标的遗传规划用于不平衡分类 120
8.6 遗传规划用于不平衡分类实例 120
8.6.1 MOGP进化搜索算法 120
8.6.2 分类器集成选择 121
8.6.3 实验结果 122
8.6.4 分类器集成改进 124
8.7 本章小结 124
参考文献 124
第9章 非平稳环境学习 126
9.1 非平稳环境下的变化检测 126
9.1.1 检测变量与检验方法 126
9.1.2 非平稳环境检测的最新研究进展 130
9.2 增量式学习算法的研究 130
9.2.1 增量学习方式 131
9.2.2 最新动态 134
9.2.3 经典测试数据集及评估指标 135
9.3 本章小结 137
参考文献 137
第10章 迁移学习 139
10.1 迁移学习 139
10.2 迁移学习类型 140
10.2.1 同构迁移学习 140
10.2.2 异构迁移学习 140
10.3 迁移学习方法 141
10.3.1 实例权重法 141
10.3.2 特征表示法 142
10.3.3 参数迁移法 148
10.3.4 知识关联法 149
10.4 迁移学习运用 149
10.5 本章小结 150
参考文献 151
第11章 典型应用案例 153
11.1 网络入侵检测 153
11.1.1 背景 153
11.1.2 网络入侵检测数据 153
11.1.3 GA过采样 154
11.1.4 SVM参数寻优 154
11.1.5 特征提取分析 157
11.1.6 实验结果及分析 157
11.2 医疗诊断 160
11.2.1 不平衡分类在医疗诊断中的应用 160
11.2.2 乳腺癌诊断 161
11.2.3 仿真结果与分析 162
11.3 短文本分类 163
11.3.1 短文本分类概述 163
11.3.2 文本表示相关的主要模型 163
11.3.3 特征降维 165
11.3.4 基于WU-SVM的短文本分类 168
11.3.5 小结 174
第12章 人工智能平台——AIThink 175
12.1 AIThink平台介绍 175
12.2 平台功能及用途 176
12.3 平台内容 178
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《党员干部理论学习培训教材 理论热点问题党员干部学习辅导》(中国)胡磊 2018
- 《基于地质雷达信号波的土壤重金属污染探测方法研究》赵贵章 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《数学物理方法与仿真 第3版》杨华军 2020
- 《Helmholtz方程的步进计算方法研究》李鹏著 2019
- 《深度学习与飞桨PaddlePaddle Fluid实战》于祥 2019
- 《土壤环境监测前沿分析测试方法研究》中国环境监测总站编著 2018
- 《全国普通高等中医药院校药学类专业“十三五”规划教材 第二轮规划教材 有机化学学习指导 第2版》赵骏 2018
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019