第1章 机器学习回顾 1
1.1 机器学习历史和定义 2
1.2 哪些不属于机器学习 3
1.3 机器学习概念和术语 4
1.4 机器学习类型及其子类 6
1.5 用于机器学习的数据集 8
1.6 机器学习的应用 10
1.7 机器学习中的实际问题 10
1.8 机器学习角色与过程 11
1.8.1 角色 12
1.8.2 过程 12
1.9 机器学习工具和数据集 14
1.10 小结 16
第2章 监督学习在现实世界中的实践方法 18
2.1 正式描述和符号 19
2.1.1 数据质量分析 20
2.1.2 描述性数据分析 20
2.1.3 可视化分析 20
2.2 数据转换与预处理 21
2.2.1 特征构造 22
2.2.2 处理缺失值 22
2.2.3 离群值 23
2.2.4 离散化 24
2.2.5 数据采样 24
2.2.6 训练集、验证集和测试集 26
2.3 特征关联分析与降维 28
2.3.1 特征搜索技术 29
2.3.2 特征评估技术 29
2.4 模型建立 32
2.4.1 线性模型 32
2.4.2 非线性模型 35
2.4.3 集成学习和元学习器 40
2.5 模型评价、评估和比较 42
2.5.1 模型评价 42
2.5.2 模型评估指标 43
2.5.3 模型比较 45
2.6 Horse Colic分类案例研究 47
2.6.1 业务问题 48
2.6.2 机器学习映射 48
2.6.3 数据分析 48
2.6.4 监督学习实验 49
2.6.5 结果、观察和分析 58
2.7 小结 60
2.8 参考文献 61
第3章 无监督机器学习技术 63
3.1 与监督学习共同存在的问题 63
3.2 无监督学习的特定问题 64
3.3 特征分析和降维 64
3.3.1 符号 64
3.3.2 线性方法 64
3.3.3 非线性方法 67
3.4 聚类 70
3.4.1 聚类算法 70
3.4.2 谱聚类 75
3.4.3 仿射传播 75
3.4.4 聚类的验证和评估 77
3.5 离群值或异常值检测 79
3.5.1 离群值算法 79
3.5.2 离群值评估技术 85
3.6 实际案例研究 86
3.6.1 工具和软件 86
3.6.2 业务问题 86
3.6.3 机器学习映射 86
3.6.4 数据收集 87
3.6.5 数据质量分析 87
3.6.6 数据采样和转换 88
3.6.7 特征分析和降维 88
3.6.8 聚类模型、结果和评估 91
3.6.9 离群值模型、结果和评估 94
3.7 小结 95
3.8 参考文献 95
第4章 半监督学习和主动学习 98
4.1 半监督学习 99
4.1.1 表示、符号和假设条件 99
4.1.2 半监督学习技术 101
4.1.3 半监督学习的案例研究 106
4.2 主动学习 111
4.2.1 表示和符号 112
4.2.2 主动学习场景 112
4.2.3 主动学习方法 112
4.2.4 不确定性采样 112
4.2.5 版本空间采样 113
4.2.6 数据分布采样 115
4.3 主动学习中的案例研究 116
4.3.1 工具和软件 116
4.3.2 业务问题 116
4.3.3 机器学习映射 116
4.3.4 数据采集 117
4.3.5 数据采样和转换 117
4.3.6 特征分析和降维 117
4.3.7 模型、结果和评估 117
4.3.8 主动学习结果分析 121
4.4 小结 121
4.5 参考文献 122
第5章 实时流机器学习 123
5.1 假设条件和数学符号 124
5.2 基本的流处理和计算技术 124
5.2.1 流计算 124
5.2.2 滑动窗口 125
5.2.3 采样 126
5.3 概念漂移和漂移探测 127
5.3.1 数据管理 128
5.3.2 局部内存 128
5.4 增量监督学习 130
5.4.1 建模技术 130
5.4.2 在线环境的验证、评估和比较 136
5.5 使用聚类的增量无监督学习 138
5.6 使用离群值检测的无监督学习 148
5.6.1 基于分区的聚类离群值检测 148
5.6.2 基于距离的聚类离群值检测 149
5.7 流学习案例研究 151
5.7.1 工具和软件 152
5.7.2 业务问题 152
5.7.3 机器学习映射 152
5.7.4 数据采集 153
5.7.5 数据采样和转换 154
5.7.6 模型、结果和评估 155
5.7.7 流学习结果分析 158
5.8 小结 160
5.9 参考文献 160
第6章 概率图建模 163
6.1 回顾概率 163
6.2 图的概念 166
6.2.1 图的结构和属性 166
6.2.2 子图和团 167
6.2.3 路、迹和环 167
6.3 贝叶斯网络 168
6.3.1 表示 169
6.3.2 推断 171
6.3.3 学习 180
6.4 马尔可夫网络和条件随机场 186
6.4.1 表示 187
6.4.2 推断 188
6.4.3 学习 189
6.4.4 条件随机场 189
6.5 特殊网络 190
6.5.1 树增强型网络 190
6.5.2 马尔可夫链 190
6.6 工具和使用 193
6.6.1 OpenMarkov 193
6.6.2 Weka贝叶斯网络图形界面 194
6.7 案例研究 194
6.7.1 业务问题 196
6.7.2 机器学习映射 196
6.7.3 数据采样和转换 196
6.7.4 特征分析 196
6.7.5 模型、结果和评估 197
6.7.6 结果分析 200
6.8 小结 201
6.9 参考文献 201
第7章 深度学习 203
7.1 多层前馈神经网络 203
7.1.1 输入、神经元、激活函数和数学符号 203
7.1.2 多层神经网络 204
7.2 神经网络的局限 209
7.3 深度学习 210
7.4 案例研究 231
7.4.1 工具和软件 232
7.4.2 业务问题 232
7.4.3 机器学习映射 233
7.4.4 数据采样和转换 233
7.4.5 特征分析 233
7.4.6 模型、结果和评估 233
7.5 小结 242
7.6 参考文献 243
第8章 文本挖掘和自然语言处理 245
8.1 NLP及其子领域和任务 246
8.1.1 文本分类 247
8.1.2 词性标注 247
8.1.3 文本聚类 247
8.1.4 信息抽取和命名实体识别 247
8.1.5 情感分析和观点挖掘 247
8.1.6 指代消解 248
8.1.7 词义消歧 248
8.1.8 机器翻译 248
8.1.9 语义推理及推断 249
8.1.10 文本摘要 249
8.1.11 自动问答 249
8.2 挖掘非结构化数据的问题 249
8.3 文本处理和转换 250
8.3.1 文档收集与标准化 250
8.3.2 词元化 251
8.3.3 停止词移除 251
8.3.4 词干提取或词形还原 251
8.3.5 局部/全局字典或词汇表 252
8.3.6 特征抽取/生成 253
8.3.7 特征表示和相似度 255
8.3.8 特征选择和降维 258
8.4 文本挖掘主题 259
8.4.1 文本分类 260
8.4.2 主题建模 260
8.4.3 文本聚类 263
8.4.4 命名实体识别 267
8.4.5 深度学习与NLP 270
8.5 工具和使用 272
8.5.1 Mallet 272
8.5.2 用Mallet进行主题建模 273
8.5.3 业务问题 274
8.5.4 机器学习映射 274
8.5.5 数据采集 274
8.5.6 数据采样和转换 275
8.5.7 特征分析和降维 276
8.5.8 模型、结果和评估 276
8.5.9 文本处理结果分析 277
8.6 小结 278
8.7 参考文献 278
第9章 大数据机器学习:最终领域 281
9.1 大数据的特点 283
9.2 大数据机器学习 283
9.3 批量大数据机器学习 290
9.4 案例研究 294
9.4.1 业务问题 296
9.4.2 机器学习映射 296
9.4.3 数据采集 296
9.4.4 数据采样和转换 296
9.4.5 使用Spark MLlib作为大数据机器学习平台 298
9.5 实时大数据机器学习 305
9.6 机器学习的未来 310
9.7 小结 310
9.8 参考文献 311
附录A线性代数 313
附录B概率论 317