第1章 模式的数据挖掘 1
1.1 聚类分析 2
1.1.1 K-means聚类 3
1.1.2 K-medoids聚类 7
1.1.3 分层聚类 12
1.1.4 期望最大化 15
1.1.5 密度估计 21
1.2 异常检测 24
1.2.1 显示异常值 25
1.2.2 计算异常 28
1.3 关联规则 30
1.4 问题 33
1.5 总结 34
第2章 序列的数据挖掘 35
2.1 模式 35
2.1.1 Eclat 36
2.1.2 arulesNBMiner 40
2.1.3 Apriori 43
2.1.4 用TraMineR确定序列 47
2.1.5 序列相似点 54
2.2 问题 57
2.3 总结 57
第3章 文本挖掘 59
3.1 功能包 60
3.1.1 文本处理 60
3.1.2 文本集群 69
3.2 问题 80
3.3 总结 80
第4章 数据分析——回归分析 81
4.1 功能包 81
4.1.1 简单回归 81
4.1.2 多次回归 88
4.1.3 多变量回归分析 94
4.1.4 稳健回归 100
4.2 问题 106
4.3 总结 106
第5章 数据分析——相关性 107
5.1 功能包 107
5.1.1 基本相关性 108
5.1.2 可视化相关性 112
5.1.3 协方差 114
5.1.4 皮尔森相关性 117
5.1.5 多分格相关性 118
5.1.6 四分相关性 122
5.1.7 异构相关矩阵 126
5.1.8 部分相关性 128
5.2 问题 129
5.3 总结 129
第6章 数据分析——聚类 131
6.1 功能包 131
6.2 K-means聚类 132
6.2.1 示例 132
6.2.2 Medoids集群 140
6.2.3 cascadeKM函数 142
6.2.4 基于贝叶斯定理信息选取集群 144
6.2.5 仿射传播聚类 146
6.2.6 用于估测集群数量的间隙统计量 149
6.2.7 分级聚类 151
6.3 问题 153
6.4 总结 154
第7章 数据可视化——R图形 155
7.1 功能包 155
7.1.1 交互式图形 156
7.1.2 latticist功能包 160
7.1.3 ggplot2功能包 169
7.2 问题 180
7.3 总结 181
第8章 数据可视化——绘图 183
8.1 功能包 183
8.2 散点图 183
8.2.1 回归线 187
8.2.2 lowess线条 188
8.2.3 scatterplot函数 189
8.2.4 Scatterplot矩阵 192
8.2.5 密度散点图 197
8.3 直方图和条形图 200
8.3.1 条形图 200
8.3.2 直方图 203
8.3.3 ggplot2 203
8.3.4 词云 204
8.4 问题 206
8.5 总结 206
第9章 数据可视化——三维 207
9.1 功能包 207
9.2 生成三维图形 208
9.2.1 Lattice Cloud——三维散点图 212
9.2.2 scatterplot3d 215
9.2.3 scatter3d 216
9.2.4 cloud3d 218
9.2.5 RgoogleMaps 220
9.2.6 vrmlgenbar3D 221
9.2.7 大数据 223
9.2.8 研究方向 228
9.3 问题 234
9.4 总结 234
第10章 机器学习实战 235
10.1 功能包 235
10.2 数据集 236
10.2.1 数据划分 240
10.2.2 模型 241
10.2.3 train方法 254
10.3 问题 264
10.4 总结 264
第11章 用机器学习预测事件 265
11.1 自动预测功能包 265
11.1.1 时间序列 266
11.1.2 SMA函数 272
11.1.3 分解函数 273
11.1 4指数平滑法 274
11.1.5 预测 277
11.1.6 霍尔特指数平滑法 281
11.2 问题 293
11.3 总结 293
第12章 监督学习和无监督学习 295
12.1 功能包 296
12.1.1 监督学习 296
12.1.2 无监督学习 316
12.2 问题 327
12.3 总结 327