第1章 数据挖掘与R语言概述 1
1.1 什么是数据挖掘 2
1.2 数据挖掘的结果 4
1.3 数据挖掘能做什么 7
1.4 数据挖掘方法的特点 14
1.5 数据挖掘的典型应用 18
1.6 R语言入门必备 24
1.7 本章函数列表 34
第2章 R的数据组织和整理 36
2.1 R的数据对象 36
2.2 向量的创建和访问 39
2.3 矩阵的创建和访问 44
2.4 数据框的创建和访问 50
2.5 数组和列表的创建和访问 55
2.6 数据对象的相互转换 58
2.7 导入外部数据和保存数据 65
2.8 R语言程序设计基础 74
2.9 R语言数据整理和程序设计综合应用 92
2.10 本章函数列表 94
第3章 R的数据可视化 96
3.1 绘图基础 96
3.2 单变量分布特征的可视化 102
3.3 多变量联合分布特征的可视化 110
3.4 变量间相关性的可视化 116
3.5 GIS数据的可视化 129
3.6 文本词频数据的可视化 137
3.7 本章函数列表 138
第4章 R的近邻分析:数据预测 140
4.1 近邻分析:K-近邻法 140
4.2 基于变量重要性的加权K-近邻法 151
4.3 基于观测相似性的加权K-近邻法 155
4.4 本章函数列表 162
第5章 R的决策树:数据预测 163
5.1 决策树算法概述 163
5.2 分类回归树的生长过程 168
5.3 分类回归树的剪枝 174
5.4 分类回归树的R函数和应用示例 179
5.5 建立分类回归树的组合预测模型 185
5.6 随机森林 194
5.7 本章函数列表 202
第6章 R的人工神经网络:数据预测 203
6.1 人工神经网络概述 204
6.2 B-P反向传播网络 212
6.3 B-P反向传播网络的R函数和应用示例 219
6.4 本章函数列表 230
第7章 R的支持向量机:数据预测 231
7.1 支持向量分类概述 231
7.2 线性可分问题下的支持向量分类 235
7.3 广义线性可分问题下的支持向量分类 238
7.4 线性不可分问题下的支持向量分类 241
7.5 多分类的支持向量分类 244
7.6 支持向量回归 244
7.7 R的支持向量机及应用示例 248
7.8 本章函数列表 259
第8章 R的一般聚类:揭示数据内在结构 260
8.1 聚类分析概述 260
8.2 基于质心的聚类模型:K-Means聚类 262
8.3 基于质心的聚类模型:PAM聚类 270
8.4 基于联通性的聚类模型:层次聚类 273
8.5 基于统计分布的聚类模型:EM聚类 277
8.6 本章函数列表 285
第9章 R的特色聚类:揭示数据内在结构 287
9.1 BIRCH聚类 287
9.2 SOM网络聚类 297
9.3 基于密度的聚类模型:DBSCAN聚类 313
9.4 本章函数列表 318
第10章 R的关联分析:揭示数据关联性 319
10.1 简单关联规则及其测度 320
10.2 Apriori算法及应用示例 324
10.3 Eclat算法及应用示例 339
10.4 简单关联分析的应用示例 341
10.5 序列关联分析及SPADE算法 345
10.6 本章函数列表 355
第11章 R的模式甄别:诊断异常数据 356
11.1 模式甄别方法和评价概述 356
11.2 模式甄别的无监督侦测方法及应用示例 361
11.3 模式甄别的有监督侦测方法及应用示例 370
11.4 模式甄别的半监督侦测方法及应用示例 382
11.5 本章函数列表 385
第12章 R的网络分析初步 386
12.1 网络的定义、表示及构建 387
12.2 网络节点重要性的测度 408
12.3 网络子群构成特征研究 418
12.4 网络整体特征刻画 428
12.5 主要网络类型及特点 433
12.6 本章函数列表 444