第1章 R简介 1
1.1 开始使用R软件 1
1.2 R对象 4
1.2.1 向量 4
1.2.2 数组 5
1.2.3 矩阵 7
1.2.4 数据框 9
1.2.5 因子 11
1.2.6 列表 11
1.2.7 对象转换 12
第2章 数据的读取与写入 14
2.1 数据的读取 14
2.2 数据的写入与数据集 17
2.3 RData格式数据的写入与读取 18
2.4 读取SQL Server数据库的数据 19
第3章 流程控制及自定义函数 20
3.1 条件执行 20
3.2 循环控制 22
3.3 自定义函数 25
第4章 绘图功能及基本统计 27
4.1 高级绘图 27
4.2 低级绘图 30
4.3 交互式绘图 31
4.4 图形参数 32
4.5 基本统计 34
第5章 相关程序包的介绍 39
5.1 机器学习 39
5.2 数据挖掘 40
5.3 社交网络分析及文本挖掘 40
5.4 大数据分析 41
5.5 程序包的介绍 41
第6章 监督式学习 51
6.1 决策树 51
6.2 支持向量机 61
6.3 人工神经网络 65
6.4 组合方法 70
6.4.1 随机森林 70
6.4.2 推进法 71
第7章 无监督式学习 72
7.1 层次聚类法 72
7.2 K平均聚类算法 75
7.3 模糊C平均聚类算法 77
7.4 聚类指标 83
第8章 进化式学习 86
8.1 基因算法 86
8.2 人工蜂群算法 92
第9章 混合式学习 95
9.1 使用C50和ABCoptim程序包范例 95
9.2 使用基因算法来调整人工神经网络参数的范例 97
第10章 关联规则 107
10.1 关联规则简介 107
10.2 Apriori算法 108
第11章 社交网络分析和文本挖掘 117
11.1 社交网络分析 117
11.2 文本挖掘 122
第12章 图形化数据分析工具 125
12.1 导入数据 126
12.1.1 处理数据集 130
12.1.2 设置变量 131
12.2 探索和测试数据 131
12.3 转换数据 135
12.4 建立、评估和导出模型 137
第13章 大数据分析(R+Hadoop) 141
13.1 Hadoop简介 141
13.2 R+Hadoop 142
第14章 SparkR大数据分析 170
14.1 dplyr数据处理程序包 172
14.2 SparkR数据处理 175
14.3 SparkR与SQL Server 181
14.4 SparkR与 Cassandra 184
14.5 Spark Standalone模式 186
14.6 SparkR数据分析 189
附录A 下载和安装R 197
附录B 安装RStudio Desktop 203
附录C 安装ODBC 209
附录D 指令及用法 214
附录E 在虚拟机上安装R+Hadoop 218
附录F 在虚拟机上安装SparkR 247
参考文献 272