《R语言与数据挖掘》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:张良均,谢佳标,杨坦,肖刚,黄博,陈玉辉,万正勇著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2016
  • ISBN:9787111540526
  • 页数:302 页
图书介绍:本书主要分为三个部分,基础篇、建模应用篇和Rattle篇。基础篇(第1~5章)介绍了有关R语言的安装与使用、R语言中的数据结构、常用操作和绘图功能等基础功能。建模应用篇(第6~10章)主要介绍了目前在数据挖掘中的常用的建模方法在R语言中的实现函数,并对输出结果进行了解释,有助于读者快速掌握应用R语言进行分析挖掘建模的方法。Rattle篇(第11章)介绍了一个R语言的图形界面工具。图书配套提供了程序代码及数据,读者可通过上机实验,快速掌握书中所介绍的R语言的使用方法。

第一部分 基础篇 2

第1章 R语言的安装与使用 2

1.1 R安装与升级 3

1.2 R使用入门 4

1.2.1 R操作界面 4

1.2.2 RStudio窗口介绍 5

1.2.3 R常用操作 6

1.3 R数据分析包 8

1.4 配套资源使用说明 10

1.5 小结 10

1.6 上机实验 10

第2章 数据对象与数据读写 12

2.1 数据类型 12

2.2 数据结构 16

2.2.1 向量 16

2.2.2 矩阵 19

2.2.3 数组 24

2.2.4 数据框 25

2.2.5 因子 28

2.2.6 列表 31

2.3 数据文件的读写 34

2.3.1 键盘输入数据 34

2.3.2 读取不同格式的数据 35

2.3.3 从其他统计软件获取数据 37

2.3.4 从数据库获取数据 37

2.3.5 从网页获取数据 39

2.4 小结 40

2.5 上机实验 40

第3章 R语言常用数据管理 42

3.1 变量的重命名 42

3.2 缺失值分析 45

3.3 数据排序 46

3.4 随机抽样 48

3.5 数值运算函数 49

3.6 字符串处理 52

3.7 文本分词 56

3.8 apply函数族 62

3.9 数据整合 65

3.10 控制流 68

3.11 函数的编写 71

3.12 小结 72

3.13 上机实验 73

第4章 图形探索 75

4.1 图形元素 76

4.1.1 颜色 76

4.1.2 点 80

4.1.3 文本 82

4.1.4 线条 86

4.1.5 图例 91

4.1.6 坐标轴 92

4.2 图形组合 94

4.3 图形保存 97

4.4 图形函数 98

4.5 小结 116

4.6 上机实验 116

第5章 高级绘图工具 117

5.1 lattice包绘图工具 117

5.1.1 绘图特色 117

5.1.2 基本图形 122

5.2 ggplot2包绘图工具 135

5.2.1 从qplot开始 135

5.2.2 ggplot作图 137

5.3 交互式绘图工具简介 142

5.3.1 rCharts包 143

5.3.2 recharts包 147

5.3.3 googleVis包 147

5.3.4 htmlwidgets包 148

5.3.5 shiny包 153

5.4 小结 163

5.5 上机实验 163

第二部分 建模应用篇 166

第6章 分类与预测 166

6.1 回归分析 166

6.2 决策树 175

6.2.1 C4.5 算法 176

6.2.2 CART算法 178

6.2.3 C5.0算法 180

6.3 人工神经网络 181

6.4 KNN算法 183

6.5 朴素贝叶斯分类 185

6.6 其他分类与预测算法函数 187

6.7 分类与预测算法评价 192

6.8 小结 196

6.9 上机实验 196

第7章 聚类分析 198

7.1 K-Means聚类分析函数 199

7.2 层次聚类算法 204

7.3 其他聚类分析函数 207

7.4 小结 211

7.5 上机实验 212

第8章 关联规则 213

8.1 Apriori关联规则 214

8.2 小结 226

8.3 上机实验 226

第9章 智能推荐 228

9.1 智能推荐模型构建 228

9.2 智能推荐模型评价 232

9.3 小结 235

9.4 上机实验 235

第10章 时间序列 237

10.1 ARIMA模型 237

10.2 其他时间序列模型 245

10.3 小结 250

10.4 上机实验 251

第三部分 Rattle篇 254

第11章 可视化数据挖掘工具Rattle 254

11.1 Rattle简介及其安装 254

11.1.1 Rattle简介 254

11.1.2 Rattle安装 254

11.2 功能预览 255

11.3 数据导入 256

11.3.1 导入CSV数据 256

11.3.2 导入ARFF数据 261

11.3.3 导入ODBC数据 262

11.3.4 R Dataset——导入其他数据源 264

11.3.5 导入RData File数据集 267

11.3.6 导入Library数据 268

11.4 数据探索 269

11.4.1 数据总体概况 269

11.4.2 数据分布探索 272

11.4.3 相关性 275

11.4.4 主成分 277

11.4.5 交互图 278

11.5 数据建模 283

11.5.1 聚类分析 283

11.5.2 关联规则 288

11.5.3 决策树 291

11.5.4 随机森林 293

11.6 模型评估 296

11.6.1 混淆矩阵 296

11.6.2 风险图 296

11.6.3 ROC图及相关图表 297

11.6.4 模型得分数据集 298

11.7 小结 299

11.8 上机实验 299

参考资料 301