《零基础学R语言数据分析 从机器学习、数据挖掘、文本挖掘到大数据分析》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:李仁钟,李秋缘编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2018
  • ISBN:9787302510802
  • 页数:273 页
图书介绍:本书共分14章,前四章介绍R语言的基本操作及应用,第5章介绍相关的套件,6~9章介绍算法,10~12章介绍相关规则,文本挖掘、图形化数据分析工具;最后两章介绍Hadoop和Spark大数据分析。本书不仅带领读者学习R语言,更强调各种应用的实践,每个章节均穿插详尽的程序范例,帮助理解与吸收。即使没有程序设计经验,也能够进入R软件的世界中,感受它所带来的强大威力。

第1章 R简介 1

1.1 开始使用R软件 1

1.2 R对象 4

1.2.1 向量 4

1.2.2 数组 5

1.2.3 矩阵 7

1.2.4 数据框 9

1.2.5 因子 11

1.2.6 列表 11

1.2.7 对象转换 12

第2章 数据的读取与写入 14

2.1 数据的读取 14

2.2 数据的写入与数据集 17

2.3 RData格式数据的写入与读取 18

2.4 读取SQL Server数据库的数据 19

第3章 流程控制及自定义函数 20

3.1 条件执行 20

3.2 循环控制 22

3.3 自定义函数 25

第4章 绘图功能及基本统计 27

4.1 高级绘图 27

4.2 低级绘图 30

4.3 交互式绘图 31

4.4 图形参数 32

4.5 基本统计 34

第5章 相关程序包的介绍 39

5.1 机器学习 39

5.2 数据挖掘 40

5.3 社交网络分析及文本挖掘 40

5.4 大数据分析 41

5.5 程序包的介绍 41

第6章 监督式学习 51

6.1 决策树 51

6.2 支持向量机 61

6.3 人工神经网络 65

6.4 组合方法 70

6.4.1 随机森林 70

6.4.2 推进法 71

第7章 无监督式学习 72

7.1 层次聚类法 72

7.2 K平均聚类算法 75

7.3 模糊C平均聚类算法 77

7.4 聚类指标 83

第8章 进化式学习 86

8.1 基因算法 86

8.2 人工蜂群算法 92

第9章 混合式学习 95

9.1 使用C50和ABCoptim程序包范例 95

9.2 使用基因算法来调整人工神经网络参数的范例 97

第10章 关联规则 107

10.1 关联规则简介 107

10.2 Apriori算法 108

第11章 社交网络分析和文本挖掘 117

11.1 社交网络分析 117

11.2 文本挖掘 122

第12章 图形化数据分析工具 125

12.1 导入数据 126

12.1.1 处理数据集 130

12.1.2 设置变量 131

12.2 探索和测试数据 131

12.3 转换数据 135

12.4 建立、评估和导出模型 137

第13章 大数据分析(R+Hadoop) 141

13.1 Hadoop简介 141

13.2 R+Hadoop 142

第14章 SparkR大数据分析 170

14.1 dplyr数据处理程序包 172

14.2 SparkR数据处理 175

14.3 SparkR与SQL Server 181

14.4 SparkR与 Cassandra 184

14.5 Spark Standalone模式 186

14.6 SparkR数据分析 189

附录A 下载和安装R 197

附录B 安装RStudio Desktop 203

附录C 安装ODBC 209

附录D 指令及用法 214

附录E 在虚拟机上安装R+Hadoop 218

附录F 在虚拟机上安装SparkR 247

参考文献 272