《R语言数据分析与挖掘实战手册》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:荆波责任编辑;程静
  • 出 版 社:北京:中国铁道出版社
  • 出版年份:2019
  • ISBN:9787113257453
  • 页数:256 页
图书介绍:《R语言数据分析与挖掘实战手册》定位于R语言当前的热点应用:数据分析和数据挖掘,细致到位的分析了R语言的6类数据分析类型、数据挖掘建模以及神经网络的构成;同时通过经典丰富的实例,对数据分析和挖掘的实践应用进行了详细说明。

第1章 R语言简介 1

1.1 R语言软件的安装与运行 1

1.1.1 R语言软件的安装、启动与关闭 1

1.1.2 R语言程辑包的安装和使用 4

1.2 R语言的数据结构 4

1.2.1 R语言对象和类型 6

1.2.2 向量 7

1.2.3 数组和矩阵 12

1.2.4 列表 17

1.2.5 数据框 20

第2章 数据的读取与保存 24

2.1 数据的读取 24

2.1.1 读取内置数据集和文本文件 24

2.1.2 读取Excel数据和CSV格式的数据 30

2.1.3 读取R语言格式数据和网页数据 33

2.1.4 读取其他格式的数据 34

2.2 数据保存 36

2.2.1 写出数据 36

2.2.2 使用函数cat() 37

2.2.3 保存为R语言格式文件 38

2.2.4 保存为其他类型文件 39

第3章 数据预处理 40

3.1 缺失值处理 40

3.1.1 缺失值判断 40

3.1.2 缺失模型判断 44

3.1.3 常用处理方法 48

3.2 数据整理 53

3.2.1 数据合并 53

3.2.2 选取子集 56

3.2.3 数据转换 59

第4章 数据的探索性分析 66

4.1 基本绘图函数 66

4.2 探索单个变量 74

4.2.1 单组数据的图形描述 74

4.2.2 单组数据的描述性分析 79

4.3 探索多个变量 81

4.3.1 两组数据的图形描述 81

4.3.2 多组数据的图形描述 85

4.3.3 多组数据的描述性统计 88

4.4 其他图像探索 90

第5章 回归分析 94

5.1 一元线性回归 94

5.1.1 模型简介 94

5.1.2 函数介绍 96

5.1.3 综合案例:iris数据集的一元回归建模 97

5.2 多元线性回归 99

5.2.1 模型简介 99

5.2.2 综合案例:iris数据集的多元回归建模 100

5.3 变量的选择 105

5.3.1 逐步回归方法简介及函数介绍 105

5.3.2 综合案例:swiss数据集的逐步回归建模 106

5.3.3 岭回归的方法简介及函数介绍 109

5.3.4 综合案例:longley数据集的岭回归探索 110

5.3.5 lasso回归方法简介及函数介绍 114

5.3.6 综合案例:longley数据集的lasso回归建模 115

5.4 Logistic回归 117

5.4.1 模型简介 117

5.4.2 函数介绍 119

5.4.3 综合案例:iris数据集的逻辑回归建模 120

第6章 方差分析 124

6.1 单因素方差分析 124

6.1.1 模型介绍 124

6.1.2 函数介绍 126

6.1.3 综合案例:不同治疗方法下胆固醇降低效果的差异性分析 127

6.2 双因素方差分析 130

6.2.1 模型介绍 130

6.2.2 综合案例:不同剂量下老鼠妊娠重量的差异性分析 132

6.3 协方差分析 136

6.3.1 模型简介 136

6.3.2 函数介绍 136

6.3.3 综合案例:hotdog数据集的协方差分析 137

第7章 主成分分析和因子分析 139

7.1 降维的基本方法:主成分分析 139

7.1.1 理论基础:原始变量的线性组合 139

7.1.2 模型介绍 141

7.1.3 函数介绍 143

7.1.4 综合案例:longley数据集的变量降维及回归 144

7.1.5 综合案例:longley数据集的变量降维及回归(主成分回归) 148

7.2 推广发展:因子分析 150

7.2.1 理论基础:多个变量综合为少数因子 150

7.2.2 模型介绍 151

7.2.3 函数介绍 153

7.2.4 综合案例:能力和智商测试的因子分析探索 154

第8章 判别分析 160

8.1 距离判别法 160

8.1.1 理论基础:离谁近,就属于谁 160

8.1.2 函数介绍 162

8.1.3 综合案例:基于距离判别的iris数据集分类 164

8.2 Bayes判别法 168

8.2.1 理论基础:先验概率与错判损失 168

8.2.2 函数介绍 170

8.2.3 综合案例:基于iris数据集的Bayes判别分析 171

8.3 Fisher判别法 171

8.3.1 理论基础:投影 171

8.3.2 函数介绍 173

8.3.3 综合案例:基于Fisher判别的iris数据集分类 174

第9章 常规聚类分析 178

9.1 深入了解聚类分析 178

9.1.1 差异与分类 178

9.1.2 主流的聚类算法 179

9.2 动态聚类 180

9.2.1 聚类的基本过程 180

9.2.2 函数介绍 183

9.2.3 综合案例:基于随机生成序列的动态聚类 184

9.3 层次聚类 194

9.3.1 聚类的基本过程 194

9.3.2 函数介绍 197

9.3.3 综合案例:基于UScitiesD数据集的层次聚类 199

9.4 密度聚类 202

9.4.1 聚类的基本过程 202

9.4.2 函数介绍 202

9.4.3 综合案例:基于随机生成序列的密度聚类 203

9.5 EM聚类 204

9.5.1 聚类的基本过程 205

9.5.2 函数介绍 205

9.5.3 综合案例:基于iris数据集的EM聚类 206

第10章 关联规则 210

10.1 简单关联规则 210

10.1.1 基本概念与表示形式 210

10.1.2 评价简单关联规则的有效性和实用性 211

10.2 序列关联规则 212

10.2.1 差异与基本概念 212

10.2.2 生成序列关联规则 213

10.3 Apriori算法 214

10.3.1 算法介绍:挖掘频繁项集 214

10.3.2 函数介绍 215

10.3.3 综合案例:基于Titanic数据集的关联规则挖掘 216

10.4 Eclat算法 224

10.4.1 算法介绍:自底向上的搜索 224

10.4.2 函数介绍 224

10.4.3 综合案例:基于美国人口调查数据的关联规则挖掘 225

10.5 SPADE算法 230

10.5.1 算法介绍:基于序列格的搜索和连接 231

10.5.2 函数介绍 232

10.5.3 综合案例:基于zaki数据集的序列关联规则挖掘 233

第11章 神经网络 239

11.1 深入了解人工神经网络 239

11.1.1 生物神经元 240

11.1.2 人工神经元模型 241

11.1.3 人工神经网络种类 244

11.1.4 建立模型的一般步骤 247

11.2 B-P反向传播网络 248

11.2.1 B-P反向传播网络模型 248

11.2.2 算法介绍 249

11.2.3 函数介绍 250

11.3 综合案例:基于Boston数据的波士顿郊区房价预测建模 252