《数据分析 R语言实战》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:李诗羽,张飞,王正林编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2014
  • ISBN:9787121237140
  • 页数:325 页
图书介绍:本书讲述如何利用R语言进行数据控制、处理、整理、分析等方面的具体细节和基本要点,结合大量的实例,从实战的角度出发,讲解实例的完整分析过程,并将算法模型和R语言软件的应用融于聚类分析、相关分析、回归分析、方差分析、协方差分析等实例分析之中,重点讲述用于高效解决各种数据分析问题的R语言应用。

第0章 致敬,R! 1

致敬,肩膀! 1

致敬,时代! 3

致敬,人才! 3

致敬,R瑟! 5

上篇 数据分析的前期准备 8

第1章 数据分析导引 8

1.1 数据分析概述 8

1.1.1 数据分析的原则 8

1.1.2 数据分析的步骤 9

1.1.3 数据分析的过程 10

1.1.4 数据分析的对象 11

1.2 大数据分析 11

1.2.1 大数据分析的流程 11

1.2.2 大数据分析的基本方面 12

1.2.3 大数据分析的应用 13

1.3 数据分析常用工具 13

1.4 R在数据分析中的优势 14

第2章 数据的读取与保存 16

2.1 数据读取 16

2.1.1 读取内置数据集 16

2.1.2 读取文本文件 17

2.1.3 读取固定宽度格式的文件 20

2.1.4 读取Excel数据 21

2.1.5 读取数据库文件 22

2.1.6 读取网页数据 26

2.1.7 读入R格式的文件 28

2.1.8 从其他统计软件读入数据 28

2.2 数据保存 31

2.2.1 使用函数cat() 31

2.2.2 保存为文本文件 32

2.2.3 保存R格式文件 33

2.2.4 保存为其他类型文件 33

第3章 数据预处理 34

3.1 基本函数 34

3.2 数据修改 38

3.2.1 修改数据标签 38

3.2.2 行列删除 38

3.3 缺失值处理 38

3.3.1 判断缺失数据 39

3.3.2 判断缺失模式 39

3.3.3 处理缺失数据 41

3.4 数据整理 44

3.4.1 数据合并 44

3.4.2 选取数据的子集 46

3.4.3 数据排序 47

3.5 长宽格式的转换 48

3.5.1 揉数据函数 48

3.5.2 揉数据的最佳伴侣 49

中篇 基本分析及应用 54

第4章 数据的图形描述 54

4.1 R绘图概述 54

4.2 绘图区域分割 55

4.2.1 函数par() 55

4.2.2 函数layout() 56

4.2.3 函数split.screen() 57

4.3 维图形 58

4.3.1 高级绘图函数 58

4.3.2 多元数据绘图 61

4.3.3 低级绘图函数 63

4.3.4 图形美化 64

4.3.5 交互式绘图命令 65

4.4 三维图形 67

4.5 lattice程序包 69

4.6 ggplot2程序包 73

4.6.1 快速绘图 74

4.6.2 分图层绘图 76

4.7 图形保存 84

4.8 实战实例:数据地图 84

第5章 数据的描述性分析 88

5.1 R内置的分布 88

5.2 集中趋势的分析 90

5.2.1 集中趋势的测度 90

5.2.2 R语言实现 91

5.3 离散趋势的分析 93

5.3.1 离散趋势的测度 93

5.3.2 R语言实现 94

5.4 数据的分布分析 95

5.4.1 分布情况的测度 95

5.4.2 R语言实现 96

5.5 图形分析及R实现 97

5.5.1 直方图和密度函数图 97

5.5.2 QQ图 98

5.5.3 茎叶图 100

5.5.4 箱线图 100

5.5.5 经验分布图 102

5.6 多组数据分析及R实现 102

5.6.1 多组数据的统计分析 102

5.6.2 多组数据的图形分析 103

第6章 参数估计及R实现 112

6.1 点估计及R实现 112

6.1.1 矩估计 112

6.1.2 极大似然估计 116

6.2 单正态总体的区间估计 122

6.2.1 均值μ的区间估计 122

6.2.2 方差σ2的区间估计 125

6.3 两正态总体的区间估计 126

6.3.1 均值差μ1-μ2的区间估计 127

6.3.2 两方差比σ21/σ22的区间估计 130

6.4 关于比率的区间估计 131

第7章 假设检验及R实现 134

7.1 假设检验概述 134

7.1.1 理论依据 135

7.1.2 检验步骤 135

7.1.3 两类错误 136

7.2 单正态总体的检验 137

7.2.1 均值μ的检验 138

7.2.2 方差σ2的检验 141

7.3 两正态总体的检验 142

7.3.1 均值差μ1-μ2的检验 143

7.3.2 成对数据的t检验 146

7.3.3 两总体方差的检验 147

7.4 比率的检验 148

7.4.1 比率的二项分布检验 148

7.4.2 比率的近似检验 149

7.5 非参数的检验 149

7.5.1 总体分布的X2检验 150

7.5.2 Kolmogrov-Smirnov检验 153

第8章 方差分析及R实现 157

8.1 单因素方差分析及R实现 157

8.1.1 基本假设的检验 157

8.1.2 单因素方差分析 160

8.1.3 多重t检验 164

8.1.4 Kruskal-Wallis秩和检验 166

8.2 双因素方差分析及R实现 168

8.2.1 无交互作用的分析 169

8.2.2 有交互作用的分析 172

8.3 协方差分析及R实现 176

第9章 回归分析及R实现 180

9.1 一元线性回归 180

9.1.1 模型理论 180

9.1.2 显著性检验 181

9.1.3 R语言实现 181

9.2 多元线性回归 187

9.2.1 模型理论 187

9.2.2 显著性检验 188

9.2.3 R语言实现 189

9.2.4 逐步回归 192

9.3 回归诊断及R实现 194

9.3.1 残差诊断 195

9.3.2 影响分析 198

9.3.3 多重共线性诊断 201

9.4 岭回归及R实现 203

9.5 广义线性模型 206

9.5.1 模型理论 206

9.5.2 R语言实现 207

第10章 主成分分析与因子分析 211

10.1 主成分分析 211

10.1.1 理论基础 211

10.1.2 R语言实现 215

10.2 因子分析 221

10.2.1 理论模型 221

10.2.2 因子载荷矩阵的估计方法 223

10.2.3 R语言实现 225

第11章 典型相关分析和对应分析 230

11.1 典型相关分析 230

11.1.1 理论基础 230

11.1.2 典型相关分析的应用 232

11.1.3 R语言实现 233

11.2 对应分析 236

11.2.1 理论基础 236

11.2.2 对应分析的步骤 237

11.2.3 R语言实现 238

第12章 判别分析和聚类分析 242

12.1 判别分析及R实现 242

12.1.1 距离判别法 243

12.1.2 距离判别法的R实现 244

12.1.3 Fisher判别法 247

12.1.4 Fisher判别法的R实现 248

12.1.5 贝叶斯判别法 251

12.1.6 贝叶斯判别法的R实现 252

12.2 聚类分析及R实现 252

12.2.1 理论概述 253

12.2.2 R实现举例 254

第13章 时间序列分析及R实现 260

13.1 时间序列的基本分析 260

13.1.1 平稳性与非平稳性 260

13.1.2 R实现的基本步骤 261

13.2 时间序列的分解 262

13.2.1 分解非季节性数据 263

13.2.2 分解季节性数据 265

13.3 指数平滑法预测分析 268

13.3.1 简单指数平滑法 269

13.3.2 残差的白噪声检验 272

13.3.3 Holt指数平滑法 275

13.3.4 Winters指数平滑法 277

13.4 ARIMA模型分析 280

13.4.1 基本思想 280

13.4.2 平稳化处理 281

13.4.3 建模 282

13.4.4 模型的参数估计 284

13.4.5 模型预测及检验 284

下篇 综合实例 288

第14章 R在金融数据分析中的应用 288

14.1 投资组合最优化实例 288

14.1.1 概述 288

14.1.2 均值-方差模型 289

14.1.3 模拟退火算法 292

14.2 构造投资组合的有效前沿 298

14.2.1 R中的算法包 298

14.2.2 计算分析 298

14.3 股票聚类分析 301

14.3.1 概述 301

14.3.2 K-means聚类分析 302

14.3.3 层次聚类分析 304

第15章 R在数据预测中的应用 306

15.1 回归分析预测 306

15.1.1 概述 306

15.1.2 实战案例 306

15.2 时间序列预测 318

15.2.1 概述 318

15.2.2 实战案例 318