当前位置:首页 > 社会科学
基于R的统计分析与数据挖掘
基于R的统计分析与数据挖掘

基于R的统计分析与数据挖掘PDF电子书下载

社会科学

  • 电子书积分:13 积分如何计算积分?
  • 作 者:薛薇编著
  • 出 版 社:北京:中国人民大学出版社
  • 出版年份:2014
  • ISBN:9787300190747
  • 页数:399 页
图书介绍:本书聚焦当今备受国内外数据分析师和数据应用者关注的R语言,关注如何借助R实现统计分析和数据挖掘。它既不是仅侧重理论讲解的统计分析和数据挖掘教科书,也不是仅侧重R编程操作的使用手册,而是以数据分析贯穿全书的两者的有机结合。本书特色在于:以数据模拟的直观方式论述方法原理的同时,通过案例强化R的操作实践性;在以解决应用问题为目标讨论R操作的同时,通过原理论述强化模型结果的解读理解。本书定位于统计分析和数据挖掘的学习者、实践者和研究者,旨在使读者理解统计分析原理,熟练操控R软件,拓展数据应用,提升研究水平。
《基于R的统计分析与数据挖掘》目录

第1章 关于R 1

1.1为什么选择R 1

1.2如何学习R 3

1.3 R入门必备 4

1.4小结 13

第2章 R的数据组织 15

2.1 R的数据对象 15

2.2创建和访问R的数据对象 17

2.3从文本文件读数据 42

2.4外部数据的导入 45

2.5 R数据组织的其他问题 49

2.6小结 50

第3章 R的数据管理 53

3.1数据合并 53

3.2数据排序 54

3.3缺失数据报告 55

3.4变量计算 58

3.5变量值的重编码 69

3.6数据筛选 70

3.7数据保存 72

3.8数据管理中控制流程 72

3.9小结 80

第4章 R的基本数据分析:描述和相关 82

4.1数值型单变量的描述 82

4.2分类型单变量的描述 87

4.3两数值型变量相关性的分析 88

4.4两分类型变量相关性的分析 92

4.5小结 101

第5章 R的基本数据分析:可视化 102

5.1绘图基础 102

5.2数值型单变量分布的可视化 108

5.3分类型变量分布和相关性的可视化 118

5.4两数值型变量相关性的可视化 125

5.5 lattice绘图 137

5.6小结 144

第6章 R的两均值比较检验 147

6.1两独立样本的均值检验 148

6.2两配对样本的均值检验 154

6.3样本均值检验的功效分析 158

6.4两总体分布差异的非参数检验 164

6.5两样本均值差的置换检验 168

6.6两样本均值差的自举法检验 172

6.7小结 175

第7章 R的方差分析 177

7.1单因素方差分析 177

7.2单因素协方差分析 191

7.3多因素方差分析 196

7.4小结 203

第8章 R的回归分析:一般线性模型 205

8.1回归分析概述 205

8.2建立线性回归模型 207

8.3线性回归方程的检验 210

8.4回归诊断:误差项是否满足高斯-马尔科夫假定 215

8.5回归诊断:诊断数据中的异常观测点 223

8.6回归诊断:多重共线性的诊断 229

8.7回归建模策略 231

8.8回归模型验证 241

8.9带虚拟变量的线性回归分析 246

8.10小结 248

第9章 R的回归分析:广义线性模型 250

9.1广义线性模型概述 250

9.2 logistic回归分析:连接函数和参数估计 251

9.3 logistic回归分析:解读模型和模型检验 255

9.4 logistic回归分析:R函数和示例 258

9.5 logistic回归分析:回归诊断 261

9.6泊松回归分析 265

9.7广义线性模型的交叉验证 270

9.8小结 271

第10章 R的聚类分析 272

10.1聚类分析概述 272

10.2 K-Means聚类 273

10.3层次聚类 280

10.4两步聚类 283

10.5小结 288

第11章 R的因子分析:变量降维 289

11.1因子分析概述 289

11.2构造因子变量:基于主成分分析法 293

11.3构造因子变量:基于主轴因子法 302

11.4因子变量的命名 304

11.5计算因子得分 309

11.6小结 312

第12章 R的线性判别分析:分类模型 314

12.1距离判别 314

12.2 Fisher判别 321

12.3小结 327

第13章 R的决策树:预测模型 328

13.1决策树算法概述 328

13.2分类回归树的生长过程 334

13.3分类回归树的剪枝 339

13.4建立分类回归树的R函数和示例 342

13.5建立分类回归树的组合预测模型 348

13.6随机森林 356

13.7小结 360

第14章 R的人工神经网络:预测和聚类 362

14.1人工神经网络概述 363

14.2 B-P反向传播网络 368

14.3 B-P反向传播网络的R函数和示例 377

14.4 SOM自组织映射网络 388

14.5小结 398

返回顶部