《高等院校研究生用书·复杂数据统计方法 基于R的应用 第2版》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:吴喜之编著
  • 出 版 社:北京:中国人民大学出版社
  • 出版年份:2013
  • ISBN:7300181414
  • 页数:234 页
图书介绍:本书用自由的软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。

第一章 引言 1

1.1作为科学的统计 1

1.2数据分析的实践 2

1.3数据的形式以及可能用到的模型 3

1.3.1横截面数据:因变量为实轴上的数量变量 4

1.3.2横截面数据:因变量为分类(定性)变量或者频数 4

1.3.3纵向数据,多水平数据,面板数据,重复观测数据 5

1.3.4多元数据各变量之间的关系:多元分析 5

1.3.5路径模型/结构方程模型 6

1.3.6多元时间序列数据 6

1.4 R软件入门 6

1.4.1简介 6

1.4.2动手 8

第二章 横截面数据:因变量为实数轴上的数量变量 10

2.1简单回归回顾 10

2.1.1对例2.1数据的简单拟合 11

2.1.2对例2.1数据的进一步分析 12

2.1.3对简单线性回归的一些讨论 15

2.1.4损失函数及分位数回归简介 16

2.2简单线性模型不易处理的横截面数据 18

2.2.1标准线性回归中的指数变换 20

2.2.2生存分析数据的Cox回归模型 22

2.2.3数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归 25

2.2.4无法做任何假定的数据:机器学习回归方法 32

2.2.5决策树回归(回归树) 34

2.2.6 Boosting回归 37

2.2.7 Bagging回归 38

2.2.8随机森林回归 39

2.2.9人工神经网络回归 40

2.2.10支持向量机回归 42

2.2.11几种回归方法五折交叉验证结果 43

2.2.12方法的稳定性及过拟合 44

第三章 横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况 47

3.1经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾 47

3.1.1 Logistic回归和probit回归 48

3.1.2广义线性模型简介 51

3.1.3经典判别分析 52

3.2因变量为分类变量,自变量含有分类变量:机器学习分类方法 54

3.2.1决策树分类(分类树) 56

3.2.2 Adaboost分类 59

3.2.3 Bagging分类 61

3.2.4随机森林分类 63

3.2.5支持向量机分类 66

3.2.6最近邻方法分类 67

3.2.7分类方法五折交叉验证结果 68

3.3因变量为频数(计数)的情况 69

3.3.1经典的Poisson对数线性模型回顾 70

3.3.2使用Poisson对数线性模型时的散布问题 72

3.3.3零膨胀计数数据的Poisson回归 74

3.3.4机器学习的算法模型拟合计数数据 78

3.3.5关于模型驱动还是数据驱动的简单讨论 80

3.3.6多项logit模型及多项分布对数线性模型回顾 81

第四章 纵向数据(多水平数据,面板数据) 88

4.1线性随机效应混合模型 89

4.2广义线性随机效应混合模型 94

4.3决策树及随机效应模型 97

4.4纵向生存数据分析 99

4.4.1 Cox随机效应混合模型 99

4.4.2分步联合建模 103

4.5计量经济学家的视角:面板数据 110

第五章 多元分析 116

5.1实数轴上的数据:经典多元分析内容回顾 116

5.1.1主成分分析及因子分析 116

5.1.2分层聚类及k均值聚类 125

5.1.3典型相关分析 128

5.1.4对应分析 132

5.2非经典多元数据分析:可视化 135

5.2.1主成分分析 136

5.2.2对应分析 137

5.2.3多重对应分析 138

5.2.4多重因子分析 139

5.2.5分层多重因子分析 141

5.2.6基于主成分分析的分层聚类 142

5.3多元数据的关联规则分析 144

第六章 路径建模(结构方程建模)数据的PLS分析 150

6.1路径模型概述 150

6.1.1路径模型 150

6.1.2路径模型的两种主要方法 151

6.2 PLS方法:顾客满意度的例子 153

6.3协方差方法简介 158

6.4结构方程模型的一些问题 162

第七章 多元时间序列数据 164

7.1时间序列的基本概念及单变量时间序列方法的回顾 164

7.1.1时间序列的一些定义和基本概念 164

7.1.2常用的一元时间序列方法 171

7.2单位根检验,协整检验及Granger因果检验 182

7.2.1概述 182

7.2.2单位根检验 183

7.2.3协整检验 185

7.2.4 Granger因果检验 191

7.3 VAR模型,VARX模型与状态空间模型 193

7.3.1 VAR模型的拟合与预测 193

7.3.2 VARX模型的拟合与预测 195

7.3.3状态空间模型的拟合与预测 198

7.3.4模型的比较 200

7.4非线性时间序列 203

7.4.1引言 203

7.4.2线性AR模型 205

7.4.3自门限自回归模型(SETAR) 206

7.4.4 Logistic平滑过渡自回归模型(LSTAR) 211

7.4.5神经网络模型 213

7.4.6可加AR模型 214

7.4.7模型的比较 215

7.4.8门限协整 215

附录练习:熟练使用R软件 221

参考文献 230