《数据分析与R软件 第2版》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:李素兰著
  • 出 版 社:北京:科学出版社
  • 出版年份:2017
  • ISBN:9787030531582
  • 页数:270 页
图书介绍:本书涵盖了统计分析常用方法,包括探索性数据分析,非参数统计中常用方法,多元统计分析中常用方法,如回归分析、分类分析、数据降维、相关分析等等。最后是R软件的使用。这些方法是进行科学研究的必要技术,是进一步深造与统计相关专业的基础。是学生在金融、统计、计算机等行业就业必不可少的工具之一。

第1章 探索性数据分析 1

1.1 数字特征 1

1.1.1 一元数据的数字特征 1

1.1.2 一元总体的数字特征 11

1.2 数据的分布 13

1.2.1 频数(频率)分布表与直方图 13

1.2.2 茎叶图、五数总括、箱线图 15

1.2.3 经验分布、QQ图及分布拟合检验 22

习题1 31

第2章 非参数统计 34

2.1 单样本问题 34

2.1.1 符号检验 34

2.1.2 趋势检验 37

2.1.3 游程检验 38

2.1.4 对称中心的检验 41

2.2 两样本问题 44

2.2.1 独立两样本位置参数的检验 45

2.2.2 独立样本刻度参数的检验 49

2.2.3 配对样本位置参数的检验 52

2.3 秩相关分析 53

2.3.1 Spearman秩相关系数 53

2.3.2 Kendallτ秩相关系数 56

2.4 二维列联表 58

习题2 61

第3章 多元统计分析相关基础 64

3.1 矩阵代数的相关知识 64

3.1.1 矩阵的微分运算 64

3.1.2 方阵的特征值和特征向量 66

3.2 多维随机向量 67

3.3 多元正态分布 71

3.3.1 多元正态分布的定义 71

3.3.2 与多元正态分布有关的R函数 72

3.3.3 由多元正态分布的导出分布 74

3.3.4 多元正态分布的参数估计 76

3.3.5 多元正态分布均值向量的假设检验 77

3.4 多元数据的数字特征 84

3.5 多元数据的图示 88

3.5.1 轮廓图 88

3.5.2 蛛网图 90

3.5.3 调和曲线图 92

习题3 94

第4章 回归分析 96

4.1 多元线性回归分析 97

4.1.1 多元线性回归模型 97

4.1.2 参数估计 98

4.1.3 回归模型的检验 100

4.1.4 回归诊断 106

4.2 自变量的选择与逐步回归 112

4.2.1 穷举法 113

4.2.2 逐步回归法 114

4.3 非线性回归模型 123

4.3.1 内在线性回归模型 123

4.3.2 内在非线性回归模型 124

4.4 Logistic回归模型 124

4.4.1 线性Logistic回归模型 125

4.4.2 参数的最大似然估计 125

习题4 130

第5章 主成分分析 133

5.1 总体主成分 133

5.1.1 总体主成分定义 133

5.1.2 总体主成分求法 134

5.1.3 总体主成分的性质 135

5.1.4 标准化变量的主成分 137

5.2 样本主成分 137

习题5 143

第6章 因子分析 145

6.1 因子分析模型 145

6.2 参数的统计意义及估计方法 145

6.2.1 参数的统计意义 145

6.2.2 因子载荷矩阵的估计 147

6.3 样本数据的因子分析 150

6.4 因子旋转 151

6.5 因子得分 154

6.5.1 加权最小二乘法 155

6.5.2 回归法 155

习题6 158

第7章 聚类分析 160

7.1 聚类分析的基本思想 160

7.2 聚类统计量 161

7.2.1 Q型聚类统计量——距离 161

7.2.2 R型聚类统计量——相似系数 162

7.3 系统聚类法 162

7.4 快速聚类法 171

7.4.1 凝聚点的选择 171

7.4.2 计算步骤 172

习题7 173

第8章 判别分析 176

8.1 距离判别 176

8.1.1 两个总体距离判别 177

8.1.2 多个总体距离判别 178

8.2 Bayes判别 181

8.2.1 两个总体Bayes判别 181

8.2.2 多个总体Bayes判别 184

8.3 Fisher判别 186

8.3.1 Fisher判别的基本思想 186

8.3.2 线性判别函数的求法 187

8.3.3 Fisher判别准则 188

8.4 逐步判别 193

8.4.1 逐步判别的基本思想 194

8.4.2 逐步判别的步骤 199

8.5 判别法则的评价 206

习题8 207

第9章 相关分析 208

9.1 相关系数的估计和检验 208

9.2 偏相关与复相关系数 210

9.2.1 偏相关系数 210

9.2.2 复相关系数 214

9.3 典型相关分析 217

9.3.1 典型相关分析的基本思想 217

9.3.2 总体的典型相关分析 218

9.3.3 样本典型相关分析 221

9.3.4 典型相关系数的显著性检验 223

习题9 225

第10章 R软件的使用 227

10.1 R软件简介 227

10.2 下载安装及运行R等 227

10.3 R软件界面简介 228

10.4 获取R函数的帮助文档 232

10.5 对象及它们的模式和属性 232

10.6 向量运算及相关函数 235

10.6.1 向量 235

10.6.2 产生有规律序列 236

10.6.3 逻辑向量 238

10.6.4 缺失数据 238

10.6.5 字符型向量 239

10.6.6 向量的下标系统 239

10.7 因子 241

10.8 数组和矩阵 242

10.8.1 数组 242

10.8.2 数组的下标系统 243

10.8.3 矩阵 245

10.8.4 与数组(矩阵)运算的相关函数 247

10.9 列表与数据框 249

10.10 从文件中读取数据 252

10.10.1 文本文件 252

10.10.2 其他格式数据文件 255

10.10.3 使用R的内置数据集 255

10.10.4 大数据文件 256

10.11 写数据文件 256

10.12 成组、循环和条件控制 257

10.12.1 成组表达式 257

10.12.2 控制语句 257

10.13 R的统计表 260

10.14 R的绘图 262

10.14.1 高级绘图命令 262

10.14.2 低级图形函数 264

10.15 编写R函数 265

参考文献 267

索引 268