《数据分析》PDF下载

  • 购买积分:14 如何计算积分?
  • 作  者:范金城,梅长林编著
  • 出 版 社:北京:科学出版社
  • 出版年份:2002
  • ISBN:7030104587
  • 页数:411 页
图书介绍:本书介绍了数据分析的基本内容与方法,其特点是既重视数据分析的基本理论与方法的介绍,又强调应用计算机软件SAS进行实际分析和计算机能力的培养。主要内容有:数据描述性分析、非参数方法、回归分析、主成分分析、判别分析、聚类分析、时间序列分析、Bayes统计分析以及常用数据分析方法的SAS过程简介。本书每章末附有大量实用、丰富的习题,并要求学生独立上机完成。本书可作为高等院校信息科学及数理统计专业的本科生教材,也可供有关专业的研究生及工程技术人员参考。

第1章 数据描述性分析 1

1.1 数据的数字特征 1

1.1.1 均值、方差等数字特性 1

1.1.2 中位数、分位数、三均值与极差 7

1.2 数据的分布 11

1.2.1 直方图、经验分布函数与QQ图 12

1.2.2 茎叶图、箱线图及五数总括 15

1.2.3 正态性检验与分布拟合检验 21

1.3 多元数据的数字特征与相关分析 27

1.3.1 二元数据的数字特征及相关系数 27

1.3.2 多元数据的数字特征及相关矩阵 31

1.3.3 总体的数字特征及相关矩阵 33

习题一 41

第2章 非参数方法 45

2.1 两种处理方法比较的秩检验 45

2.1.1 两种处理方法比较的随机化模型及秩的零分布 45

2.1.2 Wilcoxon秩和检验 47

2.1.3 总体模型的Wilcoxon秩和检验 55

2.1.4 Smirnov检验 56

2.2 成对分组设计下两种处理方法的比较 60

2.2.1 符号检验 61

2.2.2 Wilcoxon符号秩检验 63

2.2.3 分组设计下两处理方法比较的总体模型 68

2.3 多种处理方法比较的Kruskal-Wallis检验 69

2.3.1 多种处理方法比较中秩的定义及Kruskal-Wallis统计量 69

2.3.2 Kruskal-Wallis统计量的零分布 70

2.4 分组设计下多种处理方法的比较 73

2.4.1 分组设计下秩的定义及其零分布 73

2.4.2 Friedman检验 74

2.4.3 改进的Friedman检验 77

2.5 列联表的独立性检验 80

2.5.1 定性变量与列联表 80

2.5.2 二维r×s列联表的独立性检验 83

2.5.3 三维r×s×t列联表的独立性检验 84

习题二 90

3.1 线性回归模型 94

3.1.1 线性回归模型及其矩阵表示 94

第3章 回归分析 94

3.1.2 β及σ2的估计 95

3.1.3 有关的统计推断 96

3.2 残差分析 103

3.2.1 误差项的正态性检验 104

3.2.2 残差图分析 106

3.3.1 穷举法 109

3.3 回归方程的选取与系统建模概述 109

3.3.2 逐步回归法 118

3.3.3 系统建模过程概述 122

3.4 Logistic回归模型 124

3.4.1 线性Logistic回归模型 124

3.4.2 参数的最大似然估计与Newton-Raphson迭代解法 126

3.4.3 Logistic模型的统计推断 131

习题三 135

4.1 引言 141

第4章 主成分分析 141

4.2 总体主成分 142

4.2.1 总体主成分的定义 142

4.2.2 总体主成分的求法 143

4.2.3 总体主成分的性质 144

4.2.4 标准化变量的主成分 146

4.3 样本主成分 148

习题四 154

第5章 判别分析 159

5.1 距离判别 159

5.1.1 判别分析的基本思想及意义 159

5.1.2 两个总体的距离判别 160

5.1.3 判别准则的评价 163

5.1.4 多个总体的距离判别 168

5.2 Bayes判别 171

5.2.1 Bayes判别的基本思想 171

5.2.2 两个总体的Bayes判别 172

5.2.3 多个总体的Bayes判别 182

5.3 逐步判别 187

5.3.1 判别效果的检验 188

5.3.2 逐步判别的步骤 193

习题五 198

第6章 聚类分析 205

6.1 距离与相似系数 205

6.1.1 聚类分析的基本思想及意义 205

6.1.2 样品间的相似性度量——距离 206

6.1.3 变量间的相似性度量——相似系数 208

6.2 谱系聚类法 210

6.2.1 类间距离 211

6.2.2 类间距离的递推公式 212

6.2.3 谱系聚类法的步骤 214

6.2.4 谱系聚类法的统计量 221

6.2.5 变量聚类 226

6.3 快速聚类法 228

6.3.1 快速聚类法的步骤 228

6.3.2 用Lm距离进行快速聚类 237

习题六 241

第7章 时间序列分析 245

7.1 平稳时间序列 245

7.1.1 时间序列分析及其意义 245

7.1.2 随机过程概念及其数字特征 245

7.1.3 平稳时间序列与平稳随机过程 250

7.1.4 平稳性检验及自协方差函数、自相关函数的估计 253

7.2.1 ARMA时间序列的定义 255

7.2 ARMA时间序列及其特性 255

7.2.2 ARMA序列的平稳性与可逆性 258

7.2.3 ARMA序列的相关特性 261

7.3 ARMA时间序列的建模与预报 269

7.3.1 ARMA序列参数的矩估计 270

7.3.2 ARMA序列参数的精估计 272

7.3.3 ARMA模型的定阶与考核 280

7.3.4 平稳线性最小均方预报 284

7.3.5 ARMA序列的预报 288

7.4.1 ARIMA序列及其预报 292

7.4 ARIMA序列与季节性序列 292

7.4.2 季节性序列及其预报 299

习题七 305

第8章 Bayes统计分析 310

8.1 Bayes统计模型 310

8.1.1 Bayes统计分析的基本思想及意义 310

8.1.2 Bayes统计模型 310

8.1.3 Bayes统计推断原则 315

8.1.4 先验分布的Bayes假设与不变先验分布 317

8.1.5 共轭先验分布 320

8.1.6 先验分布中超参数的确定 324

8.1.7 后验分布的计算 329

8.2 Bayes统计推断 331

8.2.1 Bayes参数点估计 331

8.2.2 Bayes区间估计 338

8.2.3 Bayes假设检验 343

习题八 349

9.1 SAS系统简介 352

第9章 常用数据分析方法的SAS过程简介 352

9.1.1 数据的输入与输出 353

9.1.2 利用已有的SAS数据集建立新的SAS数据集 355

9.1.3 SAS系统的数学运算符号及常用的SAS函数 357

9.1.4 逻辑语句与循环语句 360

9.2 常用数据分析方法的SAS过程 362

9.2.1 几种描述性统计分析的SAS过程 362

9.2.2 非参数方法的SAS过程 372

9.2.3 回归分析的SAS过程 376

9.2.4 主成分分析的SAS过程——PROC PRINCOMP过程 383

9.2.5 判别分析的SAS过程 385

9.2.6 聚类分析的SAS过程 389

9.2.7 时间序列分析的SAS过程——PROC ARIMA过程 394

9.2.8 SAS系统的矩阵运算——PROC IML过程简介 400

9.2.9 Bayes统计分析计算实例 402

常用统计数值表 405

主要参考文献 411