《统计学 第4版》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:吴喜之编著
  • 出 版 社:北京:中国统计出版社
  • 出版年份:2013
  • ISBN:9787503767890
  • 页数:219 页
图书介绍:本书由浅入深地把统计最基本和最有用的部分在这么一本不厚的教科书中完整地介绍给读者,希望读者在学习之后,能够知道实际中哪些是统计问题,最好能够自己解决一部分统计问题,即使不能解决也知道能够在哪里查到答案和向谁请教。第四版在许多地方对前面几版进行了修改和增减,采用免费的自由软件R,使得整本书都显得简洁明了,学习更有效。

第一章 一些基本概念 1

1.1统计是什么? 1

1.2现实中的随机性和规律性,概率和机会 3

1.3变量和数据 3

1.4变量之间的关系 4

1.4.1定量变量间的关系 5

1.4.2 定性变量间的关系 7

1.4.3定性和定量变量间的混和关系 8

1.5统计、计算机与统计软件 8

1.6小结 11

1.7习题 11

第二章 数据的收集 13

2.1数据是怎样得到的? 13

2.2个体、总体和样本 13

2.3收集数据时的误差 15

2.4抽样调查和一些常用的方法 15

2.5计算机中常用的数据形式 18

2.6小结 19

2.7习题 20

第三章 数据的描述 21

3.1如何用图来表示数据? 21

3.1.1定量变量的图表示:直方图、盒形图、茎叶图和散点图 21

3.1.2定性变量的图表示:饼图和条形图 25

3.1.3其他图描述法 27

3.2如何用少量数字来概括数据? 29

3.2.1数据的“位置” 30

3.2.2数据的“尺度” 31

3.2.3数据的标准得分 32

3.3小结 34

3.3.1本章的概括和公式 34

3.3.2 R语句的说明 35

3.4习题 36

第四章 机会的度量:概率和分布 37

4.1得到概率的几种途径 37

4.2概率的运算 38

4.3变量的分布 41

4.3.1离散随机变量的分布 41

4.3.2连续随机变量的分布 45

4.3.3累积分布函数 51

4.4抽样分布、中心极限定理 53

4.5用小概率事件进行判断 56

4.6小结 56

4.6.1本章的概括和公式 56

4.6.2本章例题和R语句说明 61

4.6.3生成本章图形的R代码 63

4.7习题 65

第五章 简单统计推断:总体参数的估计 67

5.1用估计量估计总体参数 67

5.2点估计 68

5.3区间估计 69

5.3.1一个正态总体均值μ的区间估计 70

5.3.2两个正态总体均值之差μ 1-μ 2的区间估计 71

5.3.3总体比例(Bernoulli试验成功概率)p的区间估计 72

5.3.4总体比例(Bernoulli试验成功概率)之差p 1-p 2的区间估计 73

5.4关于置信区间的注意点 73

5.5小结 74

5.5.1本章的概括和公式 74

5.5.2 R语句的说明 78

5.6习题 79

第六章 简单统计推断:总体参数的假设检验 80

6.1假设检验的过程和逻辑 80

6.1.1假设检验的过程和逻辑 80

6.1.2假设检验在前计算机时代发展的一些概念和步骤 83

6.2对于正态总体均值的检验 84

6.2.1根据一个样本对其总体均值大小进行检验 84

6.2.2根据来自两个总体的独立样本对其总体均值的检验 87

6.2.3成对样本的问题 88

6.2.4关于正态性检验的问题 89

6.3对于比例的检验 90

6.3.1对于总体比例的检验 90

6.3.2对于连续变量比例的检验 92

6.4非参数检验 93

6.4.1关于非参数检验的一些常识 93

6.4.2关于单样本位置的符号检验 94

6.4.3关于单样本位置的Wilcoxon符号秩检验 95

6.4.4关于随机性的游程检验(runs test) 96

6.4.5比较两独立总体中位数的Wilcoxon (Mann-Whitney)秩和检验 97

6.5从一个例子说明“接受零假设”的说法不妥 98

6.6小结 100

6.6.1本章的概括和公式 100

6.6.2 R语句的说明 102

6.7习题 106

第七章 变量之间的关系;回归和分类 107

7.1问题的提出 107

7.2定量变量的线性相关 108

7.3经典回归和分类 111

7.3.1一个数量自变量的线性回归 111

7.3.2多个数量自变量的线性回归 113

7.3.3自变量中有定性变量的线性回归 115

7.3.4 Logistic回归 118

7.3.5自变量为数量变量时的分类:经典判别分析 120

7.4现代分类和回归:机器学习方法 123

7.4.1决策树 124

7.4.2关于组合算法 130

7.4.3 Boosting 132

7.4.4随机森林 134

7.4.5支持向量机 137

7.4.6交叉验证比较各个模型 139

7.5频数或列联表数据 141

7.5.1列联表数据及二维列联表的独立性检验 141

7.5.2高维列联表和多项分布对数线性模型 142

7.5.3 Poisson对数线性模型 144

7.6小结 146

7.6.1本章的概括和公式 146

7.6.2 R语句的说明 152

7.7习题 154

第八章 多元分析 156

8.1寻找多个变量的代表:主成分分析和因子分析 156

8.1.1主成分分析 156

8.1.2因子分析 163

8.1.3因子分析和主成分分析的一些注意事项 167

8.2把对象分类:聚类分析 167

8.2.1如何度量距离远近 168

8.2.2事先要确定分多少类:k均值聚类 168

8.2.3事先不用确定分多少类:分层聚类 170

8.2.4聚类要注意的问题 172

8.3两组变量之间的相关:典型相关分析 172

8.3.1两组变量的相关问题 172

8.3.2典型相关分析 173

8.4列联表行变量和列变量的关系:对应分析 176

8.5小结 178

8.5.1本章的概括和公式 178

8.5.2 R语句的说明 182

8.6习题 183

第九章 随时间变化的对象:时间序列分析 184

9.1时间序列的组成部分 185

9.2指数平滑 186

9.3 Box-Jenkins方法:ARIMA模型 187

9.3.1 ARIMA模型介绍 187

9.3.2 ARMA模型识别和估计 189

9.3.3用ARIMA模型拟合 192

9.4小结 196

9.4.1本章的概括和公式 196

9.5习题 198

第十章 生存分析简介 200

10.1对生命数据的简单描述 203

10.2 Cox比例危险模型 204

10.3小结 206

10.3.1本章的概括和公式 206

10.3.2 R语句的说明 207

10.4习题 207

第十一章 指数简介 208

11.1指数漫谈 208

11.2价格指数 208

11.3数量指数(生活标准指数) 209

11.4总花费指数 210

11.5一两个常见的经济指数 210

11.6小结 211

附录A练习:熟练使用R软件 212