《统计学:从概念到数据分析》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:吴喜之编著
  • 出 版 社:北京:高等教育出版社
  • 出版年份:2008
  • ISBN:7040233932
  • 页数:196 页
图书介绍:本书包括概率基础、统计的基本概念、描述性统计、估计、假设检验、回归与分类等内容,同时介绍了决策树、神经网络,随机森林等组合方法,以及如何用R、SPSS、SAS来实现相应的计算目标。全书着重直观讨论,尽量少用公式,避免数学推导,强调统计学的基本内容及应用,使读者能够逻辑完整、准确地理解统计学的概念,学会通过计算机统计软件进行数据分析。本书曾在在中国人民大学非统计学专业本科生及研究生的统计学课程中试用,主要是为非数学类、非统计学类专业的学生和读者编写,不要求任何经验知识。

第一章 引言 1

1.1什么是科学方法? 1

1.2统计是什么? 3

1.3学习统计需要的基础知识和技能 6

1.4习题 8

第二章 变量和数据 10

2.1数据和变量概述 10

2.2概率和随机变量 12

2.3数据的收集 15

2.4个体、总体、样本和抽样 16

2.5附录 18

2.6习题 23

第三章 描述统计学方法 25

3.1制表方法 25

3.2图描述方法 27

3.3用少量汇总数字的描述方法 39

3.4软件的使用 46

3.5习题 48

第四章 变量的分布 50

4.1和定量变量有关的事件 50

4.2变量的分布 51

4.3离散型变量的分布 52

4.3.1二项分布 53

4.3.2多项分布 57

4.3.3超几何分布 58

4. 3.4 Poisson分布 61

4.4连续型变量的分布 62

4.4.1正态分布 64

4.4.2总体分位数和尾概率 66

4.4.3x2分布 68

4.4.4 t分布 69

4.4.5 F分布 71

4.4.6均匀分布 72

4.5用小概率事件进行判断 73

4.6抽样分布和中心极限定理 74

4.6.1样本函数的分布 74

4.6.2样本均值的性质和中心极限定理 76

4.7变换非正态数据,使其更加接近于正态假定 79

4.8统计量的一些常用函数 82

4.9软件的使用 84

4.10习题 87

第五章 简单统计推断:对总体参数的估计 88

5. 1点估计 88

5.2区间估计 90

5.2.1正态分布总体均值μ的区间估计 92

5.2.2两个独立正态分布总体均值差μ1-μ2的区间估计 95

5.2.3配对正态分布总体均值差μD μ1-μ2的区间估计 97

5.2.4总体比例(Bernoulli试验成功概率)p的区间估计 98

5.2.5总体比例(Bernoulli试验成功概率)之差p1-p2的区间估计 101

5.3软件的使用 102

5.4习题 103

第六章 简单统计推断:总体参数的假设检验 105

6.1假设检验的过程和逻辑 105

6.2正态总体均值的检验 110

6.2.1对一个正态总体均值μ的t检验 110

6.2.2.对两个正态总体均值之差μ1- μ2的t检验 113

6.2.3配对正态分布总体均值差μD=μ1- μ2的t检验 115

6.3总体比例(Bernoulli试验成功概率)的检验 115

6.3.1.一个总体比例p的检验 115

6.3.2两个总体比例之差p1 -p2的检验 117

6.4关于中位数的非参数检验 118

6.4.1非参数检验简介 118

6.4.2单样本的关于总体中位数(或总体α分位数)的符号检验 119

6.4.3单样本的关于对称总体中位数(总体均值)的Wilcoxon符号秩检验 121

6.4.4两独立样本的比较总体中位数的W ilcoxon秩和检验 122

6.5软件的使用 123

6.6习题 128

第七章 变量之间的关系 130

7.1定性变量之间的相关 130

7.1. 1列联表 130

7.1.2两个定性变量相关性的x2检验 132

7.2定量变量之间的相关 134

7.2.1定量变量之间关系的描述 134

7.2.2定量变量之间相关的概念 136

7.2.3 Pearson线性相关系数及相关的检验 137

7.2.4 KendallT相关系数 140

7.2.5 Spearm an秩相关系数 140

7.3软件的使用 141

7.4习题 142

第八章 经典回归和分类 144

8.1回归和分类概述 144

8.1.1“黑匣子”说法 144

8.1.2试图破解“黑匣子”的实践 145

8.1.3回归和分类的区别 146

8.2线性回归模型 147

8.2.1因变量和自变量均为数量型变量的线性回归模型 147

8.2.2因变量是数量变量,而自变量包含分类变量的线性回归模型 158

8.3 Logistic回归 163

8.4判别分析 167

8.5软件的使用 169

8.6习题 172

第九章 现代回归和分类:数据挖掘所用的方法 174

9.1决策树:分类树和回归树 174

9.1.1分类树 175

9.1.2回归树 180

9.2组合方法:adaboost、bagging和随机森林 184

9.2.1为什么组合? 184

9.2.2 Adaboost 186

9.2.3 Bagging 188

9.2.4随机森林 189

9.3最近邻方法 193