当前位置:首页 > 数理化
数据分析教程
数据分析教程

数据分析教程PDF电子书下载

数理化

  • 电子书积分:11 积分如何计算积分?
  • 作 者:包研科编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2011
  • ISBN:9787302265962
  • 页数:256 页
图书介绍:本书作为工科“概率论与数理统计”课程后续统计数据分析类课程的教材。内容包括:非参数统计推断、方差分析和多元线性分析的基本内容等。
《数据分析教程》目录

1数据分析常用的概率分布 1

1.1计数与计数值的概率分布 1

1.1.1二项分布 1

1.1.2泊松分布 4

1.1.3多项分布 6

1.2测量误差与正态分布 7

1.2.1测量误差的分布 7

1.2.2正态分布 11

1.2.3多维正态分布 13

1.3抽样分布 16

1.3.1基于正态分布的抽样分布 16

1.3.2基于多维正态分布的抽样分布 23

1.4常用概率分布的MATLAB函数 27

习题1 30

2数据的浓缩与直观分析 32

2.1数据的浓缩 32

2.1.1样本矩 32

2.1.2顺序统计量 34

2.1.3样本方差-协方差矩阵 36

2.1.4数据浓缩的MATLAB函数 38

2.2数据的图示与分析 42

2.2.1频率分布与直方图 42

2.2.2五数概括与box图 46

2.2.3线性相关性与散布图 48

2.2.4数据类与轮廓图,调和曲线图 49

2.3数据的正态性评估 52

2.3.1数据正态性评估的基本策略 52

2.3.2正态概率图 53

2.3.3分布的一致性与Q-Q图 55

2.3.4样本的广义距离与卡方图 56

习题2 59

3数据的预处理与变量系统的降维 62

3.1数据的预处理 62

3.1.1问题与工作目标 62

3.1.2数据异常值的发现与处理 63

3.1.3非正态数据的正态化变换 65

3.1.4参考点的建立、极性转换、消除量纲与数量级的规范化 65

3.2主成分分析 68

3.2.1问题与工作目标 68

3.2.2主成分的构造方法 69

3.2.3主成分的统计估计 70

3.2.4基于主成分分析的变量系统的降维 71

3.3典型相关分析 76

3.3.1问题与工作目标 77

3.3.2典型变量的构造方法 78

3.3.3典型变量与典型相关系数的统计估计 79

3.3.4典型相关系数的显著性检验 81

3.3.5典型冗余分析 82

习题3 86

4统计推断——参数的估计与检验 89

4.1参数的估计 89

4.1.1问题与工作目标 89

4.1.2构造估计量的方法 89

4.1.3估计量的效能分析 92

4.1.4参数的置信域分析 94

4.1.5正态总体均值与方差的估计 95

4.1.6非正态总体的参数估计 98

4.2参数的假设检验 99

4.2.1问题与工作目标 99

4.2.2检验的思维逻辑与方法 100

4.2.3正态总体均值与方差的检验 102

4.2.4非正态总体参数的检验 107

4.2.5参数检验若干问题的进一步讨论 111

4.3r维正态总体的参数推断 117

4.3.1问题与工作目标 117

4.3.2均值向量与协方差矩阵的估计 118

4.3.3均值向量与协方差矩阵的检验 122

习题4 126

5统计推断——非参数检验 129

5.1非参数检验的基本概念 129

5.1.1非参数检验问题 129

5.1.2 Pearson方法 130

5.1.3 Wilcoxon方法 131

5.2分布拟合优度检验 134

5.2.1连续分布的拟合优度检验 134

5.2.2正态性检验的常用方法 135

5.3分布一致性检验 138

5.3.1两个连续分布的一致性检验 138

5.3.2多个分布的一致性检验 139

5.4独立性检验 141

5.4.1列联表检验 141

5.4.2秩相关系数检验 142

5.5随机性检验 144

5.5.1均匀性检验 144

5.5.2同分布检验 145

习题5 147

6方差分析——类均值一致性检验 150

6.1方差分析的基本概念 150

6.1.1问题与工作目标 150

6.1.2统计推断的思想与方法 151

6.2单因子方差分析 152

6.2.1统计模型 152

6.2.2检验方法 153

6.2.3多重比较与效应估计 156

6.2.4方差齐性检验 159

6.3双因子方差分析 161

6.3.1统计模型 161

6.3.2检验方法 162

6.3.3最优因子组合的估计 165

6.4多元方差分析 166

6.4.1统计模型与检验方法 166

6.4.2协方差矩阵相等性的检验 168

6.4.3几点说明 168

习题6 169

7回归分析——相关关系的数学模型 171

7.1线性回归分析 171

7.1.1问题与工作目标 171

7.1.2回归方程的建立 173

7.1.3回归方程的显著性检验 175

7.1.4自变量的筛选与回归方程的优化 176

7.1.5基于最优回归方程的统计推断 179

7.1.6伪非线性回归分析 180

7.2偏最小二乘回归分析 184

7.2.1问题与工作目标 184

7.2.2偏最小二乘回归方程的建立 185

7.2.3偏最小二乘方法的辅助分析 188

7.3Logistic回归分析 192

7.3.1问题与基本概念 192

7.3.2 Logistic回归方程的建立 194

7.3.3几点说明 195

习题7 198

8聚类与判别——事物相似性的分析 202

8.1相似性及其度量 202

8.1.1距离——样品之间的相似性度量 202

8.1.2相似系数——变量之间的相似性度量 204

8.1.3点集之间的相似性度量 205

8.2聚类分析 207

8.2.1问题与工作目标 207

8.2.2谱系聚类法 207

8.2.3 K-均值聚类法 210

8.2.4有序样品聚类法 211

8.3判别分析 215

8.3.1问题与工作目标 215

8.3.2距离判别法 216

8.3.3 Fisher判别法 217

8.3.4几点说明 219

习题8 220

附录A MATLAB语言简介 223

A.1数值矩阵的建立与基本操作 223

A.1.1直接输入法 223

A.1.2文件装载法 224

A.1.3函数生成法 224

A.1.4矩阵的基本操作 224

A.2基本数学运算 225

A.2.1矩阵的代数运算 226

A.2.2标量批处理运算 227

A.2.3矩阵的关系和逻辑运算 228

A.3数据的图形化 229

A.3.1数据图形化的常用指令 229

A.3.2多窗口绘图技术 229

A.3.3点线图的单窗口多图技术 230

A.3.4图形的标记 231

A.4自定义M文件的编写 231

A.4.1运算流程的控制 231

A.4.2指令集的函数化 232

A.4.3 m文件的保护 233

A.5 MATLAB使用常识 233

附录B Statistics Toolbox中的常用函数 234

B.1常用概率分布 234

B.2统计量与统计作图 237

B.3统计推断 239

B.4协方差结构分析 240

B.5线性模型 240

B.6模式识别 241

B.7其他 241

附录C本书自定义的MATLAB函数 242

C.1 mnormpdfplot.m 242

C.2 interplot.m 242

C.3 chi2plot.m 243

C.4 stand.m 244

C.5 corrstand.m 244

C.6 chi2normtest.m 245

C.7 cttest.m 245

C.8 cca.m 246

C.9 ccorrtest.m 247

C.10 plscca.m 247

C.11 p1scoeff.m 250

C.12 plsvip.m 251

C.13 logitcoeff.m 251

C.14 lp.m 252

C.15 dclass.m 253

参考文献 255

致谢 256

返回顶部