《大维统计分析》PDF下载

  • 购买积分:16 如何计算积分?
  • 作  者:白志东,郑术蓉,姜丹丹编著
  • 出 版 社:北京:高等教育出版社
  • 出版年份:2012
  • ISBN:9787040348309
  • 页数:525 页
图书介绍:本书系统介绍了传统多元统计分析的一般理论和方法,同时也探讨了当前十分热门的大维数据分析问题。本书的主要创新之处在于将大维随机矩阵谱分析理论引进大维数据分析中,即在样本量和数据维数成比例增长的前提下,探讨基于全新理念的解决办法,或应用随机矩阵谱分析理论对大多数传统多元统计分析方法给以修正,使之兼顾高维、低维数据的不同情形,从而避免经典多元统计分析方法在处理大维数据时出现严重估计偏差甚至检验完全失效的怪异现象。本书适用于统计学及与统计学相关的专业的本科生、硕士生、博士生和科研工作人员。

第一章 引论 1

1.1多元统计分析 1

1.2多元正态分布 2

1.3大维统计分析 2

1.4大维随机矩阵的谱分析 3

第二章 多元正态分布 5

2.1引论 5

2.2多元正态分布的定义 6

2.2.1标准p元正态分布 6

2.2.2一般p元正态分布的定义 6

2.2.3多元正态分布的特征函数、矩母函数和密度 7

2.2.4二元正态分布的密度公式 7

2.2.5多元正态分布的相关系数和相关系数矩阵 8

2.3多元正态分布的性质 8

2.3.1多元正态分布族在线性变换下的性质 8

2.3.2多元正态分布密度的等高线 9

2.3.3正态随机变量线性组合的分布、独立性及边缘分布 10

2.4条件分布和多重相关系数 12

2.4.1条件分布 12

2.4.2多重相关系数 14

2.4.3偏相关的一些公式 16

2.5多元正态分布的二次型及其独立性 17

2.5.1二次型的矩和矩母函数 18

2.5.2线性型、二次型相互独立的充要条件 19

2.6复多元正态分布的定义及基本性质 22

2.6.1复数运算的补充代数知识 22

2.6.2复多元正态分布的定义和性质 23

2.6.3极大似然估计 24

2.7练习题 25

第三章 均值向量与协方差矩阵的估计 31

3.1引论 31

3.2均值向量和协方差矩阵的极大似然估计 32

3.3协方差矩阵已知时,样本均值向量的分布及统计推断 36

3.3.1分布理论 36

3.3.2协方差矩阵已知时,关于均值向量的检验和置信域 37

3.3.3非中心化x2分布与功效函数 40

3.4均值向量估计的性质 41

3.4.1极大似然估计的性质 41

3.4.2 Bayes与minmax估计 43

3.5均值向量的改进估计 45

3.5.1引论 45

3.5.2 James-Stein估计量 45

3.5.3协方差矩阵已知时任意二次损失函数下的估计 48

3.6练习题 51

第四章 样本相关系数的分布与应用 57

4.1引论 57

4.2二元样本相关系数 58

4.2.1总体相关系数为零时样本相关系数的分布及不相关的假设检验 58

4.2.2总体相关系数非零时样本相关系数的分布,假设检验和置信区间 61

4.2.3样本相关系数与Fisher z的渐近分布 66

4.3偏相关系数,条件分布 69

4.3.1偏相关系数的估计 69

4.3.2样本偏相关系数的分布 73

4.3.3偏相关系数的假设检验和置信区间 75

4.4多重相关系数 75

4.4.1多重相关系数的估计 75

4.4.2总体多重相关系数为零时样本多重相关系数的分布 79

4.4.3总体多重相关系数非零时样本多重相关系数的分布 82

4.4.4多重相关检验的某些最优性 85

4.5多重相关系数的大维表现 85

4.5.1大维情形下样本多重相关系数的极限 86

4.5.2大维情形下多重相关系数的中心极限定理 87

4.5.3大维情形下关于多重相关系数的假设检验与置信区间 89

4.6练习题 89

第五章T2统计量 96

5.1引论 96

5.2T2统计量的推导及其分布 97

5.2.1T2统计量作为似然比准则函数的推导 97

5.2.2T2统计量的分布 98

5.3T2统计量的应用 101

5.3.1检验单总体均值向量等于某个给定的向量 101

5.3.2均值向量的置信域 101

5.3.3均值向量的所有线性组合的一致置信区间 102

5.3.4两样本问题 103

5.3.5多个样本的问题 103

5.3.6关于对称性的一个问题 104

5.3.7改进的均值向量估计 105

5.4T2在备择假设下的分布及势函数 106

5.5协方差矩阵不等时的两样本问题 108

5.6T2检验的一些最优性质 111

5.6.1最优不变检验 111

5.6.2可容许检验 113

5.7大维情形下的均值检验问题 117

5.7.1Dempster的非精确检验 118

5.7.2白-Saranadasa的渐近正态检验 121

5.7.3陈-秦改进的检验 124

5.7.4模拟结果和评论 129

5.8练习题 131

第六章 判别分析 136

6.1判别问题 136

6.2判别的准则 137

6.2.1初步考虑 137

6.2.2两个总体的情形 137

6.3概率分布已知的两个总体的判别方法 139

6.3.1先验分布已知的情形 139

6.3.2先验概率未知的情形 140

6.4两个已知多元正态分布的判别 141

6.5参数未知时两个正态总体的判别 144

6.5.1判别准则 144

6.5.2判别准则的分布 145

6.5.3判别准则的渐近分布 146

6.5.4判别准则的另外一种推导 147

6.5.5似然比准则 147

6.5.6不变性 149

6.6错判概率 150

6.6.1准则W的错判概率的渐近展开 150

6.6.2准则Z的错判概率的渐近展开 153

6.7多个总体的判别 154

6.8多个多元正态分布的判别 157

6.8.1基本理论 157

6.8.2一个例子 159

6.9两个已知的具有不同协方差矩阵的多元正态总体的判别 161

6.9.1似然方法 161

6.9.2线性方法 162

6.10大维判别分析 166

6.10.1A-准则与D-准则 166

6.10.2两个正态总体时D-准则的错判概率 167

6.10.3两个正态总体时A-准则的错判概率 169

6.10.4A-准则与D-准则的比较与评论 170

6.11练习题 171

第七章 样本协方差矩阵的分布与广义方差 174

7.1引论 174

7.2Wishart分布 175

7.3 Wishart分布的性质 178

7.3.1 Wishart分布的特征函数 178

7.3.2 Wishart矩阵的和 178

7.3.3 Wishart矩阵的线性变换 179

7.3.4 Wishart分布的边缘分布 179

7.3.5条件分布 180

7.4 Cochran定理 180

7.5广义方差 182

7.5.1广义方差的定义 182

7.5.2样本广义方差的分布 185

7.5.3样本广义方差的渐近分布 187

7.6当总体协方差矩阵是对角矩阵时全体相关系数的分布 187

7.7逆Wishart分布和协方差矩阵的Bayes估计 189

7.7.1逆Wishart分布 189

7.7.2协方差矩阵的Bayes估计 189

7.8协方差矩阵的改良估计 192

7.9非中心化Wishart分布 196

7.10大维架构下样本广义方差的性质与统计推断 200

7.10.1大维架构下样本广义方差的极限与中心极限定理 200

7.10.2大维架构下关于广义方差的假设检验和区间估计 202

7.11练习题 204

第八章 一般线性假设的检验及方差分析 209

8.1引论 209

8.2多元线性回归的参数估计 210

8.2.1极大似然估计,最小二乘估计 210

8.2.2β和∑的分布 212

8.3关于回归系数线性假设的似然比检验准则 215

8.3.1似然比准则 215

8.3.2几何解释 216

8.3.3标准型 218

8.4原假设下似然比准则的分布 219

8.4.1分布的刻画 219

8.4.2准则的矩 222

8.4.3一些特殊情形下的分布 224

8.4.4似然比方法 226

8.4.5逐步检验方法 227

8.5似然比准则分布的渐近展开 228

8.5.1渐近展开的一般理论 228

8.5.2似然比准则的渐近分布 232

8.5.3正态逼近 234

8.5.4 F逼近 235

8.6线性假设检验的其他准则 236

8.6.1相对特征根的函数 236

8.6.2 Lawley-Hotelling的迹准则 237

8.6.3 Bartlett-Nanda-Pillai的迹准则 239

8.6.4 Roy的最大根准则 240

8.6.5功效的比较 241

8.7置信区间与回归系数矩阵的假设检验 243

8.7.1假设检验 243

8.7.2基于U的置信区间 244

8.7.3基于Lawley-Hotelling迹的联立置信区间 244

8.7.4基于Roy最大根准则的联立置信区间 245

8.8对具有相同协方差矩阵的多个正态分布的均值相等的检验 246

8.9多元方差分析 249

8.10一些检验的最优性质 254

8.10.1不变检验的可容许性 254

8.10.2无偏检验和功效函数的单调性 263

8.11大维回归分析 267

8.11.1似然比准则的渐近分布 267

8.11.2拟似然比准则的渐近分布的稳健性 269

8.11.3基于最小二乘法的非精确检验 270

8.11.4模拟比较 271

8.12练习题 273

第九章 分组变量的独立性检验 280

9.1引言 280

9.2分组变量独立性检验的似然比准则 280

9.3原假设为真时似然比准则的分布 284

9.3.1分布的刻画 284

9.3.2准则函数的矩 285

9.3.3某些特例下的分布 286

9.3.4似然比准则的分布的渐近展开 286

9.4其他检验方法 288

9.4.1其他准则 288

9.4.2按分块逐步下降检验 289

9.4.3按照分量的逐步下降检验方法 289

9.4.4一个例子 291

9.5变量分为两个集合的情况 292

9.6似然比检验的基本性质 295

9.6.1容许性 295

9.6.2势函数的单调性 296

9.7大变量组独立性的检验 298

9.7.1两组变量独立性检验在大维架构下的近似分布 298

9.7.2多组变量独立性检验在大维架构下的近似分布 300

9.7.3当变量个数接近于自由度时两大组变量的独立性检验 301

9.7.4模拟检验 302

9.8练习题 306

第十章 均值和方差齐性的检验 308

10.1引论 308

10.2检验多个协方差矩阵相等的准则 308

10.3检验多个正态总体同分布 311

10.3.1检验的准则函数 311

10.3.2准则函数的分布 312

10.3.3准则函数的矩 315

10.3.4逐步检验 317

10.3.5准则分布的渐近展开 318

10.4两个总体的情况 321

10.4.1不变检验 321

10.4.2方差分量模型 323

10.5检验协方差矩阵与某个给定矩阵成比例及球形检验 325

10.5.1假设 325

10.5.2准则函数 325

10.5.3准则函数的分布和矩 327

10.5.4分布的渐近展开 328

10.5.5不变检验 328

10.5.6置信域 329

10.6检验协方差矩阵等于某个给定矩阵 330

10.6.1准则函数 330

10.6.2修正似然比准则函数的分布和矩 331

10.6.3不变检验 333

10.6.4二次型的置信界 333

10.7检验均值向量和协方差矩阵分别等于给定的向量和矩阵 334

10.8可容许检验 336

10.9均值向量协方差矩阵齐性的大维分析 339

10.9.1检验一个总体协方差矩阵等于一个给定的矩阵的似然比检验的修正 339

10.9.2检验两个总体协方差矩阵相等的似然比检验的修正 340

10.9.3检验多个总体协方差矩阵相等的似然比检验的修正 341

10.9.4检验多个正态总体分布相等的似然比检验的修正 343

10.9.5当维容比靠近1时检验多个正态总体分布相等的修正似然比检验 345

10.10练习题 347

第十一章 主成分分析 352

11.1引论 352

11.2总体主成分的定义及性质 353

11.2.1总体主成分的定义 353

11.2.2主成分及其方差的极大似然估计 355

11.2.3主成分的极大似然估计的计算 356

11.2.4一个例子 358

11.3统计推断 360

11.3.1渐近分布 360

11.3.2特征向量的置信域 361

11.3.3特征根的精确置信界 362

11.4关于协方差矩阵的特征根的假设检验 363

11.4.1关于若干个最小特征根和的假设检验 363

11.4.2关于最小特征根的和相对于所有特征根的和的假设检验 364

11.4.3关于最小特征根相等的假设检验 364

11.5大维主成分分析 366

11.5.1离群特征根的极限 367

11.5.2离群特征向量的极限 369

11.5.3离群特征根的中心极限定理 371

11.5.4本质离群特征根的估计和统计推断 377

11.5.5待解决的问题 379

11.6练习题 379

第十二章 典则相关系数与典则变量 382

12.1引论 382

12.2总体典则相关系数与典则变量 383

12.3典则相关系数与典则变量的估计 388

12.3.1极大似然估计 388

12.3.2计算方法 390

12.4统计推断 392

12.4.1独立性检验和秩检验 392

12.4.2典则相关系数的渐近分布 393

12.5例 394

12.6与共线性相关的特征数值 395

12.6.1回归矩阵的典则分析 395

12.6.2估计 398

12.6.3典则变量间的关系 399

12.6.4回归系数矩阵秩的检验 399

12.6.5线性泛函关系 399

12.7降秩回归 400

12.8联立方程模型 403

12.8.1模型 403

12.8.2特定零点的确认 404

12.8.3简化形式的估计 405

12.8.4方程系数的估计 405

12.8.5与线性泛函的联系 407

12.8.6 T→∞时的渐近理论 408

12.9大维架构下的典则相关分析 410

12.9.1关于特征根与特征向量的渐近分布的一般理论 410

12.9.2变量组一大一小时的典则相关分析 415

12.9.3未解决的问题 420

12.10练习题 421

第十三章 特征根与特征向量的分布 423

13.1引论 423

13.2两个Wishart矩阵的情形 423

13.2.1矩阵分解 423

13.2.2Jacobi行列式 426

13.2.3矩阵E和特征根F的联合分布 428

13.2.4A奇异时的分布 429

13.3非奇异的Wishart矩阵 430

13.4典则相关系数 435

13.5Wishart矩阵与F矩阵的特征根与特征向量的渐近分布 436

13.5.1总体特征根全不相同的情形 436

13.5.2总体协方差矩阵有复重特征根的情形 438

13.6两个Wishart矩阵情形下的渐近分布 438

13.6.1非随机情形下相对特征根与特征向量的极限 438

13.6.2一般场合下两个Wishart矩阵相对特征根与特征向量的极限分布 440

13.7典则相关系数的渐近分布 443

13.7.1两个变量集都是随机的情形 443

13.7.2一个变量集随机而另一个变量集非随机的情形 445

13.7.3降秩回归估计 447

13.8练习题 448

第十四章 因子分析 450

14.1引论 450

14.2因子分析模型 451

14.2.1因子分析模型的定义 451

14.2.2可识别性 453

14.2.3测量的单位 455

14.3随机正交因子的极大似然估计 456

14.3.1极大似然估计 456

14.3.2模型拟合假设检验 459

14.3.3估计的渐近分布 461

14.3.4最小距离方法 461

14.3.5与主成分分析的关系 462

14.3.6重心方法 463

14.4固定因子的估计 464

14.5因子的解释与变换 464

14.5.1解释 464

14.5.2变换 464

14.5.3正交因子和斜交因子 466

14.6以限定零元素为可识别性条件的参数估计 467

14.7因子得分估计 467

14.8练习题 468

附录A矩阵知识 470

A.1方阵的行列式及其性质 470

A.1.1方阵的行列式的定义 470

A.1.2方阵的行列式的性质 471

A.2矩阵的特征根与特征向量 471

A.2.1特征根与特征向量的定义 471

A.2.2实对称矩阵 472

A.2.3谱分解定理 473

A.2.4奇异值分解定理 474

A.2.5 Chosky分解定理 475

A.2.6相对特征根与同时对角化问题 476

A.3分块矩阵与向量 477

A.3.1可逆矩阵的分块求逆 477

A.3.2分块向量的二次型 477

A.3.3对称矩阵相合下的标准型 478

A.4矩阵拉长向量和矩阵的Kronecker乘积 479

A.5关于向量或矩阵的导数 480

A.6广义逆与投影矩阵 481

A.6.1广义逆 481

A.6.2投影矩阵 482

A.7对称矩阵在相合变换下的Jacobi行列式 483

A.8 一般矩阵在仿射变换下的Jacobi行列式 485

附录B大维随机矩阵谱分析知识 486

B.1经验谱分布与极限谱分布 486

B.2随机矩阵极端特征根的极限 492

B.2.1样本协方差矩阵最大最小特征根的极限 492

B.2.2谱分离定理 493

B.3线性谱统计量的中心极限定理 495

B.3.1样本协方差矩阵的线性谱统计量的中心极限定理 495

B.3.2F矩阵的线性谱统计量的中心极限定理 496

B.3.3定理B.3.2的应用 497

参考文献 500

术语索引 517

人名索引 521