第一篇 数据探索与数据收集 1
第1章 统计学与变异 3
1.1 统计学是什么? 3
1.2 本书有何用处 4
第2章 数据 9
2.1 什么是数据 10
2.2 变量类型 14
2.3 数据来源:where、how和when 18
小结 22
第3章 调查与抽样 25
3.1 抽样调查三原则 26
3.2 总体与参数 30
3.3 一般样本设计 31
3.4 有效调查 37
3.5 怎样使抽样变糟 39
小结 43
第4章 展示与描述定性数据 47
4.1 汇总定性变量 48
4.2 展示定性变量 51
4.3 探索两个定性变量:列联表 55
小结 69
第5章 展示与描述定量数据 74
5.1 显示定量数据 75
5.2 形状 80
5.3 中心 83
5.4 分布的离散度 85
5.5 形状、中心与离散度——一个总结 89
5.6 五数概括与箱线图 89
5.7 组间比较 93
5.8 确认异常值 96
5.9 标准化 98
5.10 时间序列数据 100
小结 106
第6章 相关性与线性回归 114
6.1 观察散点图 116
6.2 在散点图中指定变量的角色 118
6.3 理解相关关系 120
6.4 潜在变量与因果关系 126
6.5 线性模型 128
6.6 相关性与直线 129
6.7 向均值的回归 133
6.8 模型检验 135
6.9 模型的变异和R2 138
6.10 真实性检验:回归是否合理? 141
小结 146
第二篇 建模与推断 157
第7章 随机性与概率 159
7.1 随机现象与概率 160
7.2 不存在的平均值法则 162
7.3 不同类型的概率 164
7.4 概率原则 165
7.5 联合概率与列联表 172
7.6 条件概率 173
7.7 创建列联表 176
7.8 概率树 177
7.9 转换条件:贝叶斯准则 179
小结 181
第8章 随机变量与概率模型 185
8.1 随机变量的期望值 186
8.2 随机变量的标准差 188
8.3 期望值与方差的性质 191
8.4 离散概率模型 195
8.5 连续型随机变量 204
小结 221
第9章 抽样分布与比例的置信区间 225
9.1 样本比例的分布 226
9.2 比例的抽样分布 228
9.3 中心极限定理 233
9.4 置信区间 238
9.5 误差幅度:确定性与精确性 242
9.6 假设与条件 245
9.7 选择样本容量 248
小结 254
第10章 比例的假设检验 259
10.1 假设 260
10.2 作为假设检验的审判 263
10.3 P值 264
10.4 假设检验的原理 266
10.5 备择假设 268
10.6 α水平与显著性 271
10.7 临界值 274
10.8 置信区间与假设检验 275
10.9 两类错误 279
10.10 检验效力 281
小结 285
第11章 均值的置信区间和假设检验 291
11.1 均值的抽样分布 292
11.2 抽样分布模型如何有效 293
11.3 戈塞特与t分布 295
11.4 均值的置信区间 298
11.5 假设与条件 300
11.6 检验关于均值的假设——单样本t检验 308
小结 314
第12章 比较两个组 320
12.1 比较两个均值 321
12.2 两样本t检验 324
12.3 假设与条件 325
12.4 两个均值之差的置信区间 330
12.5 合并的t检验 332
12.6 图基快速检验 337
12.7 配对数据 339
12.8 配对t检验 341
小结 347
第13章 计数的推断:卡方检验 356
13.1 拟合优度检验 358
13.2 解释卡方值 363
13.3 检验残差 364
13.4 齐性的卡方检验 365
13.5 比较两个比例 372
13.6 独立性的卡方检验 374
小结 381
第三篇 决策建模 389
第14章 回归的推断 391
14.1 总体与样本 392
14.2 假设与条件 393
14.3 回归推断 396
14.4 预测值的标准误 402
14.5 使用置信区间和预测区间 406
14.6 外推与预测 408
14.7 不寻常与异常的观测值 410
14.8 处理汇总值 414
14.9 线性性质 416
小结 420
第15章 多元回归 427
15.1 多元回归模型 429
15.2 解释多元回归的系数 431
15.3 多元回归模型的假设和条件 433
15.4 检验多元回归模型 440
15.5 调整后的R2与F统计量 442
小结 446
第16章 数据挖掘概述 452
16.1 直接的市场营销 452
16.2 数据 453
16.3 数据挖掘的目标 455
16.4 数据挖掘的误区 456
16.5 成功的数据挖掘 457
16.6 数据挖掘的问题 459
16.7 数据挖掘的算法 460
16.8 数据挖掘的过程 464
16.9 总结 466
小结 468
附录 471