第一部分 导论与复习 1
第1章 经济问题与数据 3
1.1我们研究的经济问题 4
问题1减少班级人数能否改善初等教育效果 4
问题2住房贷款市场是否存在种族歧视 5
问题3烟草税能够多大程度地减少吸烟 5
问题4明年的通货膨胀率为多少 6
定量问题与定量解答者 7
1.2因果效应与理想实验 8
估计因果效应 8
预测与因果性 9
1.3数据:来源与种类 10
实验数据与观察数据 10
横截面数据 11
时间序列数据 11
面板数据 13
第2章 概率论复习 17
2.1随机变量与概率分布 18
概率、样本空间与随机变量 18
离散随机变量的概率分布 19
连续随机变量的概率分布 21
2.2期望值、均值与方差 23
随机变量的期望值 23
方差与标准差 24
随机变量的线性函数的均值与方差 25
概率分布形状的其他度量方法 26
2.3双随机变量 29
联合分布与边缘分布 29
条件分布 30
独立性 34
协方差与相关 34
随机变量总和的均值与方差 35
2.4正态分布、x2分布、t分布与F分布 39
正态分布 39
x2分布 43
t分布 44
F分布 44
2.5随机抽样与样本均值的分布 45
随机抽样 45
样本均值的抽样分布 46
2.6抽样分布的大样本近似 48
大数定律与一致性 49
中心极限定律 52
附录2.1主要概念2.3的推导结果 63
第3章 统计学复习 65
3.1母体均值的估计 66
估计量及其性质 67
Y的性质 68
随机抽样的重要性 70
3.2母体均值的假设检验 71
原假设与对立假设 72
p值 72
计算σY已知的p值 74
样本方差、样本标准差与标准误差 75
计算σY未知的p值 76
t统计量 77
预定置信水平的假设检验 78
单侧对立假设 80
3.3母体均值的置信区间 81
3.4比较不同母体的均值 83
两个均值差异的假设检验 83
两个母体均值差异的置信区间 84
3.5利用实验数据估计因果效应的均值差异 85
均值差异的因果效应 85
依据均值差异估计因果效应 87
3.6小样本的t统计量的使用 88
t统计量与常规t统计量 88
常规t统计量的实际运用 92
3.7散布图、样本方差与样本相关 92
散布图 93
样本协方差与相关 94
附录3.1美国人口普查 105
附录3.2 Y为μY的最小二乘估计量的两种证明 106
附录3.3样本方差的一致性证明 107
第二部分 回归分析基础 109
第4章 单回归量的线性回归(一元线性回归) 111
4.1线性回归模型 112
4.2估计线性回归模型的系数 116
最小二乘估计量 118
考试成绩与师生比率关系的最小二乘估计值 120
为何使用最小二乘估计量 121
4.3拟合的测度 123
R2 123
回归的标准误差 124
考试成绩数据的运用 125
4.4最小二乘法假定 126
假定1已知Xi时ui的条件分布具有零均值 126
假定2(Xi,Yi),i=1,…,n服从独立同分布 128
假定3不出现奇怪的离群值 129
最小二乘法假定的利用 130
4.5 OLS估计量的样本分布 131
OLS估计量 的样本八布 132
4.6结论 135
附录4.1加利福尼亚州的考试成绩数据 143
附录4.2 OLS估计量的推导 143
附录4.3 OLS估计量的样本分布 144
第5章 单回归量的线性回归:假设检验与置信区间 148
5.1单个回归系数的假设检验 149
β1的双侧假设 149
β1的单侧假设 153
截距β0的假设检验 155
5.2回归系数的置信区间 155
5.3 X为两元变量的回归 158
回归系数的解释 158
5.4异方差与同方差 160
何谓异方差与同方差 160
同方差的数学含义 163
异方差与同方差的实践含义 164
5.5最小二乘法的理论基础 166
线性条件无偏估计量与Gauss-Markov定理 167
非OLS的回归估计量 168
5.6小样本回归的t统计量的使用 169
t统计量与常规t统计量 170
常规t统计量的实际运用 170
5.7结论 171
附录5.1 OLS标准误差的公式 180
附录5.2 Gauss-Markov条件与Gauss-Markov定理的证明 182
第6章 多回归量线性回归 186
6.1遗漏变量偏倚 186
遗漏变量偏倚的定义 187
遗漏变量偏倚的公式 189
通过数据分组表示遗漏变量偏倚 191
6.2多元回归模型 193
母体回归线 193
母体多元回归模型 194
6.3多元回归的OLS估计量 196
OLS估计量 197
考试成绩与师生比率的应用 198
6.4衡量多元回归的拟合度 200
回归的标准误差 200
R2 200
调整R2 201
考试成绩数据的运用 202
6.5多元回归的最小二乘法假定 202
假定1已知Xli,X2i,…,Xki时ui的条件分布具有零均值 203
假定2 (X1i,X2i,…,Xki,Yi),i=1,2,…,n服从独立同分布 203
假定3不出现奇怪的离群值 203
假定4不存在完全共线性 203
6.6多元回归的OLS估计量的分布 205
6.7共线性 206
完全共线性的例子 206
不完全共线性 209
6.8结论 210
附录6.1公式(6.1)的推导 218
附录6.1两个回归量与同方差误差项的OLS估计量的分布 218
第7章 多元回归的假设检验与置信区间 220
7.1单个系数的假设检验与置信区间 221
OLS估计量的标准方差 221
单个系数的假设检验 221
单个系数的置信区间 223
考试成绩与师生比率的应用 223
7.2复合假设检验 225
两个或更多系数的假设检验 225
F统计量 227
考试成绩与师生比率的应用 229
7.3检验涉及多个系数的单一约束条件 230
7.4多个系数的置信集合 232
7.5多元回归的模型设定 234
多元回归的遗漏变量偏倚 235
模型设定的理论与实践 236
R2与调整R2的实践解释 237
7.6分析考试成绩数据 239
7.7结论 244
附录7.1复合假设的Bonferroni检验 251
第8章 非线性回归函数 254
8.1非线性回归函数模型化的一般策略 256
考试成绩与地区收入 256
非线性模型设定的X的变化给予Y的影响 260
利用多元回归的非线性模型化的一般方法 264
8.2单自变量的非线性函数 264
多项式 265
对数式 267
考试成绩与地区收入的多项式模型与对数式的模型 275
8.3自变量之间的相互作用 277
两个两元变量的相互作用 277
连续变量与两元变量的相互作用 280
两个连续变量的相互作用 286
8.4师生比率与考试成绩之间的非线性效应 290
讨论回归结果 291
总结研究发现 295
8.5结论 296
附录8.1参数之间存在非线性关系的回归函数 307
第9章 基于多元回归的研究评价 312
9.1内部有效性与外部有效性 313
威胁内部有效性的因素 313
威胁外部有效性的因素 314
9.2威胁多元回归分析的内部有效性的因素 316
遗漏变量偏倚 316
回归函数的形式的误定 319
变量误差 319
样本选择 322
联立因果性 324
OLS标准误差的不一致性源泉 325
9.3利用多元回归分析预测的内部有效性与外部有效性 327
利用回归模型预测 327
回归模型预测的有效性评价 328
9.4事例:考试成绩与班级规模 329
外部有效性 329
内部有效性 336
讨论与含义 337
9.5结论 338
附录9.1马萨诸塞州的小学考试成绩数据 344
第三部分 回归分析的深入讨论 347
第10章 面板数据的回归 349
10.1面板数据 350
案例:交通死亡与酒税 351
10.2两期面板数据:“前后”比较 353
10.3固定效应回归 356
固定效应回归模型 356
估计与推断 359
交通死亡的应用 360
10.4时间固定效应回归 361
只存在时间效应 361
个体效应与时间效应的共存 362
10.5固定效应回归的假设与回归标准差 364
固定效应回归的假设 364
固定效应回归的标准差 366
10.6饮酒驾车规律与交通事故死亡 367
10.7结论 371
附录10.1美国各州交通事故数据 378
附录10.2伴随序列相关误差的固定效应回归的标准误差 379
第11章 两元因变量的回归 383
11.1两元因变量与线性概率模型 384
两元因变量 385
线性概率模型 387
11.2 Probit与Logit回归 389
Probit回归 389
Logit回归 394
比较线性概率、Probit回归与Logit回归 396
11.3 Probit模型与Logit模型的估计与推断 396
非线性最小二乘估计 397
最大似然估计 398
拟合的测度 399
11.4波士顿HDMA数据的应用例 400
11.5总结 407
附录11.1波士顿HDMA数据集 415
附录11.2最大似然估计 415
附录10.2其他受限因变量模型 418
第12章 工具变量回归 421
12.1单回归量与单工具变量的IV估计量 422
IV模型与假定 422
两阶段最小二乘法估计量 423
IV回归的作用机制 424
TSLS估计量的样本分布 428
香烟需求的应用 430
12.2一般IV回归模型 432
一般IV回归模型的TSLS 433
一般IV回归模型的工具变量的相关性与外生性 434
IV回归假定与TSLS估计量的样本分布 434
利用TSLS估计量的推断 437
香烟需求的应用 437
12.3校验工具变量的有效性 439
假定1工具变量的相关性 439
假定2工具变量的外生性 443
12.4香烟需求的应用 445
12.5有效工具变量的来源 450
三个案例 451
12.6结论 455
附录12.1香烟消费的面板数据集 462
附录12.2方程(12.4)的TSLS估计量推导 462
附录12.3 TSLS估计量的大样本分布 463
附录12.4工具变量无效的TSLS估计量的大样本分布 464
附录12.5弱工具变量的工具变量分析 466
第13章 实验与拟实验 468
13.1理想实验与因果效应 470
理想的随机控制实验 470
差分估计量 471
13.2实施实验的潜在问题 472
威胁内部有效性的因素 472
威胁外部有效性的因素 475
13.3利用实验数据的因果效应的回归估计量 477
增加回归量的差分估计量 477
差分的差分估计量 480
不同群体的因果效应的估计 484
存在部分应允(compliance)的估计 484
检验随机化 485
13.4缩小班级规模的效应的实验估计 486
实验设计 486
STAR数据的分析 487
班级规模效应的观察估计值与实验估计值的比较 492
13.5拟实验 494
案例 495
分析拟实验的计量经济学方法 497
13.6拟实验的潜在问题 500
威胁内部有效性的因素 500
威胁外部有效性的因素 502
13.7不同母体的实验与拟实验的估计值 502
母体的异质性:谁的因果效应 502
不同因果效应的OLS 503
不同因果效应的IV回归 504
13.8结论 507
附录13.1 STAR项目的数据集 516
附录13.2差分的差分估计量的多期模型的扩展 517
附录13.3条件均值的独立性 518
附录13.4个体因果效应不同的IV估计 520
第四部分 经济时间序列的回归分析 523
第14章 时间序列回归与预测的导论 525
14.1利用回归模型预测 527
14.2时间序列数据与序列相关的导论 528
美国的通货膨胀率与失业率 528
滞后、一阶差分、对数与增长率 528
自相关 532
其他经济时间序列数据的例子 533
14.3自回归 535
一阶自回归模型 535
p阶自回归模型 538
14.4增加预测量的时间序列回归与自回归滞后分布模型 541
利用过去的失业率预测通货膨胀率的变化 541
平稳性 544
多预测量的时间序列回归 545
预测的不确定性与预测区间 548
14.5利用信息准则选择滞后长度 549
确定自回归的阶数 551
多预测量的时间序列回归的滞后长度选择 553
14.6非平稳性Ⅰ:趋势 554
何谓趋势 555
随机趋势导致的问题 557
发现随机趋势:AR模型的单位根检验 560
避免随机趋势导致的问题 564
14.7非平稳性Ⅱ:突变 565
何谓突变 565
检验突变 566
伪样本外推预测 571
避免突变导致的问题 576
14.8结论 577
附录14.1第14章的时间序列数据 586
附录14.2 AR(1)模型的平稳性 586
附录14.3滞后算子符号 588
附录14.4 ARMA模型 589
附录14.5 BIC滞后长度估计量的一致性 589
第15章 动态因果效应的估计 591
15.1橘子汁原味的数据 593
15.2动态因果效应 595
因果效应与时间序列数据 596
两种类型的外生性 598
15.3利用外生回归量估计动态效应 600
滞后分布模型假定 601
自相关ut、标准误差与推断 601
动态乘数与累积动态乘数 602
15.4异方差的标准误差与自相关的一致标准误差 604
存在自相关误差项的OLS估计量的分布 604
HAC标准误差 606
15.5利用严格外生回归量估计动态效应 608
存在AR(1)误差项的滞后分布模型 609
ADL模型的OLS估计 612
GLS估计 613
添加滞后项与AR(p)误差项的滞后分布模型 615
15.6橘子汁价格与凉爽气候 618
15.7外生性是否可信?部分事例 624
美国收入与澳大利亚出口 625
石油价格与通货膨胀 626
货币政策与通货膨胀 626
Phillips曲线 627
15.8结论 627
附录15.1橘子汁数据 634
附录15.1 ADL模型与滞后算子符号表示的一般最小二乘法 634
第16章 时间序列回归的补充内容 637
16.1向量自回归 638
VAR模型 638
通货膨胀率与失业率的VAR模型 641
16.2多期预测 642
迭代多期预测 643
直接多期预测 645
应该使用哪种方法? 647
16.3积分阶数与DF-GLS单位根检验 648
其他趋势模型与积分阶数 650
单位根的DF-GLS检验 653
为何单位根检验具有非正态分布 655
16.4协整 655
协整与误差修正 655
如何判断两个变量是否存在协整 658
估计协整系数 660
多元协整变量的扩展 661
利率的应用 662
16.5变动性聚类与自回归条件异方差 664
变动性聚类 665
自回归条件异方差 666
股价变动的应用 667
16.6结论 669
附录16.1第16章使用的美国金融数据 674
第五部分 回归分析的计量经济理论 675
第17章 单回归量线性回归的理论 677
17.1扩展的最小二乘法假定与OLS估计量 678
扩展的最小二乘法假定 678
OLS估计量 680
17.2渐近分布理论的基础 680
概率收敛与大数定理 681
中心极限定理与分布收敛 683
Slutsky定理与连续映射定理 685
基于样本均值的t统计量应用 685
17.3 OLS估计量与t统计量的渐近分布 686
OLS估计量的一致性与渐近正态性 686
异方差稳健的标准误差的一致性 686
异方差稳健的t统计量的渐近正态性 688
17.4正态分布误差项的精确样本分布 688
正态误差项的β1的分布 688
只存在同方差的t统计量的分布 690
17.5加权最小二乘法 691
已知异方差的WLS 691
已知异方差的函数形式的WLS 692
异方差稳健标准误差还是WLS 695
附录17.1连续随机变量的正态及相关分布与矩 700
附录17.2两个不等式 702
第18章 多元回归的理论 704
18.1线性多元回归模型与矩阵形式的OLS估计量 706
多元回归模型矩阵表示 706
扩展的最小二乘法假定 707
OLS估计量 708
18.2OLS估计量与t统计量的渐近分布 710
多元中心极限定理 710
^β的渐近正态性 710
异方差稳健的标准误差 711
预测的置信区间 712
t统计量的渐近分布 713
18.3复合假设的检验 713
矩阵表示的复合假设 713
F统计量的渐近分布 714
多系数的置信集合 714
18.4正态误差项的回归统计量的分布 715
OLS回归统计量的矩阵表示 715
正态误差项的^β的分布 716
Su2的分布 717
只存在同方差的标准误差 717
t统计量的分布 718
F统计量的分布 718
18.5同方差误差项的OLS估计量的有效性 719
多元回归的Gauss-Markov条件 719
线性条件无偏估计量 719
多元回归的Gauss-Markov定理 720
18.6一般最小二乘法 721
GLS假定 722
Ω已知的GLS 724
含未知参数的GLS 725
零条件均值假设与GLS 725
18.7工具变量与一般矩法估计 727
工具变量的矩阵表示 728
TSLS估计量的渐近分布 729
同方差的TSLS的性质 730
线性模型的一般矩法估计 733
附录18.1矩阵代数概要 743
附录18.2多元分布 747
附录18.3^β的渐近分布的推导 748
附录18.4正态误差项的OLS检验统计量的精确分布的推导 749
附录18.5多元回归的Gauss-Markov定理的证明 751
附录18.6 IV和GMM的部分结论证明 752
附录 755
参考文献 763
“概念复习”问题的解答 767
术语表 775
索引 783