第1章 引论 1
1.1 Stata特色概述 2
1.2 安装必要的软件 4
1.3 安装支持素材 5
第2章 Stata研究经济和金融数据基础 6
2.1 基础知识 6
2.1.1 use命令 6
2.1.2 变量类型 8
2.1.3 _n与_N 9
2.1.4 generate与replace 9
2.1.5 sort与gsort 10
2.1.6 if exp与in range 10
2.1.7 利用带指示变量的if exp 12
2.1.8 在统计命令中使用if exp与by varlist 14
2.1.9 Labels与notes 16
2.1.10 varlist 18
2.1.11 drop与keep 18
2.1.12 rename与renvars 19
2.1.13 save命令 19
2.1.14 insheet与infile 19
2.2 常见数据转换方法 20
2.2.1 cond()函数 20
2.2.2 对离散型与连续型变量重新编码 21
2.2.3 处理缺失数据 22
mvdecode与mvencode 23
2.2.4 字符串与数值间的相互转换 23
2.2.5 设置日期 25
2.2.6 使用有关generate与replace函数 26
2.2.7 egen命令 27
官方的egen函数 28
用户团体提供的egen函数 28
2.2.8 用by-分组计算 30
2.2.9 局部宏 33
2.2.10 变量循环forvalues与foreach 33
2.2.11 标量与矩阵 35
2.2.12 命令语法与返回值 36
习题 37
第3章 经济数据的组织和整理 39
3.1 横截面数据与标识符变量 39
3.2 时间序列数据 40
3.2.1 时间序列算符 41
3.3 混合横截面时间序列数据 42
3.4 面板数据 42
3.4.1 面板数据运算 43
3.5 处理面板数据的工具 45
3.5.1 非平衡面板与数据筛选 46
3.5.2 面板数据的其他变换 48
3.5.3 移动窗口描述统计量及相关性 49
3.6 横截面与时间序列数据集组合 50
3.7 用append创建长格式数据集 51
3.7.1 利用merge添加汇总特征 52
3.7.2 多对多的merges的危险 53
3.8 reshape命令 53
3.8.1 xpose命令 56
3.9 用Stata执行可重复研究 56
3.9.1 利用do文件 56
3.9.2 数据核查:assert与duplicates 57
习题 61
第4章 线性回归 62
4.1 引论 62
4.2 线性回归的估计 63
4.2.1 矩方法估计量 65
4.2.2 回归估计的抽样分布 66
4.2.3 回归估计量的有效性 67
4.2.4 回归估计的数值识别 67
4.3 回归估计值的解释 68
4.3.1 研究项目:单门独户房价研究 68
4.3.2 方差分析表:F统计量与R2 69
4.3.3 调整R2 70
4.3.4 系数估计值与β系数 71
4.3.5 不带常数项的回归 73
4.3.6 重新获得估计结果 73
4.3.7 检测回归共线性 76
4.4 回归估计 78
4.4.1 描述统计量与相关性的表述 81
4.5 假设检验、线性限制与约束最小二乘法 82
4.5.1 沃尔德检验 84
4.5.2 关于参数线性组合的沃尔德检验 85
4.5.3 联合假设检验 87
4.5.4 检验非线性约束并建立非线性组合 88
4.5.5 对竞争(非嵌入)模型的检验 89
4.6 计算残差与预测值 90
4.6.1 计算区间预测值 92
4.7 计算边际效应 95
习题 99
4.A 附录:最小二乘法估计量 99
4.B 附录:线性回归大样本VCE 100
第5章 函数形式设定 101
5.1 引论 101
5.2 设定错误 102
5.2.1 模型省略有关变量 102
时间序列回归模型设定的动态性质 103
5.2.2 回归数据图形分析 103
5.2.3 添加变量图形 104
5.2.4 模型包括无关变量 106
5.2.5 设定错误的非对称性 106
5.2.6 函数形式错误设定 107
5.2.7 拉姆齐的RESET 107
5.2.8 设定图 108
5.2.9 设定与交互作用项 109
5.2.10 离群值统计与杠杆作用测算 110
DFITS统计量 112
DFBETA统计量 113
5.3 内生性与测量误差 115
习题 115
第6章 带非独立同分布误差的回归 117
6.1 广义线性回归模型 118
6.1.1 背离i.i.d.误差的形式 119
6.1.2 VCE的稳健估计量 120
6.1.3 VCE的聚类估计量 122
6.1.4 VCE的纽韦-韦斯特估计量 123
6.1.5 广义最小二乘估计量 125
FGLS估计量 125
6.2 误差分布的异方差性 126
6.2.1 与尺度有关的异方差性 127
检测与尺度有关的异方差性 127
FGLS估计 129
6.2.2 组间观测值的异方差性 131
检测组间观测值的异方差性 132
FGLS估计 133
6.2.3 分组数据的异方差性 134
FGLS估计 134
6.3 误差分布的序列相关 136
6.3.1 序列相关检验 136
6.3.2 带序列相关的FGLS估计 139
习题 141
第7章 带指示变量的回归 142
7.1 对定性因素显著性的检验 142
7.1.1 带单个定性测量的回归 143
7.1.2 带两个定性测量的回归 146
交互效应 147
7.2 带定性因素与定量因素的回归 149
斜率差异检验 150
7.3 带指示变量的季节性调整 154
7.4 结构稳定性与结构变化的检验 157
7.4.1 连续性和可微分性约束 158
7.4.2 时间序列模型中的结构性变化 161
习题 162
第8章 工具变量估计量 164
8.1 引论 164
8.2 经济关系的内生性 165
8.3 两阶段最小二乘法 167
8.4 ivreg命令 168
8.5 识别与过度约束检验 169
8.6 Ⅳ估计计算 170
8.7 ivreg2命令与GMM估计 172
8.7.1 GMM估计量 173
8.7.2 同方差背景下的GMM 174
8.7.3 GMM与异方差性一致标准误差 174
8.7.4 GMM与聚类 175
8.7.5 GMM与HAC标准误差 176
8.8 GMM中过度约束的检验 177
8.8.1 对GMM过度约束子集的检验 178
8.9 Ⅳ背景下异方差性检验 181
8.10 检验工具相关 183
8.11 Ⅳ估计内生性的德宾-吴-豪斯曼检验 186
习题 189
8.A 附录:省略变量偏倚 189
8.B 附录:测量误差 190
8.B.1 变量误差问题 191
第9章 面板数据模型 193
9.1 FE模型与RE模型 194
9.1.1 单向FE模型 195
9.1.2 时间效应与双向FE模型 197
9.1.3 组间估计量 199
9.1.4 单向RE模型 200
9.1.5 检验RE的合适性 202
9.1.6 单向FE模型与RE模型的预测 203
9.2 面板数据Ⅳ模型 203
9.3 动态面板数据模型 204
9.4 似不相关模型 207
9.4.1 带有相同回归元的SUR 211
9.5 移动窗口回归估计 212
习题 215
第10章 离散变量和受限因变量模型 216
10.1 二项logit与二项probit模型 216
10.1.1 潜变量方法 217
10.1.2 边际效应与预测 219
二项probit模型 219
二项logit模型与分组logit模型 221
10.1.3 评估设定与拟合优度 222
10.2 有序logit模型与有序probit模型 224
10.3 截尾回归与tobit模型 226
10.3.1 截尾 227
10.3.2 删失 229
10.4 偶然截尾与样本选择模型 232
10.5 二变量probit与带选择的probit模型 236
10.5.1 带选择的二项probit模型 237
习题 239
附录A Stata数据导入 241
A.1 从ASCII文本和电子表格文件导入数据 241
A.1.1 处理文本文件 242
自由格式与固定格式 242
insheet命令 244
A.1.2 存取电子表格数据 245
A.1.3 固定格式的数据文件 245
A.2 从其他软件文件导入数据 249
附录B Stata编程基础 252
B.1 局部宏和全局宏 253
B.1.1 全局宏 256
B.1.2 扩展宏函数与列表函数 256
B.2 标量 257
B.3 循环结构 258
B.3.1 foreach 260
B.4 矩阵 261
B.5 return与ereturn 263
B.5.1 ereturn list 267
B.6 程序与语法语句 268
B.7 用Mata函数编写Stata程序 273
参考文献 279
人名索引 286
主题索引 291
致谢 310