1 Stata基础知识 1
1.1 Stata的交互使用 1
1.2 Stata文件 2
1.2.1 Stata手册 2
1.2.2其他Stata资源 2
1.2.3 help命令 3
1.2.4 search、findit和hsearch命令 4
1.3命令的语法和算子 4
1.3.1基本的命令语法 4
1.3.2例子:summarize命令 5
1.3.3例子:regress命令 6
1.3.4因子变量 7
1.3.5缩写词、大小写的敏感性和通配符 9
1.3.6算术、关系和逻辑算子 10
1.3.7报错的信息 10
1.4 do文件和log文件 11
1.4.1编写一个do文件 11
1.4.2运行do文件 11
1.4.3 log文件 12
1.4.4一个三阶段的过程 13
1.4.5注释和长行的处理 13
1.4.6执行Stata的不同方法 14
1.5标量和矩阵 14
1.5.1标量 14
1.5.2矩阵 15
1.6使用来自于Stata命令后所获得的结果 15
1.6.1使用从r类命令summarize所得的结果 15
1.6.2使用从e类命令regress所得的结果 16
1.7全局宏和局部宏 18
1.7.1全局宏 18
1.7.2局部宏 18
1.7.3使用标量还是使用宏? 19
1.8循环命令 20
1.8.1 foreach循环 21
1.8.2 forvalues循环 21
1.8.3 while循环 22
1.8.4 continue命令 22
1.9一些有用的命令 22
1.10 do文件的模板 22
1.11用户编写的命令 23
1.12 Stata资源 24
1.13习题 24
2 数据管理和绘图 25
2.1导论 25
2.2数据的类型 25
2.2.1文本或ASCⅡ数据 25
2.2.2内部数字数据 26
2.2.3字符串数据 27
2.2.4数字型数据的显示格式 27
2.3输入数据 27
2.3.1基本原则 27
2.3.2输入Stata格式的数据 28
2.3.3用键盘输入数据 29
2.3.4输入非文本数据 29
2.3.5从电子表格中输入文本数据 30
2.3.6输入自由格式的文本数据 31
2.3.7输入固定格式的文本数据 31
2.3.8字典数据文件 32
2.3.9常见的误区 32
2.4数据管理 32
2.4.1 PSID的例子 32
2.4.2对变量命名和贴标签 34
2.4.3查看数据 35
2.4.4使用原始文档 36
2.4.5缺失值 36
2.4.6估算缺失的数据 38
2.4.7转换数据(generate、replace、egen和recode命令) 38
2.4.8保存数据 42
2.4.9选择样本 43
2.5操作数据集 43
2.5.1观测值和变量的排序 44
2.5.2保存和恢复数据集 44
2.5.3数据集的宽格式和长格式 44
2.5.4合并数据集 44
2.5.5追加数据集 46
2.6数据的图形显示 47
2.6.1 Stata的图形命令 47
2.6.2箱线图 49
2.6.3直方图 50
2.6.4核密度图 51
2.6.5二维散点图和拟合线 52
2.6.6局部加权散点平滑估计、核密度、局部线性和最近邻回归 53
2.6.7多重散点图 55
2.7 Stata资源 56
2.8习题 57
3 线性回归的基本知识 59
3.1导论 59
3.2数据与数据的概述性统计 59
3.2.1数据的描述 59
3.2.2变量的描述 60
3.2.3概述性统计 60
3.2.4更详细的概述性统计 61
3.2.5数据的统计表 62
3.2.6统计检验 64
3.2.7数据的绘图 64
3.3水平值和对数值的回归 65
3.3.1基本的回归理论 65
3.3.2 OLS回归和矩阵的代数运算 66
3.3.3 OLS估计量的性质 66
3.3.4异方差-稳健标准误 67
3.3.5聚类-稳健标准误 67
3.3.6对数值的回归 68
3.4基本的回归分析 69
3.4.1相关性 69
3.4.2 regress命令 69
3.4.3假设检验 71
3.4.4多个回归输出结果的合并表 71
3.4.5更好的回归输出表 72
3.4.6用于生成分类变量和交互项的因子变量 74
3.5模型设定的分析 75
3.5.1模型设定的检验和模型的诊断 75
3.5.2残差的诊断图 76
3.5.3有影响力的观测值 77
3.5.4模型设定的检验 78
3.5.5具有多种幂形式的模型检验 81
3.6预测 83
3.6.1样本内预测 83
3.6.2 ME和弹性 84
3.6.3对数形式的预测:再转换的问题 86
3.6.4预测的练习 87
3.7抽样权重 88
3.7.1权重 88
3.7.2加权的均值 89
3.7.3加权的回归 90
3.7.4加权的预测和ME 91
3.8运用Mata进行OLS回归 92
3.9 Stata资源 93
3.10习题 93
4 模拟 95
4.1导论 95
4.2伪随机数生成器:导论 95
4.2.1均匀分布随机数的生成 96
4.2.2从正态分布中抽样 97
4.2.3从t分布、卡方分布、F分布、γ分布和β分布中进行抽样 98
4.2.4从二项分布、泊松分布和负二项分布中进行抽样 99
4.3样本均值的分布 101
4.3.1 Stata程序 102
4.3.2 simulate命令 103
4.3.3中心极限定理的模拟 103
4.3.4 postfile命令 104
4.3.5模拟中心极限定理的另一种方法 104
4.4伪随机数生成器:更详细的介绍 105
4.4.1逆概率转换法 105
4.4.2直接转换法 107
4.4.3其他方法 107
4.4.4从截尾正态分布中进行抽样 107
4.4.5从多元正态分布中进行抽样 108
4.4.6使用马尔科夫链蒙特卡洛方法进行抽样 109
4.5计算积分 111
4.5.1求积法 111
4.5.2蒙特卡洛积分法 111
4.5.3使用不同S值的蒙特卡洛积分 112
4.6回归的模拟:导论 113
4.6.1模拟的例子:具有卡方分布误差的OLS 113
4.6.2解释模拟结果 115
4.6.3模拟的差异 117
4.6.4估计量的非一致性 118
4.6.5具有内生解释变量的模拟 119
4.7 Stata资源 120
4.8习题 120
5 GLS回归 123
5.1导论 123
5.2 GLS回归和FGLS回归 123
5.2.1用于异方差误差项的GLS 123
5.2.2 GLS与FGLS 124
5.2.3加权最小二乘法和稳健标准误 124
5.2.4重要的例子 125
5.3对异方差数据进行建模 125
5.3.1模拟的数据集 126
5.3.2 OLS估计 126
5.3.3检验异方差 127
5.3.4 FGLS估计 129
5.3.5 WLS估计 130
5.4系统线性回归 130
5.4.1 SUR模型 131
5.4.2 sureg命令 132
5.4.3在两类支出中的应用 132
5.4.4稳健标准误 133
5.4.5跨方程约束的检验 134
5.4.6施加跨方程约束 135
5.5调查数据:加权、聚类和分层 136
5.5.1调查设计 136
5.5.2调查均值的估计 138
5.5.3调查数据的线性回归 139
5.6 Stata资源 140
5.7习题 140
6 线性工具变量回归 143
6.1导论 143
6.2 Ⅳ估计 143
6.2.1基本的Ⅳ理论 143
6.2.2模型的建立 144
6.2.3 Ⅳ估计量:Ⅳ、2SLS和GMM 145
6.2.4工具变量的有效性和相关性 146
6.2.5稳健标准误的估计值 147
6.3 Ⅳ的例子 147
6.3.1 ivregress命令 148
6.3.2具有一个内生性解释变量的医疗支出模型 148
6.3.3可用的工具变量 149
6.3.4恰好识别模型的Ⅳ估计 150
6.3.5过度识别模型的Ⅳ估计 151
6.3.6解释变量内生性的检验 152
6.3.7过度识别约束的检验 154
6.3.8二值内生性解释变量的Ⅳ估计 155
6.4弱工具变量 157
6.4.1 Ⅳ估计量的有限样本性质 157
6.4.2弱工具变量 157
6.4.3 estat firststage命令 159
6.4.4恰好识别模型 159
6.4.5过度识别模型 161
6.4.6多个内生性解释变量 161
6.4.7工具变量选择的敏感性分析 161
6.5对弱工具变量的更好推断 163
6.5.1条件检验和置信区间 163
6.5.2 LIML估计量 164
6.5.3刀切法Ⅳ估计量 165
6.5.4 2SLS、LIML、JIVE和GMM的比较 165
6.6 3SLS系统估计 166
6.7 Stata的资源 168
6.8习题 168
7 分位数回归 171
7.1导论 171
7.2分位数回归 171
7.2.1条件分位数 172
7.2.2 QR估计值和标准误的计算 172
7.2.3 greg,bsgreg和sqreg命令 173
7.3医疗支出数据的分位数回归 174
7.3.1数据的概述 174
7.3.2 QR估计 174
7.3.3条件分位数系数的解释 175
7.3.4再转换 176
7.3.5不同分位数上的估计值的比较 177
7.3.6异方差的检验 178
7.3.7假设检验 178
7.3.8不同分位数回归中系数的图形显示 179
7.4生成异方差数据的QR 181
7.4.1模拟产生的数据集 181
7.4.2 QR的估计值 182
7.5计数数据的QR 184
7.5.1分位数计数回归 184
7.5.2 qcount命令 185
7.5.3看医生次数数据的概述 185
7.5.4QCR的估计结果 187
7.6 Stata资源 188
7.7习题 189
8 线性面板数据模型:基础 191
8.1导论 191
8.2面板数据方法综述 191
8.2.1基本的研究 191
8.2.2基本的面板数据模型 192
8.2.3聚类-稳健性推断 194
8.2.4 xtreg命令 194
8.2.5 Stata线性面板数据命令 195
8.3面板数据概述性统计 195
8.3.1数据描述和概述性统计 195
8.3.2面板数据结构 197
8.3.3面板数据描述 197
8.3.4组内差异和组间差异 198
8.3.5单个个体的时间序列图 200
8.3.6总体散点图 201
8.3.7组内散点图 201
8.3.8具有聚类-稳健标准误的混合数据OLS回归 203
8.3.9面板数据的时间序列自相关 204
8.3.10 RE模型中的误差相关 205
8.4混合(数据)估计量或总体平均估计量 206
8.4.1混合(数据)OLS估计量 206
8.4.2混合FGLS估计量或总体平均估计量 206
8.4.3 xtreg,pa命令 207
8.4.4带有pa选项的xtreg命令的应用 207
8.5组内估计量 208
8.5.1组内估计量 208
8.5.2带有fe选项的xtreg命令 209
8.5.3带有fe选项的xtreg命令的应用 209
8.5.4最小二乘虚拟变量回归 210
8.6组间估计量 211
8.6.1组间估计量 211
8.6.2带be选项的xtreg命令的应用 211
8.7 RE估计量 212
8.7.1 RE估计量 212
8.7.2带re选项的xtreg命令 213
8.7.3带有re选项的xtreg命令的应用 213
8.8估计量的比较 214
8.8.1方差成分的估计值 214
8.8.2组内R2和组间R2 214
8.8.3估计量的比较 215
8.8.4固定效应模型与随机效应模型的比较 215
8.8.5固定效应的Hausman检验 216
8.8.6预测 217
8.9一阶差分估计量 218
8.9.1一阶差分估计量 218
8.9.2严格外生性和弱外生性假设 219
8.10长面板数据分析 220
8.10.1长面板数据集 220
8.10.2混合OLS和PFGLS 221
8.10.3 xtpcse命令和xtgls命令 221
8.10.4 xtgls,xtpcse和 xtscc命令的应用 222
8.10.5单独的回归 224
8.10.6 FE模型和RE模型 225
8.10.7单位根和协整 226
8.11面板数据的管理 227
8.11.1宽格式的数据 227
8.11.2将宽格式数据转换为长格式数据 228
8.11.3将长格式数据转换为宽格式数据 228
8.11.4另一种宽格式数据 229
8.12 Stata资源 230
8.13习题 230
9 线性面板数据模型:扩展 233
9.1导论 233
9.2面板Ⅳ估计 233
9.2.1面板Ⅳ 233
9.2.2 xtivreg命令 234
9.2.3 xtivreg命令的应用 234
9.2.4面板Ⅳ的扩展 235
9.3 Hausman-Taylor估计量 236
9.3.1 Hausman-Taylor估计量 236
9.3.2 xthtaylor命令 236
9.3.3 xthtaylor命令的应用 237
9.4 Arellano-Bond估计量 238
9.4.1动态模型 238
9.4.2 FD模型中Ⅳ估计 239
9.4.3 xtabond命令 239
9.4.4 Arellano-Bond估计量:完全的时间序列 240
9.4.5 Arellano-Bond估计量:附加其他解释变量 242
9.4.6模型设定检验 244
9.4.7 xtdpdsys命令 245
9.4.8 xtdpd命令 246
9.5混合(分层)线性模型 247
9.5.1混合(分层)线性模型 247
9.5.2 xtmixed命令 248
9.5.3随机截距项模型 248
9.5.4聚类-稳健标准误 249
9.5.5随机斜率模型 250
9.5.6随机系数模型 251
9.5.7双向随机效应模型 252
9.6聚类数据 253
9.6.1聚类数据集 253
9.6.2使用非面板命令对聚类数据进行分析 254
9.6.3使用面板命令对聚类数据进行分析 255
9.6.4分层线性模型 257
9.7 Stata资源 258
9.8习题 258
10 非线性回归方法 259
10.1导论 259
10.2非线性的例子:看医生的次数 260
10.2.1数据的描述 260
10.2.2泊松模型的描述 261
10.3非线性回归的方法 261
10.3.1 MLE 261
10.3.2 poisson命令 262
10.3.3估计后命令 263
10.3.4 NLS 264
10.3.5 nl命令 264
10.3.6 GLM 265
10.3.7 glm命令 266
10.3.8 gmm估计 267
10.3.9其他估计量 268
10.4不同的VCE估计 268
10.4.1一般框架 268
10.4.2 vce()选项 269
10.4.3 vce()选项的应用 269
10.4.4 VCE的默认估计 271
10.4.5 VCE的稳健估计 271
10.4.6 VCE的聚类-稳健估计 272
10.4.7异方差和自相关VCE一致估计 272
10.4.8自抽样标准误 273
10.4.9统计推断 273
10.5预测 273
10.5.1 predict和predictnl命令 273
10.5.2 predict和predictnl的应用 274
10.5.3样本外预测 275
10.5.4在一个解释变量的特定值处的预测 275
10.5.5在所有解释变量的特定值处的预测 276
10.5.6其他数值的预测 277
10.5.7用于预测的margins命令 277
10.6边际效应 279
10.6.1微积分法和有限差分法 279
10.6.2 ME的估计值:AME、MEM和MER 279
10.6.3弹性和半弹性 280
10.6.4单指数模型中系数的简单解释 281
10.6.5关于边际效应的margins命令 281
10.6.6 MEM:在均值处的边际效应 282
10.6.7 MER:在代表值处的边际效应 283
10.6.8 AME:平均边际效应 284
10.6.9弹性和半弹性 285
10.6.10手动计算AME 286
10.6.11多项式解释变量 288
10.6.12交互作用的解释变量 289
10.6.13复杂的交互项和非线性形式 290
10.7模型诊断 290
10.7.1拟合优度的度量 291
10.7.2用于模型比较的信息准则 292
10.7.3残差 292
10.7.4模型设定检验 293
10.8 Stata资源 294
10.9习题 294
11 非线性最优化方法 295
11.1导论 295
112牛顿-拉夫逊法 295
11.2.1 NR方法 295
11.2.2泊松模型的NR方法 296
11.2.3使用Mata命令的泊松NR的例子 296
11.3梯度法 298
11.3.1最大化选项 298
11.3.2梯度法 299
11.3.3迭代中的信息 299
11.3.4迭代停止准则 300
11.3.5多重最大值 300
11.3.6数值导数 301
11.4 ml命令:lf方法 301
11.4.1 ml命令 302
11.4.2 lf方法 302
11.4.3泊松分布的例子:单指数模型 302
11.4.4负二项例子:双指数模型 304
11.4.5 NLS的例子:非似然函数模型 305
11.5检查程序 306
11.5.1使用ml check和ml trace调试程序 306
11.5.2运行程序 307
11.5.3检查数据 307
11.5.4多重共线性和近似共线性 308
11.5.5多重最优值 309
11.5.6检查参数估计 309
11.5.7检查标准误的估计 310
11.6 ml命令:d0、d1、d2、lf0、lf1和lf2方法 311
11.6.1评估函数 311
11.6.2 d0方法 313
11.6.3 d1方法 314
11.6.4对VCE进行稳健估计的lf1方法 314
11.6.5 d2和lf2方法 315
11.7 Mata optimize()函数 316
11.7.1 d类和gf类评估函数 316
11.7.2最优化函数 316
11.7.3泊松例子 317
11.8广义矩方法 319
11.8.1定义 319
11.8.2非线性Ⅳ的例子 319
11.8.3使用Mata optimize()函数进行GMM估计 320
11.9 Stata资源 322
11.10习题 322
12 检验方法 325
12.1导论 325
12.2临界值和p值 325
12.2.1标准正态分布与学生的t分布的比较 325
12.2.2卡方分布与F分布的比较 326
12.2.3绘制密度图 326
12.2.4计算p值和临界值 327
12.2.5 Stata使用哪种分布? 328
12.3 Wald检验和置信区间 328
12.3.1线性假设的Wald检验 329
12.3.2 test命令 330
12.3.3单侧Wald检验 332
12.3.4非线性假设的Wald检验(delta方法) 333
12.3.5 testrnl命令 333
12.3.6 Wald置信区间 334
12.3.7 lincom命令 334
12.3.8 nlcom命令(delta方法) 335
12.3.9非对称置信区间 335
12.4似然比检验 336
12.4.1似然比检验 336
12.4.2 lrtest命令 338
12.4.3 LR检验的直接计算 338
12.5拉格朗日乘子检验(得分检验) 339
12.5.1 LM检验 339
12.5.2 estat命令 340
12.5.3用辅助回归进行LM检验 340
12.6检验水平和检验势 341
12.6.1模拟DGP:误差项服从卡方分布的OLS 342
12.6.2检验水平 342
12.6.3检验势 344
12.6.4渐近检验势 346
12.7模型设定检验 346
12.7.1基于矩的检验 346
12.7.2信息矩阵检验 347
12.7.3拟合优度的卡方检验 347
12.7.4过度识别约束的检验 347
12.7.5 Hausman检验 347
12.7.6其他检验 348
12.8 Stata资源 348
12.9习题 348
13 自抽样法 351
13.1导论 351
13.2自抽样法 351
13.2.1标准误的自抽样估计 351
13.2.2自抽样法 351
13.2.3渐近精炼 352
13.2.4谨慎使用自抽样 352
13.3使用vce(bootstrap)选项的自抽样配对法 353
13.3.1使用自抽样配对法估计VCE 353
13.3.2 vce(bootstrap)选项 353
13.3.3自抽样标准误的例子 354
13.3.4有多少次自抽样? 354
13.3.5聚类的自抽样 355
13.3.6自抽样的置信区间 356
13.3.7估计后的estat bootstrap命令 357
13.3.8自抽样置信区间的例子 357
13.3.9有偏估计的自抽样 358
13.4使用bootstrap命令的自抽样配对法 358
13.4.1 bootstrap命令 358
13.4.2使用Stata估计命令计算参数的自抽样估计值 359
13.4.3用Stata估计命令计算自抽样标准误 360
13.4.4使用用户编写估计命令计算自抽样标准误 360
13.4.5自抽样两阶段估计量 361
13.4.6自抽样的Hausman检验 362
13.4.7变异系数的自抽样标准误 364
13.5具有渐近精炼的自抽样 364
13.5.1百分位数-t方法 364
13.5.2百分位数-t的Wald检验 365
13.5.3基于百分位数-t方法的Wald置信区间 366
13.6使用bsample和simulate命令来计算自抽样配对 366
13.6.1 bsample命令 367
13.6.2与simulate命令同时使用的bsample命令 367
13.6.3自抽样的蒙特卡洛(Monte Carlo) 368
13.7另一种再抽样的方法 369
13.7.1自抽样配对法 369
12.7.2参数自抽样 370
13.7.3残差的自抽样 370
13.7.4 Wild自抽样 371
13.7.5次样本抽样 372
13.8刀切法 372
13.8.1刀切法 373
13.8.2 vce(jackknife)选项和jackknife命令 373
13.9 Stata资源 373
13.10习题 374
14 二值结果模型 375
14.1导论 375
14.2一些参数模型 375
14.2.1基本模型 375
14.2.2 logit模型、probit模型、线性概率模型及clog-log模型 376
14.3估计 376
14.3.1潜变量的解释和识别 376
14.3.2极大似然(ML)估计 377
14.3.3 logit和probit命令 377
14.3.4 VCE的稳健估计 378
14.3.5 LPM的OLS估计 378
14.4例子 378
14.4.1数据的描述性统计 378
14.4.2 Logit回归 379
14.4.3二值模型和参数估计的比较 380
14.5假设和模型设定检验 381
14.5.1 Wald检验 382
14.5.2似然比检验 382
14.5.3额外的模型设定检验 382
14.5.4模型的比较 384
14.6拟合优度和预测 385
14.6.1伪R2度量 385
14.6.2用样本频数比较预测的概率 385
14.6.3比较实际的结果与预测的结果 386
14.6.4拟合概率的predict命令 387
14.6.5拟合概率值的prvlaue命令 388
14.7边际效应 389
14.7.1代表值处的边际效应(MER) 389
14.7.2均值处的边际效应(MEM) 390
14.7.3平均边际效应(AME) 390
14.7.4 prchange命令 391
14.8内生解释变量 392
14.8.1例子 392
14.8.2模型假设 393
14.8.3结构模型法 393
14.8.4 Ⅳ法 396
14.9分组数据 397
14.9.1用加总的数据进行估计 397
14.9.2分组数据的应用 398
14.10 Stata资源 399
14.11习题 399
15 多项选择模型 401
15.1导论 401
15.2多项选择模型总述 401
15.2.1概率和ME 401
15.2.2极大似然估计 402
15.2.3特定个体和特定选项的解释变量 402
15.2.4加法随机效用模型 403
15.2.5 Stata的多项选择模型命令 403
15.3多项选择的示例:钓鱼方式模型的选择 403
15.3.1数据描述 404
15.3.2特定个体的解释变量 405
15.3.3特定选项的解释变量 405
15.4多项选择logit模型 406
15.4.1 mlogit命令 406
15.4.2 mlogit命令的应用 406
15.4.3对系数的解释 407
15.4.4预测的概率值 408
15.4.5 MEs 409
15.5条件logit模型 410
15.5.1从宽格式数据中建立长格式数据 410
15.5.2 asclogit命令 411
15.5.3 clogit命令 412
15.5.4 asclogit命令的应用 412
15.5.5条件logit模型与多项logit模型的关系 413
15.5.6对系数的解释 413
15.5.7预测的概率值 414
15.5.8边际效应 414
15.6嵌套logit模型 416
15.6.1放松对无关选项的独立性假设 416
15.6.2 NL模型 417
15.6.3 nlogit命令 417
15.6.4模型估计 418
15.6.5预测的概率值 420
15.6.6 ME 420
15.6.7 logit模型的比较 421
15.7多项选择probit模型 421
15.7.1 MNP模型 421
15.7.2 mprobit命令 422
15.7.3极大模拟似然 422
15.7.4 asmprobit命令 423
15.7.5 asmprobit命令的应用 423
15.7.6预测的概率值和MEs 425
15.8随机参数logit模型 425
15.8.1随机参数logit模型 425
15.8.2 mixlogit命令 426
15.8.3 mixlogit命令的数据准备 426
15.8.4 mixlogit命令的应用 426
15.9有序结果模型 427
15.9.1概述性统计 427
15.9.2有序结果模型 428
15.9.3 ologit命令的应用 429
15.9.4预测的概率值 429
15.9.5 ME 430
15.9.6其他有序的模型 430
15.10多元结果模型 431
15.10.1二元probit模型 431
15.10.2非线性SUR 433
15.11 Stata资源 433
15.12习题 434
16 Tobit模型和选择模型 435
16.1导论 435
16.2 Tobit模型 435
16.2.1删失数据的回归 435
16.2.2 Tobit模型的建立 436
16.2.3未知的删失点 436
16.2.4 Tobit估计 436
16.2.5 Stata中的极大似然估计 437
16.3 Tobit模型示例 437
16.3.1数据的概述性统计 437
16.3.2 Tobit分析 439
16.3.3 Tobit估计后的预测 439
16.3.4边际效应 439
16.3.5 ivtobit命令 442
16.3.6删失数据回归的其他命令 443
16.4对数正态数据的tobit模型 443
16.4.1数据示例 444
16.4.2为对数形式的数据设置删失点 444
16.4.3结果 445
16.4.4双受限的tobit回归 446
16.4.5模型诊断 446
16.4.6正态性和同方差性的检验 447
16.4.7下一个步骤? 449
16.5对数形式的两部分模型 449
16.5.1模型结构 450
16.5.2第一部分模型的设定 450
16.5.3两部分模型中第二部分模型的设定 451
16.6选择模型 452
16.6.1模型结构和假设 452
16.6.2样本选择模型的ML估计 453
16.6.3没有排除性约束的估计 453
16.6.4两步估计法 454
16.6.5存在排除性约束的估计 455
16.7用具有对数形式结果的模型来预测 456
16.7.1 tobit模型的预测 457
16.7.2对两部分模型的预测 457
16.7.3对选择模型的预测 458
16.8 stata资源 459
16.9习题 459
17 计数数据模型 461
17.1导论 461
17.2计数数据的特征 461
17.2.1生成的泊松数据 461
17.2.2过度离散及负二项分布数据 462
17.2.3建模方法 463
17.2.4估计方法 464
17.3实证案例1 464
17.3.1数据的概述性统计 464
17.3.2泊松模型 465
17.3.3 NB2模型 468
17.3.4非线性最小二乘估计法 473
17.3.5栅栏(Hurdle)模型 474
17.3.6有限混合模型 478
17.4实证案例2 487
17.4.1零膨胀数据 487
17.4.2零膨胀数据的模型 488
17.4.3 NB2模型的结果 488
17.4.4 ZINB模型的结果 489
17.4.5模型比较 490
17.5含内生解释变量的模型 491
17.5.1结构模型法 492
17.5.2非线性工具变量(Ⅳ)法 495
17.6 Stata资源 496
17.7习题 496
18 非线性面板模型 499
18.1导论 499
18.2非线性面板数据概述 499
18.2.1一些基本的非线性面板模型 499
18.2.2动态模型 501
18.2.3 Stata的非线性面板命令 501
18.3非线性面板数据的例子 502
18.3.1数据的描述性统计与概述性统计 502
18.3.2面板数据的组织结构 503
18.3.3组内差异与组间差异 503
18.3.4是FE模型还是RE模型更适合这些数据? 504
18.4二值结果模型 504
18.4.1被解释变量的面板概述 504
18.4.2 混合数据logit估计量 505
18.4.3 xtlogit命令 505
18.4.4 xtgee命令 506
18.4.5 PA logit估计量 506
18.4.6 RE logit估计量 507
18.4.7 FE logit估计量 508
18.4.8面板logit估计量的比较 510
18.4.9预测与边际效应 511
18.4.10 混合效应logit估计量 511
18.5 Tobit模型 512
18.5.1被解释变量的面板概述 512
18.5.2 RE tobit模型 512
18.5.3广义tobit模型 513
18.5.4参数化的非线性面板模型 513
18.6计数数据模型 514
18.6.1 xtpoisson命令 514
18.6.2被解释变量的面板概述 514
18.6.3 混合数据泊松估计量 515
18.6.4 PA泊松估计量 515
18.6.5 RE泊松估计量 516
18.6.6 FE泊松估计量 517
18.6.7面板泊松估计量的比较 519
18.6.8负二项估计量 519
18.7 Stata资源 521
18.8习题 521
A Stata中的编程 523
A.1 Stata矩阵命令 523
A.1.1 Stata矩阵的综述 523
A.1.2 Stata矩阵的输入与输出 523
A.1.3 Stata矩阵的下标以及合并矩阵 525
A.1.4矩阵算子 525
A.1.5矩阵函数 526
A.1.6矩阵累积命令 526
A.1.7使用Stata矩阵命令的OLS 527
A.2程序 528
A.2.1简单的程序(没有参数的程序或者可获取结果的程序) 529
A.2.2修改一个程序 529
A.2.3带有位置参数的程序 529
A.2.4临时变量 530
A.2.5带有位置参数被命令的程序 530
A.2.6存储并读取程序结果 531
A.2.7带有使用标准Stata语法的参数的程序 531
A.2.8 ado文件 533
A.3程序调试 533
A.3.1一些简单的方法 534
A.3.2报错的信息与返回的代码 535
A.3.3 trace命令 535
B Mata 537
B.1如何运行Mata 537
B.1.1 Mata中的Mata命令 537
B.1.2 Stata中的Mata命令 538
B.1.3 Mata中的Stata命令 538
B.1.4交互使用与批处理使用 538
B.1.5 Mata的help命令 538
B.2 Mata的矩阵命令 539
B.2.1 Mata矩阵的输入 539
B.2.2 Mata的矩阵算子 541
B.2.3 Mata函数 542
B.2.4 Mata交叉乘积 543
B.2.5 Mata矩阵的下标以及合并矩阵 544
B.2.6将Mata数据和矩阵转换至Stata 545
B.3 Mata中的编程 546
B.3.1声明 546
B.3.2 Mata程序 547
B.3.3把结果输出到Stata中的Mata程序 547
B.3.4调用Mata程序的Stata程序 548
B.3.5在ado文件中使用Mata 548
本书术语缩写 549
主题及术语 551
参考文献 579