1. 二分类因变量与logistic回归模型 1
1.1 引言 2
1.2 线性概率模型(Linear Probability Model,LPM) 3
1.3 Logistic回归模型 6
2. Logistic回归模型估计 13
2.1 最大似然估计(Maximum Likelihood Estimation,MLE) 14
2.2 Logistic回归模型估计的假设条件 17
2.3 最大似然估计的性质 17
2.4 模型估计的样本规模 18
2.5 拟合logistic回归的示范模型 19
2.6 用分组数据作logistic回归分析 33
3. Logistic回归模型评价 57
3.1 拟合优度(Goodness of fit) 58
3.1.1 皮尔逊x2(Pearson x2) 58
3.1.2 偏差(Deviance) 62
3.1.3 Hosmer-Lemeshow拟合优度指标 65
3.1.4 信息测量指标(Information Measures) 67
3.2 Logistic回归模型的预测准确性 72
3.2.1 类R2指标(Analogous R2) 72
3.2.2 预测概率与观测值之间的关联 75
3.2.3 分类表(Classification Table) 80
3.3 模型x2统计(Model Chi-Square Statistic) 88
4. Logistic回归系数解释 91
4.1 发生比和发生比率(Odds and Odds Ratio) 92
4.2 按发生比率来解释logistic回归系数 95
4.2.1 连续自变量的发生比率 96
4.2.2 二分类自变量的发生比率 98
4.2.3 分类自变量的发生比率 100
4.3 用概率来解释自变量的作用 111
4.4 预测概率 112
4.5 标准化系数 115
4.6 偏相关(Partial Correlation) 120
5. Logistic回归系数的统计推断 123
5.1 Logistic回归系数的显著性检验 124
5.1.1 Wald检验 125
5.1.2 似然比检验 126
5.1.3 检验系数子集 132
5.2 Logistic回归参数的置信区间 136
5.2.1 Logistic回归系数的置信区间 137
5.2.2 发生比率的置信区间 138
5.2.3 事件概率的置信区间 141
6. 建立模型 145
6.1.1 筛选自变量 146
6.1 选择变量 146
6.1.2 模型的比较 152
6.1.3 逐步模型选择法 153
6.1.4 排除有意义的变量和包括没有意义的变量 171
6.2 非线性与非加性(Nonlinearily and Nonadditivity) 172
6.2.1 非线性 172
6.2.2 非加性 177
7. Logistic回归诊断 183
7.1 过离散(Overdispersion) 184
7.2 空单元(Zero Cell Count) 187
7.3 完全分离(Complete Separation) 188
7.4 多元共线性(Multicollinearity) 190
7.5 特异值和特殊影响案例(Outliers and Influential Observations) 195
7.5.1 残差影响的测量 195
7.5.2 检查特异值和特殊影响案例 202
8. Logistic回归的替代模型及扩展 219
8.1 Probit模型 220
8.1.1 Probit模型的对数似然函数 220
8.1.2 拟合Probit示范模型 221
8.1.3 Probit模型的解释 225
8.1.4 用分组数据建立Probit模型 227
8.1.5 Logistic回归模型与Probit模型的比较 235
8.2 Logistic回归扩展于多分类反应变量 237
8.2.1 累积logistic回归模型(Cumulative Logistic Regression Model) 237
8.2.2 多项logit模型(Multinomial Logit Model) 249
参考文献 263
关键词索引 267