目录 1
第1章 数据分析的方法 1
数据验证 3
变量与模型的选择 6
前期分析 8
图表 8
表格 13
相关性分析 14
逐步回归分析 16
建立多变量模型 17
检验模型 25
检验数值型变量 25
检验类别型变量 26
检验残差值 28
检测有影响的观察 29
提取方程式 30
结束语 31
数据验证 33
第2章 案例分析:软件开发生产率 33
变量和模型的选择 40
创建新变量 40
修正数据 41
确定分类变量的各个子集 41
模型的选择 44
初步分析 44
图 44
表格 61
关联分析 62
逐步衰退分析 63
建立多变量模型 66
检验模型 69
检验数值变量 69
检验分类变量 69
测试残差 69
发现有影响的样本 70
解释方程式 71
提取方程式 71
管理启示 73
第3章 案例分析:快速上市 74
数据验证、变量和选择模型 74
选择模型 75
初步分析 75
图 75
表 83
相关性分析 84
逐步回归分析 84
多变量模型的构建 86
检验模型 89
检验数值变量 89
检验类别变量 89
检验残差值 90
检测有影响的观测值 91
提取方程式 92
方程式的解释 93
管理启示 94
第4章 案例分析:开发软件开发成本的模型 95
实例A:1993年工作量估算模型 95
数据验证以及变量和模型的选择 95
数据的选择 95
模型的选择 96
初步分析 96
图 96
表格 101
关联分析 102
逐步衰退分析 102
建立多变量模型 104
检验模型 108
检验数值变量 108
检验分类变量 108
测试残差 109
发现有影响的样本 111
常用精度统计 113
测量估算模型的精确度 113
估算误差的箱图 115
Wilcoxon符号秩测试 115
精度分段 116
95%信任间隔 118
提取方程式 120
解释方程式 121
变量和模型的选择 123
实例B:1991年工作量估算模型 123
确定分类变量的各个子集 124
模型的选择 126
初步分析 126
图 126
表格 127
关联分析 127
逐步衰退分析 129
建立多变量模型 129
常用精度统计 133
检验模型 133
测量估算模型的精确度 133
Wilcoxon符号秩测试 134
估算误差的箱图 134
精度分段 135
比较1991年和1993年的模型 136
管理启示 137
第5章 案例研究:软件维护成本的驱动因子 138
关心的是成果 138
摘要 139
年度纠错性维护成本的驱动因子:一家商业银行的经历 139
附录:软件年度维护投入的一种风险分析方法 151
通过数据学到知识 154
数据验证 154
变量及模型的选择 158
新变量的创建 158
数据的修改 159
类别型变量子集的标识 160
模型的选择 163
前期分析 164
图表 164
表格 179
相关性分析 181
逐步回归分析 182
建立多变量模型 182
选择基准类别型变量 186
检验类别型变量 190
检验数值型变量 190
检验模型 190
检验残差值 194
检测有影响的观察 195
提取方程式 195
解释方程式 196
模型预测的精确性 196
TELON分析 198
进一步分析 203
结束语 204
第6章 需要理解的统计学知识 205
个体变量的描述 205
变量的类型 205
描述性统计量 207
正态分布 213
抽样理论概述 213
其他概率分布 215
数据中的关系识别 216
卡方独立性检验 217
相关分析 220
回归分析 226
方差分析(ANOVA) 233
对两个估计模型的比较 237
配对Wilcoxon符号秩检验 237
结束语 239
附录A 原始软件开发项目数据 240
附录B 证实软件开发项目数据 242
附录C 证实软件维护项目数据 244