第1章 标准参照测验理论发展概况 1
1.1 标准参照测验理论产生的历史背景 1
1.1.1 程序教学和教学机器 1
1.1.2 教育目标分类 4
1.1.3 掌握学习 6
1.1.4 对常模参照性测验的不满 7
1.1.5 方法方面的背景 10
1.1.6 当时语言测验领域的情形 11
1.2 标准参照测验理论的出现 12
1.3 近四十年的发展 13
第2章 测量理论中的重要概念和术语 16
2.1 criterion和standard,“标准”的两个含义 16
2.2 标准行为、标准表现、标准测量 16
2.3 直接测验和间接测验 17
2.4 domain,范围 17
2.5 目标(objective) 17
2.6 常模和常模参照性测验 18
2.7 测量、测验、考试、评价和评估 20
2.7.1 测量 20
2.7.2 测验 22
2.7.3 评价 23
2.7.4 评估 24
2.7.5 测量、测验、考试、评价及评估的关系 24
第3章 标准参照测验理论的各种版本 27
3.1 Glaser最初的定义,他的初衷,Nitko等人的补充 27
3.2 多数人的不正确的定义 29
3.3 Glaser的第一个错误 35
3.4 “标准”意义的来源 41
3.5 Popham等人的正名 48
3.5.1 Popham等人的定义 48
3.5.2 标准参照测验的要素 49
3.6 “标准”容易误解为cutoff 56
第4章 标准参照测验的范围 67
4.1 标准参照测验的几种变体 67
4.2 范围参照测验 73
4.3 目标参照测验 78
4.4 掌握式测验 95
4.5 标准参照测验到底都包括什么 95
第5章 “结合说”和“反结合说” 99
5.1 形形色色的“结合说” 99
5.1.1 连续体说 99
5.1.2 远近说 101
5.1.3 跳高跳远说 103
5.1.4 中性说 105
5.1.5 模糊两种参照的界限 107
5.2 对“结合说”的反驳 109
5.3 “反结合说”本身的局限 113
第6章 两种参照究竟有什么区别 119
6.1 各家的划界 119
6.2 标准参照的题目参数和信度、效度概念 128
6.2.1 标准参照测验的题目参数 128
6.2.1.1 题目难度 129
6.2.1.2 教学敏感性(instructional sensitivity) 130
6.2.1.3 题目的一致性指数(indices of agreement) 132
6.2.2 标准参照测验的信度 134
6.2.3 标准参照测验的效度 136
6.3 什么是本质区别 139
第7章 常模参照问题——常模是标准吗 142
7.1 对常模参照的批评 142
7.2 误解了常模参照——Glaser的第二个错误 148
7.3 常模是不是标准 149
第8章 测量的规则和常模的原理 155
8.1 实数的性质 155
8.2 数字怎样和经验世界相联系 157
8.3 测量中的两种仪器、三个中心、四种水平 162
8.3.1 两种测量仪器 162
8.3.2 三个中心 163
8.3.3 四种测量水平 168
8.3.3.1 称名测量 168
8.3.3.2 顺序测量 169
8.3.3.3 等距测量 170
8.3.3.4 比率测量 170
8.3.3.5 测度 171
8.4 常模的原理和意义 172
8.5 什么时候必须使用常模参照 186
第9章 对常模的种种误解 190
9.1 常模的本质意义 190
9.1.1 使分数获得意义 190
9.1.2 排序 192
9.1.3 误差容易处理 193
9.2 常模参照的分数问题 199
9.3 “结合说”的实质 204
第10章 对标准参照理论的评价——若干结论 207
10.1 对标准参照测验及其理论的评价 207
10.2 测量水平承诺——结论一 214
10.3 决策承诺——结论二 220
10.4 标准承诺——结论三 229
参考文献 240
索引 249
鸣谢 264