目录 1
序 1
前言 1
第一章 绪论 1
第一节 标准参照测验的产生和发展简史 1
一、标准参照测验的产生 1
(一)常模参照测验及其局限性 1
(二)标准参照测验的产生 3
二、标准参照测验的发展简史 5
第二节 标准参照测验的定义 7
一、几个相关的概念 7
二、标准参照测验的定义 9
三、对标准参照测验的误解 10
第三节 标准参照测验的分类 11
一、参照界定良好且可排序的领域的测验 13
二、参照界定良好但不可排序的领域的测验 16
第二章 测验领域的界定与题目编写 21
第一节 界定测验领域的意义 21
第二节 界定测验领域的方法 23
一、制定行为目标 24
二、编写题目表 24
三、制定详细的行为目标 27
四、界定重要行为 29
第三节 编写测验领域界定说明 30
一、测验领域界定说明的一般格式 30
(一)一般描述 30
(二)样本题目 30
(三)刺激的界定 31
(四)反应的界定 31
二、示例 32
(一)认知领域的界定说明 32
(五)补充 32
(二)情感领域的界定说明 35
(三)体育运动领域的界定说明 38
第四节 编写测验题目的方法分类 39
一、着重编题程序的方法 40
二、基于理论产生的方法 43
三、诊断性方法 49
第五节 题目编写方法在几种测验中的应用 51
一、校内测验 51
二、大规模测验 53
三、证书测验 53
第三章 题目分析 55
第一节 题目的判定性分析 55
一、题目—目标一致性 55
二、内容偏倚 57
第二节 题目的统计分析 58
一、标准组的选择 59
二、非正式的学生反馈 66
三、题目难度 67
四、题目区分度 68
五、题目偏倚 74
第三节 题目的选择 75
一、题目选择标准 75
二、题目的修改和删除 78
第四节 题目选择反应的分析 80
一、题目修改和删除 81
二、错误转移分析 84
三、偏倚的先验分析 85
第四章 测验长度的确定 88
第一节 概述 88
第二节 用二项式模型确定测验长度 90
第三节 用贝叶斯方法确定测验长度 93
第四节 用“不肯定区域”确定测验长度 99
一、爱哥诺—汉布莱顿方法 103
第五节 用计算机模拟确定测验长度 103
二、汉布莱顿—米尔斯—西蒙方法 104
第六节 用题目反应理论确定测验长度 108
第七节 各种测验长度确定方法的比较 111
第五章 标准的制定 114
第一节 质量标准的制定 114
第二节 操作标准的制定 125
一、概述 125
二、状态掌握模型 127
三、依据测验内容制定操作标准 128
四、依据受试者制定操作标准 132
五、依据常模和定额制定操作标准 135
六、综合方法 137
第三节 两种测验情境中操作标准的制定 138
一、校内测验 138
二、证书测验 139
第一节 概述 141
第六章 效度 141
第二节 题目效度 146
一、题目—目标的一致性 146
二、题目的技术质量 154
第三节 内容效度 157
第四节 构想效度 158
一、格特曼量图分析 159
二、因素分析 160
三、实验研究 161
四、多特质多方法研究 162
第五节 效标关联效度 162
第七章 信度 165
第一节 概述 165
第二节 分类一致性信度 167
一、P0指标 167
二、K指标 171
三、施测方法 174
第三节 测验分数的信度 185
一、K2(X,T)指标 185
二、Ф(λ)指标 187
三、K2(X,T)与Ф(λ)的比较 189
第四节 领域分数估计值信度 192
第八章 计算机辅助的个别化测验 197
第一节 概述 197
第二节 计算机辅助的个别化测验的应用 199
一、序列分析测验 199
二、传统题库 202
三、题目程序库 203
四、适应性测验 206
五、试题的自动生成 208
六、各种个别化测验方法的比较 209
第三节 对计算机辅助测验的评价 210
第一节 概述 214
第九章 测验分数的报告 214
第二节 其他资料的准备 215
一、课程结构 216
二、学生兴趣 216
三、学生基本情况 218
第三节 测验分数对学生的报告 220
一、测验分数报告 220
二、大学计划制订的参考 221
三、专业和职业选择的参考 222
第四节 测验分数对中学的报告 224
一、变化趋势报告 225
二、现状报告 226
第五节 测验分数对大学的报告 229
一、变化趋势的报告 229
二、现状报告 230
参考文献 234
人名索引 236