第一章 计算机化自适应测验 1
第一节 自适应测验 2
一、自适应原则在心理测验中的应用 2
二、自适应测验的主要特征 4
第二节 计算机化测验 5
一、划分标准 6
二、四代计算机化施测系统 10
第三节 计算机化自适应测验 15
一、概念 15
二、CAT的优势 17
三、CAT研究现状与未来研究方向 19
第二章 计算机化自适应测验理论基础、原理与开发流程 27
第一节 计算机化自适应测验理论基础:项目反应理论 28
一、项目反应理论 28
二、项目反应模型 28
三、项目反应理论假设 33
第二节 计算机化自适应测验原理 36
一、CAT的产生 36
二、CAT的原理 37
第三节 计算机化自适应测验开发流程 39
一、准备阶段 39
二、题库建设 40
三、CAT算法确定 41
四、信度与效度验证 43
五、正式使用与题库维护更新 44
第四节 CAT系统的构成及其测试流程 45
一、CAT系统的组成部分 45
二、CAT系统的测试流程 46
第三章 计算机化自适应测验流程中的相关算法与技术 47
第一节 CAT选题策略算法 48
一、Fisher信息量选题方法 49
二、KL信息量选题方法 49
三、最大优先级指标选题方法 50
第二节 CAT参数估计方法 50
一、极大似然估计方法 50
二、贝叶斯估计方法 51
三、加权似然估计方法 51
第三节 CAT曝光率控制技术 52
一、条件概率方法 52
二、a分层方法 53
三、动态a分层方法 53
第四节 CAT终止策略 55
一、绝对型终止策略 55
二、相对型终止策略 56
第四章 计算机化多阶段自适应测验 59
第一节 计算机化多阶段自适应测验简介 60
一、什么是MST 60
二、MST与题目级别CAT的比较 61
第二节 计算机化多阶段自适应测验设计 64
一、阶段数的确定 64
二、每个阶段中模块数的确定 64
三、每个模块的项目长度 65
四、统计目标与定性规范约束 65
五、计分方法(能力估计) 65
六、自适应策略与过程 65
七、组卷 66
第三节 计算机化多阶段自适应测验的技术与算法 66
一、路由规则 66
二、自动化组卷 68
第五章 多维计算机化自适应测验 71
第一节 MCAT简介 72
一、多维项目反应理论的发展 72
二、MIRT与FA的关系 73
三、MCAT的产生 73
第二节 MCAT中常用IRT模型 74
一、二级评分的多维项目反应模型 74
二、多级评分的多维项目反应模型 75
第三节 MCAT能力估计方法 76
一、极大似然估计 76
二、贝叶斯极大后验估计 78
三、贝叶斯期望后验估计 79
第四节 MCAT选题策略 80
一、基于Fisher信息矩阵的选题策略 80
二、基于Kullback-Leibler信息量的选题策略 82
三、基于互信息的选题策略 84
四、基于连续香农熵的选题策略 84
第五节 MCAT终止规则 85
一、定长MCAT中测验长度的确定方法 85
二、不定长MCAT终止规则 85
第六章 认知诊断计算机化自适应测验 87
第一节 CD-CAT简介 88
一、认知诊断测验 88
二、CD-CAT 92
第二节 CD-CAT中常用认知诊断模型 93
一、具有认知诊断功能的IRT模型 93
二、规则空间模型 94
三、统一模型 95
四、融合模型 96
五、RRUM模型 97
六、DINA模型 98
七、高阶DINA模型 98
第三节 认知诊断计算机化自适应测验中的核心技术与算法 100
一、CD-CAT的选题方法 100
二、CD-CAT的参数估计 107
三、CD-CAT的终止规则 108
四、CD-CAT的在线标定 110
五、CD-CAT的总结与展望 112
第七章 可修改答案的计算机化自适应测验 115
第一节 可修改答案的计算机化自适应测验简介 116
一、RCAT优势分析 116
二、RCAT目前存在的问题 116
第二节 可修改答案的计算机化自适应测验设计与方法 118
一、基于测试设计视角的RCAT 118
二、基于选题策略视角的RCAT 123
三、基于模型视角的RCAT 125
四、总结与展望 128
第八章 双因子计算机化自适应测验 133
第一节 双因子IRT模型简介 134
一、基于探索性因素分析模型的研究现状 135
二、基于验证性因素分析模型的研究现状 138
第二节 BCAT基本过程 144
一、基于单维视角的BCAT过程 144
二、基于多维视角的BCAT过程 148
第三节 BCAT选题算法 150
一、基于单维的选题策略 151
二、基于多维的最大Fisher信息量矩阵选题 152
第四节 BCAT在心理学应用中的优势 153
一、拟合性 153
二、既能反映特殊维度情况,也能反映整体情况 154
三、减少被试的作答负担的同时保证测量的准确程度 154
第九章 CAT中新题参数在线标定 157
第一节 概述 158
一、在线标定的概念 158
二、在线标定的基本流程 159
三、在线标定与最优设计 160
四、在线标定的主要设计因素 161
第二节 单维二级评分模型下的在线标定 161
一、试测题选题法 161
二、在线标定情境下的参数估计方法 169
三、试测题嵌入位置 172
四、试测终止规则 173
第三节 其他模型下的在线标定 174
一、认知诊断考试的在线标定 174
二、多维IRT的在线标定 174
三、单维多项评分模型的在线标定 175
第十章 CAT技术在实践中的应用 177
第一节 Multistage-CAT在GRE中的应用 178
一、为什么选用MST 178
二、GRE测验的MST设计 179
三、GRE测验规范 180
四、GRE测验MST设计的评估 180
第二节 CD-CAT在英语听力理解中的应用 182
一、题库建设 182
二、选题策略 184
三、参数估计 185
四、真实题库下模拟实验 185
五、真实测试效度验证 186
第三节 CAT在心理健康评估中的应用 187
一、研究目的 187
二、研究方法与过程 188
三、研究结果 190
四、讨论 202
五、展望 203
参考文献 205