第一章 研究背景、目的及意义 1
第二章 文献综述 5
2.1 关于等值的基本理论 5
2.1.1 等值的5个性质(要求) 5
2.1.2 连接、预测、量表化和等值 9
2.1.3 数据收集设计和等值方法 12
2.2 国外有关等值研究的综述 19
2.2.1 等值和测验开发 19
2.2.2 等值中的数据收集设计以及样本 19
2.2.3 等值方法的选择 21
2.2.4 从等值结果中选择 22
2.2.5 标准化条件和质量控制程序与等值的关系 25
2.2.6 基于计算机测验的等值问题 26
2.3 我国的等值研究综述 27
2.4 对目前研究的评价 40
第三章 有关核等值法的研究 42
3.1 核等值法研究的缘起 42
3.2 核等值法概要 43
3.3 核等值法的步骤 45
3.3.1 对目标总体进行前平滑处理 45
3.3.2 估计目标总体上的分数分布概率 45
3.3.3 将离散的分数分布连续化 46
3.3.4 计算和分析等值函数 48
3.3.5 计算等值标准误及相关的精度测量 48
3.4 核等值法与其他等值方法 50
3.4.1 核等值法与线性等值法 51
3.4.2 核等值法与等百分位等值法 52
3.5 ETS的实证研究 53
3.6 对核等值法的评价 55
第四章 HSK考试的情况以及研究目标和内容 58
4.1 关于HSK初中等考试的情况 58
4.2 研究假设、目标和内容 59
4.3 研究方法 60
4.3.1 数据收集设计 61
4.3.2 所比较的等值方法 61
4.4 实验数据 62
4.4.1 试卷的构建 62
4.4.2 考生总体的构建 63
4.4.3 比较的标准 65
4.4.4 比较的步骤 67
第五章 研究过程和结果 72
5.1 试卷拆分后的主要统计数据 72
5.1.1 标准卷总体Q的试卷QYA以及锚测验QA统计数据 72
5.1.2 新卷总体P的试卷PXA及锚测验PA的统计数据 74
5.1.3 总体T标准卷TYA、新卷TXA及锚测验TA统计数据 75
5.2 前平滑处理的结果 79
5.2.1 标准卷和新卷数据前平滑处理结果 79
5.2.2 等值标准:总体T各分测验的前平滑处理 80
5.3 等值标准的计算结果 82
5.4 各种等值方法在各分测验上的等值结果 82
5.5 总误差指标的比较 82
5.5.1 不同等值标准下分测验总误差比较 83
5.5.2 总测验以四种等值方法为等值标准的加权总误差排名结果 87
5.6 核等值法与基于CTT的对应等值方法成对比较 92
5.6.1 核链式优化h值方法与基于CTT的链式等百分位方法 92
5.6.2 核后分层优化h值方法与基于CTT的频数估计等百分位方法 94
5.6.3 核链式大h值方法与基于CTT的链式线性方法 96
5.6.4 核后分层大h值方法与三种基于CTT的线性方法 97
5.7 核等值框架下各种方法等值结果比较 99
5.7.1 核等值框架下链式方法结果比较 100
5.7.2 核等值框架下后分层方法结果比较 102
5.7.3 核等值框架下链式方法与后分层方法结果成对比较 104
5.7.4 核等值框架下优化h值及大h值方法等值结果成对比较 109
5.7.5 核等值框架下平滑与未平滑等值结果成对比较 114
5.8 部分等值方法在各分测验上的等值标准误均值比较 119
5.9 各等值方法在分测验上的等值分统计指标 120
第六章 稳定性检验 124
6.1 小样本试卷拆分后的主要统计数据 124
6.1.1 小样本标准卷统计数据 124
6.1.2 小样本新卷统计数据 125
6.2 总误差指标的比较 127
6.2.1 不同等值标准下分测验总误差比较 128
6.2.2 总测验以四种等值方法为等值标准的加权总误差排名结果 132
6.3 核等值法与基于CTT的对应等值方法成对比较 137
6.3.1 核链式优化h值方法与基于CTT的链式等百分位方法 137
6.3.2 核后分层优化h值方法与基于CTT的频数估计等百分位方法 139
6.3.3 核链式大h值方法与基于CTT的链式线性方法 141
6.3.4 核后分层大h值方法与三种基于CTT的线性方法 142
6.4 核等值框架下各种方法等值结果比较 144
6.4.1 核等值框架下链式方法结果比较 144
6.4.2 核等值框架下后分层方法结果比较 146
6.4.3 核等值框架下链式方法与后分层方法结果成对比较 149
6.4.4 核等值法框架下优化h值及大h方法等值结果成对比较 154
6.4.5 核等值框架下平滑与未平滑等值结果成对比较 159
6.5 部分等值方法在各分测验上的等值标准误均值比较 163
6.6 各等值方法在小样本分测验上的等值分统计指标 164
第七章 讨论 168
7.1 等值所依据的定义问题 168
7.2 等值必要性问题 169
7.3 等值标准的确定 169
7.4 比较结果 171
7.4.1 与等值标准比较的结果 171
7.4.2 等值标准误指标比较情况 173
7.4.3 等值分数分布统计指标 173
7.5 核等值方法与基于CTT等值方法的成对比较 173
7.6 核等值框架下各种等值方法的成对比较 175
7.7 与以前的等值研究一致性问题 177
7.8 关于HSK等值采用核等值法的建议 180
7.9 本研究的创新 181
7.10 本研究的不足以及有待于进一步研究的问题 181
第八章 结论 183
参考文献 185
术语索引 210
后记 217