目录 3
第一部分 心理测量的理论基础 3
第1章 心理学与教育学中的测量 3
1.1 心理测验理论的必要性 3
1.2 心理学理论及其功能 5
1.3 测量的模型结构基础 7
1.4 心理学中测量的地位 10
1.5 测量的水平 11
1.6 等距量表的说明 13
1.7 确定性模型与概率模型 15
1.8 测验理论模型的假定基础 16
第2章 真分数与误差分数的结构 19
2.1 引言 19
2.2 固定人的测量分布 21
2.3 作为一种期望的真分数 23
2.4 固定人时误差随机变量的结构 24
2.5 被试的随机选择 25
2.6 线性模型的结构 27
2.7 经典模型常见假定的推导 30
2.8 什么是误差 33
2.9 真分数的多种概念 34
2.10 实验独立 40
2.11 线性实验独立 41
2.12 重复测量 42
2.13 平行测量与平行复份 44
第二部分 经典测验理论模型 53
第3章 定长测验中经典模型的基本方程 53
3.1 经典线性模型:重述假定 53
3.2 期望、方差和相关 55
3.3 基于平行测量的关系 56
3.4 定义、解释及应用 59
3.5 测验的效度 60
3.6 经典模型的另一种表述 63
3.7 经典模型的回归理论 64
3.8 测量、估计和预测的误差 66
3.9 衰减公式 69
3.10 推断真实变化的基本模型 75
第4章 组合测验 83
4.1 引言 83
4.2 两个分测量的组合测量 84
4.3 n个分测量的组合测量 86
4.4 a系数和组合测量的信度 89
4.5 测验的内部结构 99
4.6 加权组合测量的期望、方差与协方差 99
4.7 两种组合测量之间的相关 101
第5章 变长同质测验中经典模型的基本方程 107
5.1 作为测验参数的测验长度 107
5.2 连续测验长度参数的经典模型 108
5.3 假定的陈述 110
5.4 在不限长度测验中以被试的观测分数作为他的真分数 113
5.5 基本定理 114
5.6 期望和方差 115
5.7 协方差 115
5.8 在观测分数、真分数和误差分数之间的相关 116
5.9 加长测验的期望、方差及相关 117
5.10 Spearman—Brown公式 118
5.11 测验长度对效度的影响 121
5.12 比较不同长度测验的信度与效度 125
5.13 具有特定真分数的最可靠组合 127
5.14 固定分测验长度时,求组合测验信度的最大值 132
5.15 固定总测验时间时,求作为一种相对测验长度函数的成套测验效度之最大值 133
第6章 影响测量精度、估计与预测的因素 138
6.1 引言 138
6.2 异质性组对测验信度的影响 138
6.3 速度测验和难度测验 141
6.4 影响信度的测量条件 143
6.5 对衰减修正的实验问题 148
6.6 Spearman—Brown预言公式的准确性 150
6.7 作为一般概念的信度 150
6.8 明确选择和伴随选择对测验效度的影响:二变量情形 152
6.9 选择对测验效度的影响:三变量情形 156
6.10 选择对测验效度的影响:一般情形 159
6.11 选择公式的准确性 160
第7章 经典模型某些参数的估计 164
7.1 引言 164
7.2 估计真分数 165
7.3 平行测量中特定误差方差的无偏估计 167
7.4 估计误差方差的应用 173
7.5 从方差分量分析中估计特定真分数方差 175
7.6 作为方差分量分析时估计问题的一般方程 178
7.7 从不严格平行测量中估计特定误差方差的上界 183
第三部分 其他弱真分数模型 193
第8章 不完全平行测量的某些测验理论 193
8.1 定义真分数 193
8.2 测量的一般误差 197
8.3 一般误差方差 198
8.4 测量的一般误差的基本性质 202
8.5 一般真分数方差 207
8.6 一般真分数方差与特定真分数方差之间的关系 208
8.7 描述单一测验复份的一般参数估计 210
8.8 误差方差估计量的比较 216
8.9 关于估计量选择的实质性考虑 220
第9章 信度系数类型及其估计 224
9.1 引言 224
9.2 估计特定信度系数 226
9.3 方差比率估计的统计性质 228
9.4 组合测验的特定信度理论 230
9.5 正态分布分数中信度的极大似然估计 231
9.6 估计信度的频率分布 233
9.7 一般信度系数 235
9.8 单一测验的一般信度 237
9.9 信度系数的应用和解释 239
9.10 有序测量的信度 243
9.11 因素负荷作为信度系数的应用 245
9.12 不用平行复份来估计信度 246
第10章 τ-等价测量的测验理论(含高阶矩估计) 250
10.1 引言和定义 250
10.2 一种线性实验独立的假定 251
10.3 直接蕴涵 252
10.4 τ-等价测量的基本定理 254
10.5 三阶矩 255
10.6 高阶矩和累积量 257
10.7 真分数对观测分数的回归 258
10.8 蕴涵、应用和限制 259
第11章 测验理论和研究设计中题目抽样 262
11.1 引言 262
11.2 矩阵抽样 265
11.3 广义对称均值 267
11.4 第一次和第二次广义对称均值 270
11.5 估计真分数矩 275
11.6 估计观测分数与真分数的关系 279
11.7 估计平行测验复份分数之间的关系 280
11.8 估计加长测验观测分数的统计量 280
11.9 在二值式题目中测量误差的次数分布 282
11.10 作为研究设计一种方法的题目抽样 284
11.11 估计单一题目样本的均值 285
11.12 估计多重矩阵抽样的均值 287
11.13 估计组均差 291
11.14 估计题目抽样中的观测分数方差 293
第12章 效度 297
12.1 引言 297
第四部分 效度和测验结构理论 297
12.2 回归与预测 298
12.3 线性回归函数 300
12.4 复相关与偏相关 302
12.5 偏相关、复相关与n元回归 304
12.6 预测变量的筛选 307
12.7 抑制变量、缓和变量与差别可预测性 310
12.8 增量效度 312
12.9 效度与选择比 314
12.10 以相关系数来解释效度概念的某些评论 316
12.11 结构效度 318
第13章 预测变量的选择 321
13.1 引言 321
13.2 某些抽样问题 322
13.3 选择预测变量的形式方法 325
13.4 未来样本的预测 327
13.5 相对测验长度对信度与效度的影响:多重预测情形 331
13.6 确定相对测验长度求复相关极大值 334
第14章 测量方法与题目评分公式 340
14.1 引言 340
14.2 猜测与遗漏 341
14.3 简单公式分数 344
14.4 简单公式分数的性质 346
14.5 题目评分的简单回归模型 350
14.6 以部分知识为假定的简单模型的回归方法 352
14.7 其他题目评分公式 354
14.8 部分知识的评价 355
14.9 关于某测验题目区分部分知识水平的方法 356
14.10 从个体概率研究题目评分的假定 361
14.11 再生评分体系 364
第15章 题目参数与测验结构 369
15.1 引言 369
15.3 题目的区分力 371
15.2 题目难度 371
15.4 题目效度 375
15.5 二值式题目的积矩相关 379
15.6 双列相关 382
15.7 双列系数和点双列系数的比较 386
15.8 四项相关 392
15.9 四项系数与phi系数的比较 394
15.10 在测验编制技术选择上的考虑 398
15.11 公式评分及有关机遇成功的校正 401
15.12 不变的题目参数 403
第16章 潜在特质与题目特征函数 405
16.1 引言 405
16.2 潜在变量 406
16.3 局部独立 408
16.4 题目-测验间的回归 410
16.5 正态卵形模型 414
16.6 产生正态卵形模型的条件 419
16.7 一个公共因素的相关矩阵 421
16.8 正态卵形题目特征曲线的充分条件 424
16.9 正态卵形参数:题目难度 427
16.10 正态卵形参数:题目区分力 428
16.11 正态卵形题目参数的实际应用 430
16.12 测验分数的条件分布 437
16.13 潜在特质与真分数的关系 438
16.14 心理测量中的典型畸变 441
第五部分 某些潜在特质模型及其在推断考生能力中的应用 449
第17章 某些潜在特质模型 449
17.1 引言 449
17.2 Logistic测验模型 452
17.3 其他模型 455
17.4 作为测量工具的测验:用测验分数对能力水平进行分类和估计的例子 459
17.5 测验的信息结构与分数量表的变换 465
17.6 能力量表的变换 466
17.7 测验分数分布的计算 469
17.9 题目参数估计 477
17.8 一般的Quantal反应模型 477
17.10 测验模型的效度 480
第18章 测验分数、充分统计量及测验信息结构 481
18.1 充分统计量:定义与解释 481
18.2 统计量充分性的条件 484
18.3 测验分数与充分统计量 486
18.4 充分性与Logistic测验模型 488
18.5 充分性与测验信息结构 493
第19章 能力水平的分类 494
19.1 区别两种能力水平的分类规则 494
19.2 两点分类问题 496
19.3 局部最佳权数与分类规则 502
19.4 更一般的分类规则,组合分数及一般统计效率 504
19.5 分类规则的定量评估和有效设计 507
20.2 信息函数的代数 514
第20章 能力的估计 514
20.1 引言 514
20.3 更一般的估计方法:最大似然法 516
20.4 各种测验题目的信息函数 522
20.5 不同测验的信息函数 528
20.6 测验设计与题目选择的问题 532
20.7 不同测验设计、测验评分公式及估计量的相对精度或效率 536
20.8 Logistic模型中未加权分数的效率 538
第六部分 强真分数理论 547
第21章 泊松过程模型 547
21.1 引言 547
21.2 母函数和泊松分布 548
21.3 伯努利可变概率试验的泊松极限的读错模型推导 552
21.4 关于读错泊松模型的陈述 553
21.5 读错模型中参数的分离 555
21.7 朗读速度的随机过程模型 557
21.6 无参数分布的读错模型拟合检验 557
21.8 未完的课文 559
第22章 具有已知分布形式的独立误差的测量 561
22.1 引言 561
22.2 真分数分布的矩 563
22.3 潜在特质理论中的基本方程 564
22.4 根据观测分数分布估计真分数分布的公式 566
22.5 统计推断问题 568
22.6 真分数对观测分数的回归 570
22.7 误差分布为正态的假定 573
22.8 真分数对观测分数线性回归的条件 573
22.9 真分数对两个或两个以上τ—等价观测分数的线性多元回归的条件 576
22.10 一个测量关于其他测量的线性回归的条件 576
第23章 二项误差模型 578
23.1 引言 578
23.2 定义和假定 579
23.3 真分数的置信区间 581
23.4 基本方程 583
23.5 观测分数上真分数的回归 584
23.6 测验分数的负超几何分布 586
23.7 真分数的β分布 592
23.8 真分数分布的矩 593
23.9 二项误差模型与其他测验理论模型的关系 595
23.10 复合二项误差模型 597
23.11 真分数分布的解 600
24.1 引言 603
第24章 真分数、因素与潜在特质 603
24.2 多因素分析模型 604
24.3 因素分析与真分数分解之间的比较 609
24.4 潜在特质的因素 611
24.5 条件独立 613
24.6 真分数与潜在特质之间的关系 616
24.7 一般的潜在特质模型 618
24.8 二值式随机变量的潜在特质模型 622