第一部分 技术问题 3
第一章 测量中的基本问题 3
一、引言 3
二、历史简介 4
1.早期阶段 5
2.繁荣阶段 6
3.第一批判阶段 7
4.测试组合阶段 7
5.第二批判阶段 8
6.问责制时期 8
三、决定的类型 9
四、测试与决定 10
做决定过程中的价值取向 11
五、测量程序的具体步骤 13
1.特征识别与定性 13
2.确定隔离和表现特征的操作程序 15
3.属性的量化 16
4.测量过程中的问题 18
六、一些测量中的当前问题 19
1.少数族裔个体测试 20
2.侵犯隐私 21
3.使用常模对照组 22
4.影响测试分数的其他因素 23
5.受试者的权利和责任 23
总结 24
习题 24
推荐阅读 26
第二章 测量与数字 28
一、如何理解测试分数 28
二、测量量表 31
三、频率分布表的准备 33
1.分组频率分布 34
2.累积频率分布 39
3.图示法 40
四、集中趋势测量 43
1.众数 43
2.中值 44
3.百分位数值 46
4.算术平均值 47
5.集中趋势与分布形态 49
五、差异性测量 51
1.全距 51
2.半四分位数间全距 51
3.标准差 52
六、标准差分析 55
七、个体分数分析 57
八、相关性测试 58
九、预测结果 64
确定回归线 66
总结 69
习题 70
推荐阅读 72
第三章 赋予分数意义 73
一、分数的本质 73
1.参照系 74
2.标准参照测试和常模参照测试的领域 76
二、标准参照评估 77
三、常模参照评估 80
1.年级常模 82
2.年龄常模 86
3.百分位数常模 88
4.标准分数常模 94
5.转换的正态分布 99
6.九分评分制 101
四、不同类型常模的互换性 103
五、商数 106
六、分数组合 107
七、标准参照分析报告 112
八、学校平均水平常模 115
九、常模使用注意事项 116
十、第三参照系:项目反应理论 119
总结 126
习题 127
推荐阅读 128
第四章 测量程序应有特性:信度 130
一、引言 130
二、信度和一致性 131
不一致性的来源 132
三、表示信度的两种方法 133
1.标准测量误差 133
2.信度系数 134
四、评估信度的方法 135
1.同材料重复测试 135
2.平行测试形式 137
3.单次测量方法 138
4.方法对比 144
五、信度数据分析 145
1.标准测量误差 145
2.信度系数 147
六、影响信度的因素 148
1.测量对象的差异性 149
2.测量对象的特征等级 149
3.测试长度 151
4.评估信度的方法 152
5.实际信度和理论信度 153
七、最低信度 154
八、差异分的信度 156
九、不可靠性对变量之间相关系数的影响 159
十、标准参照测试的信度 160
十一、计算机自适应测试的信度 165
总结 169
习题 170
推荐阅读 171
第五章 测量程序应有特性:效度 172
一、引言 172
二、内容相关效度证据 173
1.设计命题蓝图 174
2.测量能力倾向与典型表现的内容效度 181
三、标准相关效度证据 182
1.表面效度 182
2.实证效度 182
四、建构相关的效度证据 194
1.相关性的预测 195
2.对群体差异的预测 197
3.对有关实验或干预反应的预测 197
五、效度的统一定义 198
1.效度验证作为一项科学追求 199
2.作为整体效度的建构效度 200
3.梅西克的扩大效度理论 204
4.对梅西克思想的修正及关注点的变化 208
六、效度理论和测试偏见 210
七、信度和效度的重合 211
八、标准参照测试的效度 212
九、元分析和效度的泛化 213
总结 214
习题 214
推荐阅读 215
第六章 测试的实际应用问题 217
一、例行测试的使用中与实际应用相关的一些因素 217
1.经济性 217
2.有助测试实施的因素 219
3.有助解读和应用测试分数的因素 220
4.电子化测试 222
二、测试评估指南 223
1.基本信息 224
2.关于测试的信息 224
3.解析测试结果的辅助方法 224
4.效度 224
5.信度 225
6.测试的实施与评分 225
7.量表和常模 226
三、了解具体的测试 226
1.现存测试有哪些? 227
2.X测试到底是什么样的? 229
3.评审们如何评价X测试? 230
4.前人对X测试做过哪些研究? 232
总结 234
习题 234
测试信息参考资料 235
第二部分 测试的应用 241
第七章 教育决策与评估 241
一、引言 241
二、价值观和决策 241
三、《有教无类法案》 242
1.《有教无类法案》总览 242
2.标准和评估 244
3.问责制 245
四、人员安置决策 246
1.残障学生的主流化问题 247
2.人员安排决定是如何做出的 248
五、课堂教学决策 249
1.使用教学目标 250
2.评估方法的类型 250
六、日常教学决策 253
七、汇报学业进展 254
1.相对于完美水平的表现 255
2.相对于同等水平的表现 255
3.相对于潜能水平的表现 256
4.评定成绩 257
5.成绩的重要性 257
八、影响未来教育的决策 258
1.选拔性决策 259
2.高风险决策 260
九、其他教育决策 262
1.有关课程设计的决策 262
2.公共决策和政治决策 263
总结 264
习题 264
推荐阅读 265
第八章 评估特殊人群:心理测量、法律及道德问题 267
一、引言 267
二、重大立法与诉讼概览 268
1.影响重大的立法 268
2.影响重大的诉讼 269
三、特殊教育评估过程 270
项目实施和评估程序的移交 270
1.识别和移交 271
2.资格认定 271
3.项目计划、实施和评估 272
四、特殊教育评估涉及的主要领域 273
1.智力和认知能力 273
2.适应性行为和自理能力 274
3.行为和社会-情感能力 275
4.神经心理能力 276
五、评估母语为非英语者 277
1.简介 277
2.语言水平评估 278
3.对母语为非英语者进行学业能力评估 279
4.对母语为非英语者进行特殊教育评估 280
六、传统学业能力 280
1.阅读、数学和书面语评估 280
2.课程评估 282
3.生态评估 283
七、专业标准和道德规范 284
简介 284
八、专业训练和专业能力 285
1.专业训练 285
2.专业能力 286
九、专业责任和科学责任 286
教育测试与心理测试的标准 286
1.测试结构、评估和记录 287
2.测试和公平 287
3.测试应用 288
十、尊重他人的权利和尊严 288
隐私和保密 288
1.谁会从收集到的信息中获益? 288
2.怎么使用这些信息? 289
十一、社会责任 289
1.公平分配 290
2.测试的社会效益 290
3.积极影响的最大化 291
总结 293
习题 294
推荐阅读 294
第九章 测试开发原则 296
一、引言 296
二、编写客观题的一些建议 296
1.客观题的一般原则 296
2.编写判断正误题 300
3.编写多项选择题 305
4.编写匹配题 318
三、编制可用的客观测试 320
四、客观测试的评分 323
1.猜题校正 323
五、利用试题分析改进客观测试 325
1.简化的试题分析程序 326
2.更多正式试题分析程序 328
六、编写论述题 331
1.编写论述问题 332
2.设计论述题测试 334
3.论述题的评分 335
总结 336
习题 337
推荐阅读 338
第十章 表现评估和作品评估 340
一、引言 340
二、传统认知测试的人为因素 340
三、作品评估 341
四、在认知任务中运用表现评估和作品评估 342
表现评估的评分 343
五、过程评估 345
1.使用检查表 345
2.使用定级量表 346
六、评估作品及表现 347
1.多位观测者的优点 348
2.多位观测者的可靠性或一致性 348
七、系统观测 350
1.进行系统观测 351
2.系统观测的优缺点 354
总结 357
习题 357
推荐阅读 358
第十一章 态度及定级量表 359
一、引言 359
二、从他人处了解某人性格 359
1.推荐信 360
2.定级量表 362
3.得出合理定级时存在的问题 363
4.提高评分效率 370
5.提高评分准确度 376
6.用于特殊情况的评分程序 380
三、态度测量 383
1.累加态度评估量表 385
2.单项目量表 387
3.态度评估量表示例 387
4.其他格式 390
总结 393
习题 394
推荐阅读 395
第十二章 能力倾向测试 397
一、引言 397
二、认知能力理论 397
1.比奈理论 398
2.斯皮尔曼的g理论 399
3.瑟斯通的基本心理能力理论 399
4.延森理论和韦氏理论 400
5.卡特尔-霍恩的流动-固定智力理论 402
6.卡罗尔的三阶层理论 403
7.斯滕伯格的智力三元理论 403
8.戴斯-那列里的PASS模型 404
9.加德纳的提议 405
三、个人一般能力测试 406
1.斯坦福-比奈智力量表第四版 406
2.斯坦福-比奈智力量表第五版 410
3.韦氏量表 414
4.伍德科克-约翰逊心理-教育测试组合第三版 417
5.戴斯-纳列里认知评估系统 419
6.认知能力的非语言性测量 420
7.简易个人测试 423
四、群组一般能力测试 425
五、多能力测试 430
1.差别能力倾向测试组合 431
2.一般能力倾向测试组合 433
六、一般认知能力的作用:《钟形曲线》 436
总结 441
习题 441
推荐阅读 443
第十三章 标准化成绩测试 446
一、引言 446
二、标准化成绩测试的特点 446
三、标准化成绩测试的用途 447
四、标准化成绩测试的类别 448
五、群组标准化成绩测试 449
六、个人成绩测试 451
七、中学及大学水平成绩测试 453
八、全国范围内实施成绩测试组合的问题——“乌比冈湖效应” 456
九、解析标准化成绩测试 459
十、诊断型成绩测试 460
十一、标准参照的标准化成绩测试 462
1.标准参照的标准化成绩测试案例 462
2.标准参照的标准化成绩测试存在的问题 463
总结 464
习题 464
推荐阅读 465
第十四章 兴趣、性格和调整能力 466
一、引言 466
二、兴趣测量 467
1.斯特朗兴趣量表 467
2.职业评估量表 477
3.自我探索量表 478
三、性格和调整能力评估 479
1.动态评估法 480
2.特质研究法 483
3.人本主义研究法:性格与自我认知 492
4.行为研究法 494
四、性格和兴趣测量存在的问题 500
五、计算机评分与解析 502
优点 502
缺点 503
总结 503
习题 503
推荐阅读 504
附录 正态曲线中低于设定值的测试对象所占比例 506
参考文献 508