第一部分 原理 1
第1章 导论 1
1.1 基本概念 4
1.1.1 什么是测验 5
1.1.2 测验的类型 6
1.2 本书概要 8
1.2.1 心理测验的原理 8
1.2.2 心理测验的应用 8
1.2.3 心理测验的问题 9
1.3 历史回顾 9
1.3.1 早期发展 9
1.3.2 达尔文和个体差异 10
1.3.3 实验心理学和心理物理测量 10
1.3.4 智力的演变和标准化成就测验 11
1.3.5 人格测验:1920~1940 14
1.3.6 人格测验新方法的出现 16
1.3.7 测验地位快速变化时期 16
1.3.8 当前的环境 18
1.4 小结 19
第2章 测验常模和基本统计 20
2.1 我们为什么需要统计 20
2.2 测验量表 21
2.2.1 量表的特征 22
2.2.2 量表的类型 23
2.2.3 可进行的运算 24
2.3 频数分布 24
2.4 百分等级 27
2.5 百分位数 30
2.6 描述分数分布 31
2.6.1 平均数 31
2.6.2 标准差 32
2.6.3 Z分数 33
2.6.4 标准正态分布 34
2.6.5 麦柯尔T分数 40
2.6.6 四分位数和十分位数 41
2.7 常模 42
2.7.1 年龄常模 44
2.7.2 轨迹 45
2.7.3 标准参照测验 46
2.8 小结 49
第3章 相关与回归 52
3.1 散点图 53
3.2 相关 54
3.3 回归 55
3.3.1 回归直线 55
3.3.2 最优拟合直线 56
3.3.3 相关系数的统计显著性检验 62
3.3.4 如何解释回归图形 63
3.4 其他相关系数 65
3.5 相关分析中的术语和争议 67
3.5.1 残差 67
3.5.2 估计的标准误 68
3.5.3 决定系数 68
3.5.4 不相关系数 68
3.5.5 收缩率 68
3.5.6 交叉验证 69
3.5.7 相关-因果问题 69
3.5.8 第三变量解释 70
3.5.9 范围受限 70
3.6 多元分析 71
3.6.1 一般方法 71
3.6.2 多元回归应用举例 72
3.6.3 判别分析 73
3.6.4 因素分析 73
3.7 小结 76
附录3A 回归方程和相关系数的计算 77
3A.1 回归方程的计算 78
3A.2 相关系数的计算 79
第4章 信度 81
4.1 信度的历史和理论 82
4.1.1 误差的概念 82
4.1.2 斯皮尔曼的早期研究 82
4.1.3 测验分数理论的基础 83
4.2 领域抽样模型 84
4.3 项目反应理论 85
4.4 信度模型 86
4.4.1 误差来源 87
4.4.2 时间取样:重测法 87
4.4.3 项目取样:复本法 89
4.4.4 分半法 89
4.4.5 KR20公式 91
4.4.6 α系数 92
4.4.7 差异分数的信度 93
4.5 行为观察研究中的信度 94
4.6 与信度评估方法相关的误差来源 97
4.7 信度信息的使用 100
4.7.1 测量标准误和弹性码尺 100
4.7.2 什么样的信度是可信的 101
4.7.3 面对信度低怎么办 102
4.8 小结 104
附录4A 测验的两部分方差不同时利用α系统来估计分半信度 105
附录4B 利用KR20计算信度 105
第5章 效度 107
5.1 效度的定义 108
5.2 效度的各方面 109
5.2.1 表面效度 109
5.2.2 与内容有关的效度证据 109
5.2.3 与标准有关的效度证据 111
5.2.4 与构想有关的效度证据 120
5.2.5 信度与效度的关系 126
5.3 小结 126
第6章 测验项目的编写和评价 128
6.1 项目编写 128
6.1.1 项目形式 129
6.1.2 其他可能性 136
6.2 项目分析 139
6.2.1 项目难度 139
6.2.2 区分度 140
6.2.3 项目特征图 142
6.2.4 不同测量的链接 147
6.2.5 标准参照测验的项目 148
6.2.6 项目分析的局限性 149
6.3 小结 149
第7章 测验的实施 151
7.1 主试和被试 151
7.1.1 主试和被试的关系 151
7.1.2 主试的种族 152
7.1.3 被试的语言 154
7.1.4 施测者的培训 154
7.1.5 期望效应 154
7.1.6 对反应强化的影响 156
7.1.7 计算机辅助测验的实施 158
7.1.8 施测模式 159
7.1.9 被试变量 160
7.2 行为评估的方法学 161
7.2.1 反应性 161
7.2.2 偏离 162
7.2.3 期望 162
7.2.4 欺骗 162
7.2.5 评定误差的统计控制 163
7.3 小结 164
第二部分 应用 165
第8章 访谈技术 165
8.1 作为测验的访谈 168
8.2 访谈的交互性质 168
8.3 有效访谈的原则 169
8.3.1 合适的态度 169
8.3.2 应当避免的反应 170
8.3.3 有效的反应 171
8.3.4 保持互动顺利的反应 172
8.3.5 对理解的测量 175
8.4 访谈的类型 176
8.4.1 评价性访谈 177
8.4.2 结构化临床访谈 177
8.4.3 个案历史访谈 181
8.4.4 心理状态检查 182
8.4.5 提高访谈技能 183
8.5 访谈的误差来源 183
8.5.1 访谈的效度 183
8.5.2 访谈的信度 185
8.6 小结 186
第9章 智力理论和比奈量表 188
9.1 智力的界定问题 188
9.2 比奈的测验建构原理 190
9.2.1 原理1:年龄分化 190
9.2.2 原理2:一般心理能力 191
9.3 斯皮尔曼的一般心理能力模型 191
9.3.1 一般心理智力(g)的含义 192
9.3.2 智力的gf-gc理论 192
9.4 早期的比奈量表 193
9.4.1 1905年比奈-西蒙量表 193
9.4.2 1908年量表 194
9.5 推孟的斯坦福-比奈智力量表 195
9.5.1 1916年斯坦福-比奈智力量表 195
9.5.2 智力商数(IQ) 196
9.5.3 1937年量表 196
9.5.4 1960年修订版斯坦福-比奈量表和离差智商(SB-LM) 198
9.6 现代比奈智力量表 199
9.6.1 第4和第5版比奈智力量表的模型 199
9.6.2 1986年修订版的特征 199
9.6.3 2003年第5版的特征 202
9.6.4 2003年第5版的心理测量学特性 203
9.6.5 中位数效度 204
9.7 小结 204
第10章 韦克斯勒智力量表:WAIS-Ⅲ,WISC-Ⅳ和WPPSI-Ⅲ 205
10.1 韦克斯勒智力量表 206
点量表和操作量表的概念 206
10.2 从韦克斯勒-贝尔韦智力量表到WAIS-Ⅲ 208
10.3 量表、分测验和WAIS-Ⅲ的指数 208
10.3.1 语言分测验 209
10.3.2 原始分数、量表分数和言语智商 212
10.3.3 操作分测验 213
10.3.4 操作智商 214
10.3.5 全量表IQ 214
10.3.6 指数分数 214
10.4 韦克斯勒智力测验的解释特征 215
10.4.1 言语智商和操作智商比较 215
10.4.2 模式分析 216
10.4.3 假设性案例研究 216
10.5 韦克斯勒成人量表的心理测量学特性 217
10.5.1 标准化 217
10.5.2 信度 217
10.5.3 效度 218
10.6 对韦克斯勒成人量表的评价 218
10.7 WAIS-Ⅲ的向下拓展:WISC-Ⅳ和WPPSI-Ⅲ 219
10.7.1 韦克斯勒儿童智力量表WISC-Ⅳ 219
10.7.2 韦克斯勒幼儿与学龄初智力量表WPPSI-Ⅲ 222
10.8 小结 223
第11章 教育和特殊教育中的其他个体能力测验 225
11.1 其他个体能力测验与比奈量表和韦克斯勒量表的比较 226
11.2 其他量表之间的相互比较 227
11.3 特殊的个体能力测验 228
11.3.1 婴儿量表 229
11.3.2 适合年幼儿童的主要量表 234
11.3.3 用于残疾人和特殊人群的一般个体能力测验 239
11.4 学习障碍测验 242
11.4.1 视觉图形测验 246
11.4.2 创造力:托兰斯创造性思维测验 247
11.4.3 个体成就测验:广泛成就测验第三版(WRAT-3) 248
11.5 小结 249
第12章 教育、公共服务及军队中所使用的标准化测验 250
12.1 团体和个体能力测验的比较 251
12.1.1 个体测验的优点 252
12.1.2 团体测验的优点 252
12.2 团体测验概述 253
12.2.1 团体测验的特征 253
12.2.2 团体测验的选择 253
12.2.3 团体测验的使用 254
12.3 学校中的团体测验:从幼儿园到12年级 254
12.3.1 成就测验与能力倾向测验的比较 254
12.3.2 团体成就测验 255
12.3.3 心智能力(智力)的团体测验 257
12.4 大学入学测验 259
12.4.1 SAT推理测验 259
12.4.2 中学和大学联合能力测验 261
12.4.3 美国大学测验 261
12.5 研究生和专业学院入学测验 261
12.5.1 研究生入学考试能力倾向测验 262
12.5.2 米勒类比测验 266
12.5.3 法学院入学测验 267
12.6 非语言团体能力测验 268
12.6.1 瑞文渐进矩阵 268
12.6.2 古德依诺-哈里斯画人测验 271
12.6.3 文化公平智力测验 272
12.6.4 美国公民服务系统中的标准化测验 272
12.6.5 美国军队标准化测验:军人职业能力倾向成套测验 273
12.7 小结 274
第13章 临床和咨询中的应用 275
13.1 结构化人格测验的编制方法 277
13.1.1 推理法 277
13.1.2 实证法 278
13.1.3 有待讨论的测验的选择标准 279
13.2 逻辑内容法 279
13.2.1 伍德沃斯个人资料表 279
13.2.2 早期的多维逻辑内容量表 280
13.2.3 穆尼问题检核表 280
13.2.4 对逻辑内容法的批评 280
13.3 效标团体法 281
13.3.1 明尼苏达多相人格测验 281
13.3.2 加利福尼亚心理测验-第3版 290
13.4 因素分析法 291
13.4.1 吉尔福特的早期探索 292
13.4.2 卡特尔的贡献 292
13.4.3 因素分析方法的问题 294
13.5 理论推导法 295
13.5.1 爱德华个性偏好测验(EPPS) 295
13.5.2 人格研究量表(PRF)和杰克森人格调查表(JPI) 297
13.5.3 自我概念 297
13.6 综合法 299
13.6.1 积极人格测量和大五人格调查表-修订版 299
13.6.2 大五人格调查表(NEO-PI-R) 300
13.7 积极人格特征的常用测量方法 302
13.7.1 罗森伯格自尊量表 303
13.7.2 一般自我效能量表(GSE) 303
13.7.3 自我复原力量表 303
13.7.4 气质复原力量表(DRS) 303
13.7.5 希望量表 303
13.7.6 生活导向量表-修订版(LOT-R) 304
13.7.7 生活满意度量表(SWLS) 304
13.7.8 积极和消极情感清单(PANAS) 305
13.7.9 压力情境应对干预(CISS) 305
13.7.10 核心自我评价 305
13.8 积极人格特征研究的未来 306
13.9 小结 307
第14章 投射性人格测验 309
14.1 投射假说 310
14.2 罗夏墨迹测验 311
14.2.1 历史上的先行者 312
14.2.2 刺激物、施测和解释 312
14.2.3 心理测量学特性 318
14.3 其他墨迹测验:霍兹曼测验 324
14.4 主题统觉测验 325
14.4.1 刺激物、施测和解释 326
14.4.2 心理测量学特性 328
14.5 其他统觉法 329
14.6 非图形投射法 330
14.6.1 词语联想测验 330
14.6.2 句子完成任务 331
14.6.3 画图测验 331
14.7 小结 332
第15章 计算机和基础心理科学测验 334
15.1 认知行为评价法 335
15.1.1 认知行为评价的原理 335
15.1.2 基于操作性条件反射的程序 337
15.1.3 自陈技术 339
15.1.4 坎弗和萨思洛的功能法 342
15.1.5 功能障碍态度问卷 343
15.1.6 非理性信念测验 344
15.1.7 认知功能分析 344
15.2 心理生理法 346
15.2.1 与治疗有关的生理变量 346
15.2.2 对心理生理法的评价 346
15.3 计算机和心理测验 347
15.3.1 计算机辅助访谈 348
15.3.2 计算机施测的测验 349
15.3.3 计算机诊断、计分及结果报告 349
15.3.4 互联网在心理测验中的应用 351
15.3.5 计算机化的认知-行为评价 352
15.3.6 只能用计算机进行的测验 353
15.3.7 计算机自适应测验 354
15.3.8 心理生理和信号检测法 355
15.4 小结 357
第16章 咨询心理学中的测验 359
16.1 兴趣的测量 360
16.1.1 斯特朗职业兴趣表 360
16.1.2 斯特朗-坎贝尔兴趣调查表 361
16.1.3 坎贝尔兴趣和技能调查表 363
16.1.4 斯特朗兴趣量表的再热 364
16.1.5 库德职业兴趣调查表 367
16.1.6 职业评估调查表 369
16.1.7 自我定向探测 369
16.1.8 消除兴趣测量中的性别偏向 370
16.1.9 态度和兴趣 371
16.2 工作安置中的个性特征测量 371
16.2.1 特质因子取向:奥斯普的职业维度 371
16.2.2 人格特质是稳定的吗 372
16.3 小结 373
第17章 健康心理学和保健测验 374
17.1 神经心理学评定 374
17.1.1 临床神经心理学 374
17.1.2 发展神经心理学 379
17.1.3 成人神经心理学 383
17.1.4 加州言语学习测验 387
17.1.5 自主神经心理测验 389
17.1.6 焦虑和应激评估 390
17.1.7 应激和焦虑 390
17.1.8 状态-特质焦虑调查表 391
17.1.9 测验焦虑的测量 392
17.1.10 应对的测量 395
17.1.11 生态学瞬时评定 396
17.2 生活质量评定 397
17.2.1 什么是同健康有关的生活质量 397
17.2.2 生活质量测量的常用方法 398
17.3 小结 400
第18章 工业和商业场所的测验 402
18.1 人事心理学——雇员选拔 403
招聘面试 403
18.2 基准率和命中率 404
18.2.1 泰勒-罗素表 408
18.2.2 效用理论与决策分析 412
18.2.3 增益效度 413
18.3 雇员视角的人事心理学:人职匹配 415
18.3.1 迈尔斯-布里格斯类型指标 415
18.3.2 工业用的测验:温德利人事测验 416
18.4 对工作场合特性的测量 416
18.4.1 社会-生态学方法 416
18.4.2 环境的分类 418
18.5 职务分析 420
18.6 人与情境的交互作用的测量 422
18.7 小结 425
第三部分 问题 426
第19章 测验偏向 426
19.1 测验偏向为何会有争议 426
19.2 测验公平与法律 430
19.3 测验的传统防卫 431
19.3.1 与内容有关的效度证据 432
19.3.2 与校标有关的偏向来源 434
19.4 测验少数族群成员的其他方法 437
19.4.1 无知还是愚钝 437
19.4.2 Chitling测验 439
19.4.3 文化同质黑人智力测验 440
19.4.4 多元文化多重评估系统 441
19.5 解决建议 444
19.5.1 道德关注与测验偏向的界定 444
19.5.2 不同的思考:发现对数据的新解释 447
19.5.3 发展不同的效标 449
19.6 改变社会环境 451
19.7 小结 453
第20章 测验与法律 456
20.1 控制测验使用的法律 458
20.1.1 联邦的权利 458
20.1.2 特别法 464
20.1.3 不让一个孩子掉队 466
20.2 影响心理测验的主要诉讼案件 467
20.2.1 早期的取消种族隔离案件 467
20.2.2 高等教育中的平权法案 480
20.2.3 人事案例 483
20.2.4 与美国残疾人法案有关的案例 487
20.2.5 对条例的批判性思考 488
20.3 小结 489
第21章 心理测验的伦理及未来 490
21.1 测验领域的争议 490
21.1.1 专业争议 491
21.1.2 道德争议 494
21.1.3 社会争议 498
21.2 当前趋势 500
21.2.1 新测验的涌现 500
21.2.2 提高标准改进技术使之更加客观 501
21.2.3 更强烈的公众意识及其影响 501
21.2.4 测验的计算机化 502
21.2.5 互联网上的测验 503
21.3 未来趋势 503
21.3.1 测验领域的未来前景是大有希望的 503
21.3.2 新的、改进测验的涌现将继续下去 504
21.3.3 分歧、争论和变化将持续下去 505
21.3.4 认知科学、计算机科学的整合将导致测验领域内的几种革新 505
21.4 小结 505
附录1 标准正态分布的面积 507
附录2 α=0.05和α=0.001时积差相关系数R的临界值(双侧检验) 509
附录3 t临界值表 510
附录4 教育中公平测验应用准则 512
参考文献 517