《教育评价教育和心理学中的测量与评估第8版》PDF下载

购买积分：16 如何计算积分？
作　　者：（美）罗伯特·M.桑代克，（美）特雷西·桑代克-克莱斯特著
出版社：北京：商务印书馆
出版年份：2018
ISBN：9787100158824
页数：530 页

图书介绍：本书是教育学和心理学测试领域的经典概论性著作，为此领域未来的专业人员提供了他们所需的所有相关信息，以便提高其智慧地使用测试信息的技能。本书融合同时适用于教育测试和心理测试的标准测试理念，以深入浅出、简明易懂的方式探讨了测试中的核心问题。为使学生成为独立的测试信息使用者，本书描述了测试中可能出现的问题，阐释了这些问题的解决途径和方法。

点击购买此书全本PDF电子书

第一部分技术问题 3

第一章测量中的基本问题 3

一、引言 3

二、历史简介 4

1．早期阶段 5

2．繁荣阶段 6

3．第一批判阶段 7

4．测试组合阶段 7

5．第二批判阶段 8

6．问责制时期 8

三、决定的类型 9

四、测试与决定 10

做决定过程中的价值取向 11

五、测量程序的具体步骤 13

1．特征识别与定性 13

2．确定隔离和表现特征的操作程序 15

3．属性的量化 16

4．测量过程中的问题 18

六、一些测量中的当前问题 19

1．少数族裔个体测试 20

2．侵犯隐私 21

3．使用常模对照组 22

4．影响测试分数的其他因素 23

5．受试者的权利和责任 23

总结 24

习题 24

推荐阅读 26

第二章测量与数字 28

一、如何理解测试分数 28

二、测量量表 31

三、频率分布表的准备 33

1．分组频率分布 34

2．累积频率分布 39

3．图示法 40

四、集中趋势测量 43

1．众数 43

2．中值 44

3．百分位数值 46

4．算术平均值 47

5．集中趋势与分布形态 49

五、差异性测量 51

1．全距 51

2．半四分位数间全距 51

3．标准差 52

六、标准差分析 55

七、个体分数分析 57

八、相关性测试 58

九、预测结果 64

确定回归线 66

总结 69

习题 70

推荐阅读 72

第三章赋予分数意义 73

一、分数的本质 73

1．参照系 74

2．标准参照测试和常模参照测试的领域 76

二、标准参照评估 77

三、常模参照评估 80

1．年级常模 82

2．年龄常模 86

3．百分位数常模 88

4．标准分数常模 94

5．转换的正态分布 99

6．九分评分制 101

四、不同类型常模的互换性 103

五、商数 106

六、分数组合 107

七、标准参照分析报告 112

八、学校平均水平常模 115

九、常模使用注意事项 116

十、第三参照系：项目反应理论 119

总结 126

习题 127

推荐阅读 128

第四章测量程序应有特性：信度 130

一、引言 130

二、信度和一致性 131

不一致性的来源 132

三、表示信度的两种方法 133

1．标准测量误差 133

2．信度系数 134

四、评估信度的方法 135

1．同材料重复测试 135

2．平行测试形式 137

3．单次测量方法 138

4．方法对比 144

五、信度数据分析 145

1．标准测量误差 145

2．信度系数 147

六、影响信度的因素 148

1．测量对象的差异性 149

2．测量对象的特征等级 149

3．测试长度 151

4．评估信度的方法 152

5．实际信度和理论信度 153

七、最低信度 154

八、差异分的信度 156

九、不可靠性对变量之间相关系数的影响 159

十、标准参照测试的信度 160

十一、计算机自适应测试的信度 165

总结 169

习题 170

推荐阅读 171

第五章测量程序应有特性：效度 172

一、引言 172

二、内容相关效度证据 173

1．设计命题蓝图 174

2．测量能力倾向与典型表现的内容效度 181

三、标准相关效度证据 182

1．表面效度 182

2．实证效度 182

四、建构相关的效度证据 194

1．相关性的预测 195

2．对群体差异的预测 197

3．对有关实验或干预反应的预测 197

五、效度的统一定义 198

1．效度验证作为一项科学追求 199

2．作为整体效度的建构效度 200

3．梅西克的扩大效度理论 204

4．对梅西克思想的修正及关注点的变化 208

六、效度理论和测试偏见 210

七、信度和效度的重合 211

八、标准参照测试的效度 212

九、元分析和效度的泛化 213

总结 214

习题 214

推荐阅读 215

第六章测试的实际应用问题 217

一、例行测试的使用中与实际应用相关的一些因素 217

1．经济性 217

2．有助测试实施的因素 219

3．有助解读和应用测试分数的因素 220

4．电子化测试 222

二、测试评估指南 223

1．基本信息 224

2．关于测试的信息 224

3．解析测试结果的辅助方法 224

4．效度 224

5．信度 225

6．测试的实施与评分 225

7．量表和常模 226

三、了解具体的测试 226

1．现存测试有哪些？ 227

2．X测试到底是什么样的？ 229

3．评审们如何评价X测试？ 230

4．前人对X测试做过哪些研究？ 232

总结 234

习题 234

测试信息参考资料 235

第二部分测试的应用 241

第七章教育决策与评估 241

一、引言 241

二、价值观和决策 241

三、《有教无类法案》 242

1．《有教无类法案》总览 242

2．标准和评估 244

3．问责制 245

四、人员安置决策 246

1．残障学生的主流化问题 247

2．人员安排决定是如何做出的 248

五、课堂教学决策 249

1．使用教学目标 250

2．评估方法的类型 250

六、日常教学决策 253

七、汇报学业进展 254

1．相对于完美水平的表现 255

2．相对于同等水平的表现 255

3．相对于潜能水平的表现 256

4．评定成绩 257

5．成绩的重要性 257

八、影响未来教育的决策 258

1．选拔性决策 259

2．高风险决策 260

九、其他教育决策 262

1．有关课程设计的决策 262

2．公共决策和政治决策 263

总结 264

习题 264

推荐阅读 265

第八章评估特殊人群：心理测量、法律及道德问题 267

一、引言 267

二、重大立法与诉讼概览 268

1．影响重大的立法 268

2．影响重大的诉讼 269

三、特殊教育评估过程 270

项目实施和评估程序的移交 270

1．识别和移交 271

2．资格认定 271

3．项目计划、实施和评估 272

四、特殊教育评估涉及的主要领域 273

1．智力和认知能力 273

2．适应性行为和自理能力 274

3．行为和社会-情感能力 275

4．神经心理能力 276

五、评估母语为非英语者 277

1．简介 277

2．语言水平评估 278

3．对母语为非英语者进行学业能力评估 279

4．对母语为非英语者进行特殊教育评估 280

六、传统学业能力 280

1．阅读、数学和书面语评估 280

2．课程评估 282

3．生态评估 283

七、专业标准和道德规范 284

简介 284

八、专业训练和专业能力 285

1．专业训练 285

2．专业能力 286

九、专业责任和科学责任 286

教育测试与心理测试的标准 286

1．测试结构、评估和记录 287

2．测试和公平 287

3．测试应用 288

十、尊重他人的权利和尊严 288

隐私和保密 288

1．谁会从收集到的信息中获益？ 288

2．怎么使用这些信息？ 289

十一、社会责任 289

1．公平分配 290

2．测试的社会效益 290

3．积极影响的最大化 291

总结 293

习题 294

推荐阅读 294

第九章测试开发原则 296

一、引言 296

二、编写客观题的一些建议 296

1．客观题的一般原则 296

2．编写判断正误题 300

3．编写多项选择题 305

4．编写匹配题 318

三、编制可用的客观测试 320

四、客观测试的评分 323

1．猜题校正 323

五、利用试题分析改进客观测试 325

1．简化的试题分析程序 326

2．更多正式试题分析程序 328

六、编写论述题 331

1．编写论述问题 332

2．设计论述题测试 334

3．论述题的评分 335

总结 336

习题 337

推荐阅读 338

第十章表现评估和作品评估 340

一、引言 340

二、传统认知测试的人为因素 340

三、作品评估 341

四、在认知任务中运用表现评估和作品评估 342

表现评估的评分 343

五、过程评估 345

1．使用检查表 345

2．使用定级量表 346

六、评估作品及表现 347

1．多位观测者的优点 348

2．多位观测者的可靠性或一致性 348

七、系统观测 350

1．进行系统观测 351

2．系统观测的优缺点 354

总结 357

习题 357

推荐阅读 358

第十一章态度及定级量表 359

一、引言 359

二、从他人处了解某人性格 359

1．推荐信 360

2．定级量表 362

3．得出合理定级时存在的问题 363

4．提高评分效率 370

5．提高评分准确度 376

6．用于特殊情况的评分程序 380

三、态度测量 383

1．累加态度评估量表 385

2．单项目量表 387

3．态度评估量表示例 387

4．其他格式 390

总结 393

习题 394

推荐阅读 395

第十二章能力倾向测试 397

一、引言 397

二、认知能力理论 397

1．比奈理论 398

2．斯皮尔曼的g理论 399

3．瑟斯通的基本心理能力理论 399

4．延森理论和韦氏理论 400

5．卡特尔-霍恩的流动-固定智力理论 402

6．卡罗尔的三阶层理论 403

7．斯滕伯格的智力三元理论 403

8．戴斯-那列里的PASS模型 404

9．加德纳的提议 405

三、个人一般能力测试 406

1．斯坦福-比奈智力量表第四版 406

2．斯坦福-比奈智力量表第五版 410

3．韦氏量表 414

4．伍德科克-约翰逊心理-教育测试组合第三版 417

5．戴斯-纳列里认知评估系统 419

6．认知能力的非语言性测量 420

7．简易个人测试 423

四、群组一般能力测试 425

五、多能力测试 430

1．差别能力倾向测试组合 431

2．一般能力倾向测试组合 433

六、一般认知能力的作用：《钟形曲线》 436

总结 441

习题 441

推荐阅读 443

第十三章标准化成绩测试 446

一、引言 446

二、标准化成绩测试的特点 446

三、标准化成绩测试的用途 447

四、标准化成绩测试的类别 448

五、群组标准化成绩测试 449

六、个人成绩测试 451

七、中学及大学水平成绩测试 453

八、全国范围内实施成绩测试组合的问题——“乌比冈湖效应” 456

九、解析标准化成绩测试 459

十、诊断型成绩测试 460

十一、标准参照的标准化成绩测试 462

1．标准参照的标准化成绩测试案例 462

2．标准参照的标准化成绩测试存在的问题 463

总结 464

习题 464

推荐阅读 465

第十四章兴趣、性格和调整能力 466

一、引言 466

二、兴趣测量 467

1．斯特朗兴趣量表 467

2．职业评估量表 477

3．自我探索量表 478

三、性格和调整能力评估 479

1．动态评估法 480

2．特质研究法 483

3．人本主义研究法：性格与自我认知 492

4．行为研究法 494

四、性格和兴趣测量存在的问题 500

五、计算机评分与解析 502

优点 502

缺点 503

总结 503

习题 503

推荐阅读 504

附录正态曲线中低于设定值的测试对象所占比例 506

参考文献 508