第1章 问题的提出与研究方法 1
1.1 研究缘起 1
1.2 研究思路与方法 4
第2章 数学学业成就评价研究综述 6
2.1 数学学业成就评价 6
2.2 发展性学生评价 8
2.3 基础教育质量监测 11
2.3.1 基础教育质量监测的目标与对象 12
2.3.2 基础教育质量监测的学业评价体系 13
2.3.3 基础教育质量监测实施制度和政策 15
2.4 国内数学学业成就评价研究概述 17
2.5 国外数学学业成就评价研究概述 20
2.5.1 美国基础教育学业评价体系 21
2.5.2 国际学生评价项目 26
2.5.3 TIMSS评价体系 27
2.5.4 英国的国家课程测试 28
2.5.5 澳大利亚国家评价计划 30
第3章 研究的理论基础 32
3.1 试题编制的教育评价学基础 32
3.1.1 现代教育评价理论的发展 32
3.1.2 现代教育评价的主要模式 33
3.2 试题编制的教育测量学基础 35
3.2.1 教育测量的经典测量理论方法 35
3.2.2 教育测量的项目反应理论模型 42
第4章 数学学业成就评价试题编制的基本问题 47
4.1 数学学业成就的评价标准 47
4.1.1 课程标准与教材分析 47
4.1.2 内容标准 56
4.1.3 表现标准 61
4.1.4 评价标准 65
4.2 试题编制的量纲指标体系 70
4.2.1 试题编制范畴 70
4.2.2 试题编制双向细目表 71
4.3 试题编制结构 73
4.3.1 试题编制的题型结构 73
4.3.2 试题编制的长度结构 74
4.3.3 试题编制的组成结构 75
4.4 抽样实验 77
第5章 试题编制检验的多级评分原理与参数分析 78
5.1 测验项目的评分要素 78
5.1.1 测验项目的基本概念 78
5.1.2 测验项目的样本空间 79
5.1.3 二级与多级评分项目 83
5.2 测验项目的概率函数 84
5.2.1 节点呈包含关系的测验项目的概率函数 84
5.2.2 节点呈相互独立关系的测验项目的概率函数 85
5.2.3 二参数逻辑斯谛模型下测验项目的概率函数 86
5.3 能力参数估计 87
5.3.1 能力参数 87
5.3.2 能力参数已知情况下的项目参数估计 88
5.3.3 项目参数已知情况下的能力参数估计 89
5.4 测验项目信息函数与测验信息函数 90
5.4.1 测验项目信息函数 90
5.4.2 测验信息函数 91
5.5 最优评分权 92
5.6 测验的有效性检验方法 94
第6章 试题编制检验的抽样实验与分析 96
6.1 实验设计 96
6.1.1 样本取样 96
6.1.2 测试工具 96
6.1.3 研究假设 97
6.2 数据处理与分析 97
6.2.1 存储数据文件 97
6.2.2 经典测量理论下的项目参数分析 98
6.2.3 项目反应理论下的项目参数分析 101
6.3 试题编制的素质教育功能分析 153
6.3.1 试题编制以数学素质教育为总体目标 153
6.3.2 试题编制体现课程标准“三维目标”要求 156
6.3.3 试题编制凸显评价的多种教育功能 157
第7章 结论与建议 159
7.1 研究结论 159
7.1.1 试题编制在CTT下的各项指标具有良好的可信度 159
7.1.2 试题编制在IRT下的各项参数反映较大的信息量 160
7.1.3 试题编制测验的有效性和显著性检验 162
7.2 研究不足 166
7.2.1 试题编制理论研究的局限性 166
7.2.2 推论范围有限 166
7.3 研究建议 166
7.3.1 数学素质教育是监测的基本目标 166
7.3.2 建立完整的数学学业水平监测系统 167
7.3.3 优化数学学业水平评价方案 167
7.3.4 推行基于IRT的数学学业水平评价实践 168
附录1数学学业成就评价测查试题 169
附录2存储数据文件(dwj.dat) 174
附录3数学学业成就评价关键环境变量调查问卷 195
参考文献 198
后记 202