序 1
前言 1
上篇 语言测试理论与SPSS操作 3
第一章 语言测试的性质与历史 3
1.1 语言测试的性质 3
1.2 语言测试的历史 3
第二章 语言测试的理论框架 7
2.1 信度 7
2.1.1 考试信度 9
2.1.2 评卷信度 10
2.1.3 如何提高信度 12
2.2 效度 15
2.2.1 表面效度 15
2.2.2 内容效度 16
2.2.3 结构效度 16
2.2.4 尺度关联效度 17
2.2.5 信度与效度的关系 19
2.3 真实性 20
2.4 交互性 22
2.5 后效作用 23
2.6 可操作性 24
第三章 语言测试的用途及类别 26
3.1 语言测试的用途 26
3.1.1 语言测试用于诊断及反馈 26
3.1.2 语言测试用于筛选或选拔 26
3.1.3 语言测试用于编班 26
3.1.4 语言测试用于科研或调查 27
3.2 语言测试的类别 27
3.2.1 按学习阶段分类 27
3.2.2 按考试目的分类 28
3.2.3 按考试方式分类 30
3.2.4 按考试形式分类 30
3.2.5 按对考试分数的解释分类 31
3.2.6 按试卷的评阅方式分类 32
第四章 语言测试的总体设计 34
4.1 制定考试规范 34
4.1.1 考试规范与考试大纲的区别 34
4.1.2 制定考试规范的意义 34
4.1.3 考试规范与考试效度的关系 34
4.1.4 考试规范与信度的关系 35
4.1.5 考试规范与总体设计的关系 35
4.1.6 考试规范与考试评估的关系 35
4.2 考试规范内容的制定 36
4.2.1 确定考试目的 39
4.2.2 确定考试能力范畴 40
4.2.3 确定考试对象 41
4.2.4 确定考试内容 42
4.2.5 确定考试类别 43
4.2.6 确定考试题型 44
4.2.7 确定试卷结构与分值 45
4.2.8 制定考试细目表 48
4.2.9 命题及编辑试卷 48
4.2.10 制定评分标准 49
4.2.11 保证考试实施 52
4.3 选择答题类评估方法 53
4.3.1 多项选择题 53
4.3.2 是非题 55
4.3.3 匹配题 57
4.4 非选择答题类评估方法 58
4.4.1 填充题 58
4.4.2 转换题 62
4.4.3 简答题 65
4.4.4 论述题 67
第五章 考试成绩反馈 68
5.1 分数的频数分布 68
5.2 分数频数的图形显示 69
5.3 分数的集中量 72
5.3.1 平均数 72
5.3.2 众数 73
5.3.3 中位数 73
5.3.4 平均数、众数、中位数的关系 73
5.4 分数的差异量 73
5.4.1 全距 74
5.4.2 标准差 74
5.4.3 方差 75
5.4.4 差异系数 76
5.5 正态分布 77
5.6 偏度、峰度 78
5.7 四分位数、十分位数、百分位数 79
5.8 分数的转换 80
5.8.1 原始分数 80
5.8.2 转换分数 80
5.8.3 Z分数和T分数 81
5.9 题目难易度 82
5.10 题目区分度 84
第六章 统计描述与SPSS应用 88
6.1 平均数、中位数、众数、全距、标准差、方差、百分位数、频数、峰度、偏度 88
6.1.1 SPSS中的实现过程 88
6.1.2 结果与讨论 91
6.2 四分位数 93
6.2.1 SPSS中的实现过程 93
6.2.2 结果与讨论 94
6.3 十分位数 94
6.3.1 SPSS中的实现过程 94
6.3.2 结果与讨论 96
6.4 百位分数 96
6.4.1 SPSS中的实现过程 96
6.4.2 结果与讨论 97
6.5 标准化Z分数的线性转换 97
6.5.1 SPSS中的实现过程 97
6.5.2 结果与讨论 99
6.6 标准化T分数的线性转换 99
6.6.1 SPSS中的实现过程 99
6.6.2 结果与讨论 101
第七章 信度分析与SPSS应用 102
7.1 同质性信度 102
7.1.1 SPSS中的实现过程 102
7.1.2 结果与讨论 105
7.2 分半信度 108
7.2.1 SPSS中的实现过程 109
7.2.2 结果与讨论 110
7.3 再测信度 111
7.3.1 SPSS中的实现过程 111
7.3.2 结果与讨论 112
第八章 相关分析、回归分析与SPSS应用 113
8.1 相关分析 113
8.1.1 定义 113
8.1.2 SPSS中的实现过程 114
8.2 回归分析 118
8.2.1 定义 118
8.2.2 一元线性回归分析 119
8.2.3 多元线性回归分析 131
下篇 西部英语测试实证研究——从交际法角度评估西部地区阅读测试的实用性Introduction 141
Chapter One Theoretical Concerns in Language Assessment 147
1.1 Validity 148
1.1.1 Face Validity 148
1.1.2 Content Validity 149
1.1.3 Construct Validity 150
1.1.4 Criterion-related Validity 150
1.2 Reliability 151
1.2.1 Test Reliability&Scorer Reliability 152
1.2.2 Enhance the Reliability 153
1.3 Authenticity 154
1.4 lnteractiveness 155
1.5 lmpact 155
1.6 Practicality 156
1.7 Relationship between the Qualities 157
1.7.1 Reliability&Validity 157
1.7.2 Authenticity,Interactiveness,and Validity 158
1.7.3 Practicality&Other Qualities 158
Chapter Summary 159
Chapter Two Theoretical Framework of Reading Tests 160
2.1 The Nature of Reading 160
2.1.1 The Role of Reading in Society 160
2.1.2 The Definition of Reading 161
2.2 Assessment of Reading Ability 164
2.2.1 Reading Skills 165
2.2.2 Reading Tasks 165
Chapter Summary 171
Chapter Three Description of the Study 173
3.1 Background to the Test 173
3.2 Features of the Test Takers 174
3.2.1 Personal Features 174
3.2.2 Topical Knowledge 175
3.2.3 Levels and Profiles of Language Knowledge 175
3.3 Features of the Reading Program 175
3.3.1 Teaching Syllabus 175
3.3.2 Time Consumed 177
3.3.3 Teaching Materials 177
3.3.4 Classroom Activities 178
3.3.5 Exercise Formats 180
3.4 Features of the Test 180
3.5 Purpose of the Study 182
Chapter Four Results of the Study 183
4.1 The Overall Picture of the Reading Test 183
4.1.1 Distribution of the Total Scores 183
4.1.2 Central Tendency and Dispersion 184
4.1.3 Conclusion 186
4.2 Reliability 186
4.2.1 Item Difficulty and Discriminability 187
4.2.2 Reliability Coefficient 189
4.2.3 Conclusion 190
4.3 Content Validity 191
4.3.1 Content Relevance 191
4.3.2 Content Coverage 191
4.3.3 Conclusion 193
4.4 Authenticity 193
4.4.1 Test Materials 193
4.4.2 Reading Activities and Test Formats 195
4.4.3 Conclusion 195
4.5 lnteractiveness 196
4.5.1 Topical Knowledge vs.Test Tasks 196
4.5.2 Reading Ability vs.Test Tasks 196
4.5.3 Conclusion 196
4.6 lmpact 197
4.6.1 Impact on Students 197
4.6.2 Impact on Teachers 198
4.6.3 Conclusion 198
Chapter Five Recommendations 200
Chapter Six Conclusion 204
Appendix Ⅰ 207
Appendix Ⅱ 208
Appendix Ⅲ 217
参考文献 218