第1章 概述 1
1.1 简史及现状 1
1.1.1 历史 1
1.1.2 目前的实践 2
1.2 预报检验的原因和作用 3
1.3 预报和检验数据的类型 5
1.4 评分、技巧和价值 6
1.4.1 技巧评分 6
1.4.2 虚假技巧 7
1.4.3 统计显著性 8
1.4.4 附加价值 8
1.5 数据质量及其他实际问题 8
1.6 小结 9
第2章 基本概念 10
2.1 引言 10
2.2 预报量的类型 10
2.3 探索法 11
2.4 数值描述性的检验度量 17
2.5 概率、随机变量和期望 19
2.6 联合、边际和条件分布 19
2.7 准确性、相关和技巧 21
2.8 检验方法的属性 21
2.9 把检验作为一个回归问题 22
2.10 Murphy-Winkler框架 24
2.11 检验问题的维度 28
第3章 二元事件的确定性预报 29
3.1 引言 29
3.2 理论上的考量 31
3.2.1 一些基本的描述性统计量 31
3.2.2 检验的总体框架:分布导向方法 32
3.2.3 基于联合分布因式分解的性能指标 34
3.2.4 可视化的性能指标图解 35
3.2.5 个例研究:云量预报的检验 37
3.3 信号探测理论和相对作用特征 39
3.3.1 信号探测模型 39
3.3.2 相对作用特征 41
3.4 元检验:性能指标的评估标准 42
3.4.1 理想属性 42
3.4.2 其他属性 45
3.5 性能指标 46
3.5.1 性能指标综述 47
3.5.2 性能指标的抽样不确定性和置信区间 51
3.5.3 最优阈值概率 53
致谢 54
第4章 多分类事件的确定性预报 55
4.1 引言 55
4.2 列联表:准确性的符号、定义和指标 56
4.2.1 符号与定义 56
4.2.2 准确性指标 57
4.3 技巧评分 58
4.3.1 理想属性 58
4.3.2 Gandin和Murphy公平评分体系 60
4.3.3 Gerrity公平评分体系 64
4.3.4 LEPSCAT评分体系 65
4.3.5 概率空间的稳定公平误差 66
4.3.6 有关评分的总结性评价 67
4.4 列联表和技巧评分的抽样多变性 68
第5章 连续变量的确定性预报 71
5.1 引言 71
5.2 预报实例 71
5.3 一阶矩 73
5.3.1 偏差 73
5.3.2 平均绝对误差 74
5.3.3 偏差订正和虚假技巧 74
5.3.4 平均绝对误差和技巧 75
5.4 二阶矩和高阶矩 75
5.4.1 均方差 75
5.4.2 MSE技巧评分 76
5.4.3 降尺度预报的均方差 77
5.4.4 相关 77
5.4.5 一个例子:“可预报性极限”的检验 80
5.4.6 秩相关(等级相关) 80
5.4.7 边缘分布的阶矩比较 81
5.4.8 总结性图解 83
5.5 基于累积频率的评分 84
5.5.1 概率空间的线性误差 84
5.5.2 分位数图 85
5.5.3 条件分位数图 85
5.6 小结 86
第6章 空间场预报 88
6.1 引言 88
6.2 匹配方法 89
6.3 传统检验方法 90
6.3.1 标准的连续型和分类型方法 90
6.3.2 S1评分法和距平相关法 91
6.3.3 分布式方法 92
6.4 使用替代方法的动机 93
6.5 邻域方法 95
6.5.1 预报邻域与观测邻域的比较 96
6.5.2 空间预报结果与点观测结果的比较 97
6.6 尺度分离法 98
6.7 基于特征的方法 100
6.7.1 特征匹配技术 100
6.7.2 结构—振幅—位置法 101
6.8 变形场法 103
6.8.1 位置度量指标 103
6.8.2 变形场 104
6.9 各种方法的比较 106
6.10 新方法及新应用:今后的研究方向 107
6.11 小结 108
第7章 概率预报 110
7.1 引言 110
7.2 概率论 110
7.2.1 概率论的基本概念 110
7.2.2 概率预报、可靠性和充分性 112
7.3 概率评分规则 113
7.3.1 评分规则的定义和属性 113
7.3.2 常用评分规则 114
7.3.3 评分规则分解 116
7.4 相对作用特征 117
7.5 概率预报系统的评估 118
7.5.1 三个示例 119
7.5.2 经验ROC 120
7.5.3 性能指标的经验评分 121
7.5.4 经验评分分解 122
7.5.5 分级预报和留一法误差 123
7.6 检验可靠性 124
7.6.1 预报A的可靠性分析:可靠性图解 125
7.6.2 预报B的可靠性分析:x2检验 126
7.6.3 预报C的可靠性分析:PIT 128
致谢 129
第8章 集合预报 130
8.1 引言 130
8.2 示例数据 131
8.3 离散样本的集合 132
8.3.1 集合预报的可靠性 133
8.3.2 多维可靠性 139
8.3.3 区分度 144
8.4 概率预报的集合 145
8.4.1 集合的概率解释 146
8.4.2 概率技巧算法在集合中的应用 147
8.4.3 集合大小对技巧的影响 149
8.5 小结 152
致谢 152
第9章 经济价值和技巧 153
9.1 引言 153
9.2 花费—损失比决策模型 154
9.2.1 确定性二元预报系统的价值 155
9.2.2 概率预报 158
9.2.3 确定性二元预报和概率二元预报的对比 159
9.3 价值与相对作用特征的关系 161
9.4 总价值与Brier技巧评分 164
9.5 技巧、价值和集合规模 165
9.6 应用:价值和预报用户 168
9.7 小结 169
第10章 极端事件的确定性预报及警报 171
10.1 引言 171
10.2 极端事件预报 171
10.2.1 挑战 171
10.2.2 前期研究 174
10.2.3 极端事件的检验指标 175
10.2.4 极端事件模式性能 177
10.2.5 极端事件:小结 180
10.3 预警 181
10.3.1 背景 181
10.3.2 预警形式和观测检验 181
10.3.3 预警检验 182
10.3.4 预警:小结 185
致谢 185
第11章 季节和更长期预测 186
11.1 引言 186
11.2 预测形式 187
11.2.1 确定性的和概率的形式 187
11.2.2 预测量的定义 188
11.2.3 气候预测的含义 189
11.3 预测质量的评估 189
11.3.1 技巧 189
11.3.2 其他特性 196
11.3.3 统计显著性和不确定性评估 198
11.4 单个预测量质量的衡量 198
11.5 年代际和更长期预测的检验 199
11.6 小结 201
第12章 结束语——预报检验的新领域(方向) 202
12.1 引言 202
12.2 关键概念的回顾 202
12.3 其他领域的预报评估 203
12.3.1 统计学 204
12.3.2 金融和经济 205
12.3.3 医学和临床研究 207
12.4 当前的研究和未来的方向 208
致谢 210
附录 检验软件 211
A.1 理想软件应具备的特点 211
A.1.1 正确性 211
A.1.2 文档 212
A.1.3 开源、不开源、商业 212
A.1.4 大用户群 212
A.2 检验用户类型 212
A.2.1 学生 212
A.2.2 研究人员 213
A.2.3 业务预报员 213
A.2.4 研究机构 213
A.3 检验软件和编程语言的类型 213
A.3.1 电子表格 214
A.3.2 统计编程语言 215
A.4 机构支持的软件 217
A.4.1 模式评估工具(MET) 218
A.4.2 集合预报检验系统(EVS) 218
A.4.3 EUMETCAL预报检验培训模块 218
A.5 检验信息展示 219
A.5.1 国家天气服务的性能管理 219
A.5.2 预报评估工具 219
词汇表 220
参考文献 228
索引 249