引言 1
0.1 时空数据的特点 1
0.2 基于栅格的数据分析及发掘流程 2
0.3 涉及的关键技术 4
0.3.1 空间统计分析技术 4
0.3.2 数据挖掘技术 5
0.3.3 空间数据挖掘技术 6
0.3.4 基于贝叶斯网络的学习及概率推理技术 7
0.4 案例 7
0.5 本书组织结构 8
参考文献 10
第一篇 理论方法 15
第1章 数据来源及预处理 15
1.1 多源异构的数据来源 15
1.1.1 按照存储格式划分 15
1.1.2 按照来源划分 15
1.1.3 按照类型划分 16
1.1.4 矢量数据转换成栅格数据以及栅格数据的重采样 16
1.2 数据预处理 18
1.2.1 插值数据分析 18
1.2.2 缺值数据分析 20
1.2.3 正则化(数据过滤) 22
1.2.4 孤立点及噪点分析 25
1.2.5 数据转换 26
1.2.6 多重共线性分析 30
1.2.7 特征选择 32
1.2.8 模型组合 36
参考文献 37
第2章 相关性分析 40
2.1 普通的相关性分析 40
2.1.1 Pearson相关系数探索连续变量相关性 40
2.1.2 Spearman及Kendall’s tau-b相关系数探索离散变量关联性 40
2.1.3 散点图分析 40
2.1.4 条件直方图分析 41
2.1.5 三维插值曲面图分析 41
2.2 空间自相关及聚集性 42
2.2.1 空间自相关性 42
2.2.2 空间自相关的计算及(空间聚集性)解译 43
2.2.3 空间自相关图 47
2.3 空间变异性 48
2.3.1 基本原理 48
2.3.2 变异函数的定义及解译 48
2.4 时间序列相关性 51
2.4.1 自相关函数和偏自相关函数 51
2.4.2 ARMA模型的自相关分析 52
参考文献 53
第3章 关联规则发现 54
3.1 普通的关联规则发现 54
3.1.1 Apriori算法 54
3.1.2 FP-Growth算法 55
3.2 空间上的关联规则 56
3.2.1 空间关联规则 57
3.2.2 空间同位规则 57
3.3 时空上的关联性 59
3.3.1 区内非序列关联模式 60
3.3.2 区内序列关联模式 61
3.3.3 区之间非序列/序列关联模式 62
3.4 案例 62
参考文献 66
第4章 监督学习提取知识及预测 68
4.1 基于规则的学习方法 68
4.1.1 决策树学习器 68
4.1.2 粗糙集学习器 74
4.2 基于空间回归的学习及预测 81
4.2.1 点数据回归 81
4.2.2 格数据回归 84
4.2.3 案例 87
参考文献 88
第5章 非监督学习识别空间异构模式 90
5.1 距离测量 90
5.1.1 不同的数据类型 90
5.1.2 样点之间距离的定义 91
5.1.3 样点之间相似系数的定义 93
5.1.4 指标(因变量)分类的常用距离和相似系数 95
5.2 聚类的过程及常规方法 97
5.2.1 聚类前的数据标准化(正则化) 97
5.2.2 类间与距离与系统聚类方法 98
5.2.3 K-均值聚类算法 102
5.2.4 ISODATA算法 103
5.2.5 ISODATA算法的改进 105
5.3 SOM神经网络聚集分析 105
5.3.1 算法基础 106
5.3.2 基本概念 106
5.3.3 算法步骤 108
5.3.4 SOM神经网络的优缺点 108
5.3.5 使用SOM神经网络进行聚类 108
5.4 共享最近邻聚类 109
5.4.1 算法基础 110
5.4.2 基本概念 114
5.4.3 算法步骤 115
5.4.4 共享最近邻算法的特点 116
5.5 聚类方法的比较 117
5.6 融合空间相关性因子的聚类 119
5.7 从聚类到模式识别规则的学习:识别空间异构 119
参考文献 122
第6章 融合多源数据的贝叶斯网络 125
6.1 贝叶斯网络介绍 125
6.1.1 发展历史 126
6.1.2 基本概念 126
6.1.3 特性 129
6.2 学习贝叶斯网络 129
6.2.1 结构学习 130
6.2.2 参数的学习 134
6.3 不确定性推理:信息传播 137
6.3.1 精确推理 138
6.3.2 近似推理 141
6.4 案例 142
参考文献 143
第7章 有效性验证及学习的强化 144
7.1 有效性验证 144
7.1.1 模糊矩阵及相关度量 144
7.1.2 ROC图 146
7.1.3 统计有效性 149
7.1.4 非监督学习的有效性验证 150
7.2 交叉验证及元学习 151
7.2.1 交叉验证 151
7.2.2 元学习 151
参考文献 156
第8章 空间统计并行计算框架 157
8.1 设计背景 157
8.2 主要内容 158
8.3 实施步骤 158
8.3.1 公共算子提取 158
8.3.2 公共算子并行策略设计 161
8.3.3 公共算子并行实现 165
8.3.4 公共算子调用 167
8.3.5 公共算子组合 168
8.4 案例 169
参考文献 171
第二篇 软件工具 175
第9章 空间数据分析工具 175
9.1 空间数据分析 175
9.2 GeoDa 176
9.2.1 GeoDa主要功能 176
9.2.2 GeoDa应用实例 177
9.3 STARS 179
9.3.1 STARS主要功能 179
9.3.2 STARS应用实例 180
9.4 ArcGIS 181
9.4.1 ArcGIS主要功能 181
9.4.2 ArcGIS应用实例 182
9.5 R 184
9.5.1 R空间分析功能介绍 184
9.5.2 R空间分析实例 185
9.6 CrimeStat 187
9.6.1 CrimeStat主要功能 187
9.6.2 CrimeStat应用实例 189
9.7 WinBUGS 190
9.7.1 WinBUGS主要功能 190
9.7.2 WinBUGS应用实例 190
参考文献 193
第10章 贝叶斯辅助决策支持工具包 194
10.1 软件介绍 194
10.2 时空数据的输入与数据预处理 195
10.2.1 时空数据的输入 195
10.2.2 数据预处理 196
10.3 贝叶斯辅助决策支持工具包的建模工具 198
10.3.1 DAG建模方法 198
10.3.2 时空DAG建模方法 202
10.3.3 不确定性建模方法 206
10.4 空间最近邻非监督及关联规则学习 208
10.4.1 空间共享最近邻学习 209
10.4.2 关联规则的发现 210
10.5 建模结果的输出 211
第11章 空间统计并行计算实施 212
11.1 贝叶斯分类器 212
11.2 贝叶斯分类器的并行化 212
11.2.1 离散化 213
11.2.2 网络结构的学习 214
11.2.3 网络参数的学习 216
11.2.4 网络的推断 219
11.3 测试案例 220
11.3.1 案例一 220
11.3.2 案例二 222
参考文献 224
第三篇 综合运用 227
第12章 非监督学习提高耕地调查效率 227
12.1 简介 227
12.2 研究区域及目标 229
12.3 相似性分类器 231
12.3.1 多维栅格格式的数据集 231
12.3.2 相似性的学习及分类 232
12.3.3 评估 238
12.4 分层及估计 239
12.4.1 分区效果 239
12.4.2 结果 241
12.5 小结 245
参考文献 246
第13章 监督学习监测洪水灾害损失 249
13.1 基本原理 249
13.2 洪水风险评估 251
13.2.1 运用核密度函数进行数据预处理 252
13.2.2 定量因素的最优离散化 253
13.2.3 特征选择 254
13.2.4 模型构建及参数估计 254
13.2.5 洪水灾害风险的鲁棒性预测 255
13.3 评价 256
13.3.1 相比较的方法 256
13.3.2 性能指标 256
13.4 实验结论 257
13.4.1 局部网络拓扑结构 257
13.4.2 运用交叉验证的性能比较 258
13.4.3 预测的性能比较 258
参考文献 260
第14章 基于贝叶斯网络的灾害易损性分析及保险定价 262
14.1 基于贝叶斯网络的易损性分析 262
14.1.1 包含的指标 262
14.1.2 空间分析技术 263
14.1.3 贝叶斯网络模拟结构 264
14.1.4 易损性评估 266
14.1.5 保险定价 267
14.1.6 不确定性和敏感性分析 268
14.2 案例研究:地震灾害评估及保险定价 269
14.2.1 研究地区和目标 269
14.2.2 数据集 270
14.2.3 危害分析 272
14.2.4 易损性建模和保险定价 273
14.2.5 不确定性和敏感性分析 277
14.3 讨论 278
参考文献 280
第15章 台风灾害及海啸风险评价 283
15.1 简介 284
15.2 探索气候或生态因素变化与灾害事件之间的时空关系 285
15.2.1 基本原理 285
15.2.2 聚类技术探索相关变量的时间序列模式 286
15.2.3 通过关联规则发现及粗糙集发现相关性 288
15.3 易损性分析 290
15.3.1 关于易损性分析 290
15.3.2 不同的财产或者人的易损性 290
15.3.3 因子的相关性分析 292
15.3.4 易损性时空分布模式分析 292
15.3.5 通过优化技术降低风险及易损性 296
15.4 动态风险及易损性分析 303
15.4.1 贝叶斯网络预测风险及易损性 304
15.4.2 从栅格多维时空数据中学习优化的贝叶斯网络 304
15.4.3 不确定性证据推理 305
15.4.4 风险/易损性水平的不确定性动态推理 305
15.5 总结 308
15.5.1 时空数据挖掘方法探求气候/生态因素变化对我国灾害的影响 308
15.5.2 灾害影响因子的重要性检验及因果关系的建立 308
15.5.3 融合多源信息的信任网进行灾害监测 309
15.5.4 情景模拟的辅助预警 309
参考文献 309