《地理间空数据挖掘》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:李连发,王劲峰等著
  • 出 版 社:北京:科学出版社
  • 出版年份:2014
  • ISBN:9787030412270
  • 页数:320 页
图书介绍:本书主要针对地理空间数据及其时间序列,系统总结主要地理空间数据分析及挖掘方法,探索其在抽样调查、自然灾害及系统风险分析等方面的应用及辅助决策功能。本书将分方法、工具及应用三部分。(1)方法部分探讨采用经典数据挖掘来处理空间数据,在经典数据挖掘方法的基础上融入空间因子;考虑到空间数据具有空间关联性即空间变异性的特点,经典的方法不一定适合处理空间数据,本部分也系统总结不同于经典方法的空间数据挖掘方法;探讨如何在GIS的环境中建立基于时空数据挖掘方法的辅助决策支持模型。(2)工具部分总结了主要的空间数据分析及数据挖掘软件,重点探讨在地理信息系统支持下如何实现时空数据挖掘的算法,如何集成多个系统组件形成有机的系统,以达到辅助决策的功能。(3)应用部分则重点介绍了时空数据挖掘在资源环境调查、自然灾害风险分析、系统风险识别等方面的运用,展现了其所起的解决实际问题的作用及辅助决策功能。

引言 1

0.1 时空数据的特点 1

0.2 基于栅格的数据分析及发掘流程 2

0.3 涉及的关键技术 4

0.3.1 空间统计分析技术 4

0.3.2 数据挖掘技术 5

0.3.3 空间数据挖掘技术 6

0.3.4 基于贝叶斯网络的学习及概率推理技术 7

0.4 案例 7

0.5 本书组织结构 8

参考文献 10

第一篇 理论方法 15

第1章 数据来源及预处理 15

1.1 多源异构的数据来源 15

1.1.1 按照存储格式划分 15

1.1.2 按照来源划分 15

1.1.3 按照类型划分 16

1.1.4 矢量数据转换成栅格数据以及栅格数据的重采样 16

1.2 数据预处理 18

1.2.1 插值数据分析 18

1.2.2 缺值数据分析 20

1.2.3 正则化(数据过滤) 22

1.2.4 孤立点及噪点分析 25

1.2.5 数据转换 26

1.2.6 多重共线性分析 30

1.2.7 特征选择 32

1.2.8 模型组合 36

参考文献 37

第2章 相关性分析 40

2.1 普通的相关性分析 40

2.1.1 Pearson相关系数探索连续变量相关性 40

2.1.2 Spearman及Kendall’s tau-b相关系数探索离散变量关联性 40

2.1.3 散点图分析 40

2.1.4 条件直方图分析 41

2.1.5 三维插值曲面图分析 41

2.2 空间自相关及聚集性 42

2.2.1 空间自相关性 42

2.2.2 空间自相关的计算及(空间聚集性)解译 43

2.2.3 空间自相关图 47

2.3 空间变异性 48

2.3.1 基本原理 48

2.3.2 变异函数的定义及解译 48

2.4 时间序列相关性 51

2.4.1 自相关函数和偏自相关函数 51

2.4.2 ARMA模型的自相关分析 52

参考文献 53

第3章 关联规则发现 54

3.1 普通的关联规则发现 54

3.1.1 Apriori算法 54

3.1.2 FP-Growth算法 55

3.2 空间上的关联规则 56

3.2.1 空间关联规则 57

3.2.2 空间同位规则 57

3.3 时空上的关联性 59

3.3.1 区内非序列关联模式 60

3.3.2 区内序列关联模式 61

3.3.3 区之间非序列/序列关联模式 62

3.4 案例 62

参考文献 66

第4章 监督学习提取知识及预测 68

4.1 基于规则的学习方法 68

4.1.1 决策树学习器 68

4.1.2 粗糙集学习器 74

4.2 基于空间回归的学习及预测 81

4.2.1 点数据回归 81

4.2.2 格数据回归 84

4.2.3 案例 87

参考文献 88

第5章 非监督学习识别空间异构模式 90

5.1 距离测量 90

5.1.1 不同的数据类型 90

5.1.2 样点之间距离的定义 91

5.1.3 样点之间相似系数的定义 93

5.1.4 指标(因变量)分类的常用距离和相似系数 95

5.2 聚类的过程及常规方法 97

5.2.1 聚类前的数据标准化(正则化) 97

5.2.2 类间与距离与系统聚类方法 98

5.2.3 K-均值聚类算法 102

5.2.4 ISODATA算法 103

5.2.5 ISODATA算法的改进 105

5.3 SOM神经网络聚集分析 105

5.3.1 算法基础 106

5.3.2 基本概念 106

5.3.3 算法步骤 108

5.3.4 SOM神经网络的优缺点 108

5.3.5 使用SOM神经网络进行聚类 108

5.4 共享最近邻聚类 109

5.4.1 算法基础 110

5.4.2 基本概念 114

5.4.3 算法步骤 115

5.4.4 共享最近邻算法的特点 116

5.5 聚类方法的比较 117

5.6 融合空间相关性因子的聚类 119

5.7 从聚类到模式识别规则的学习:识别空间异构 119

参考文献 122

第6章 融合多源数据的贝叶斯网络 125

6.1 贝叶斯网络介绍 125

6.1.1 发展历史 126

6.1.2 基本概念 126

6.1.3 特性 129

6.2 学习贝叶斯网络 129

6.2.1 结构学习 130

6.2.2 参数的学习 134

6.3 不确定性推理:信息传播 137

6.3.1 精确推理 138

6.3.2 近似推理 141

6.4 案例 142

参考文献 143

第7章 有效性验证及学习的强化 144

7.1 有效性验证 144

7.1.1 模糊矩阵及相关度量 144

7.1.2 ROC图 146

7.1.3 统计有效性 149

7.1.4 非监督学习的有效性验证 150

7.2 交叉验证及元学习 151

7.2.1 交叉验证 151

7.2.2 元学习 151

参考文献 156

第8章 空间统计并行计算框架 157

8.1 设计背景 157

8.2 主要内容 158

8.3 实施步骤 158

8.3.1 公共算子提取 158

8.3.2 公共算子并行策略设计 161

8.3.3 公共算子并行实现 165

8.3.4 公共算子调用 167

8.3.5 公共算子组合 168

8.4 案例 169

参考文献 171

第二篇 软件工具 175

第9章 空间数据分析工具 175

9.1 空间数据分析 175

9.2 GeoDa 176

9.2.1 GeoDa主要功能 176

9.2.2 GeoDa应用实例 177

9.3 STARS 179

9.3.1 STARS主要功能 179

9.3.2 STARS应用实例 180

9.4 ArcGIS 181

9.4.1 ArcGIS主要功能 181

9.4.2 ArcGIS应用实例 182

9.5 R 184

9.5.1 R空间分析功能介绍 184

9.5.2 R空间分析实例 185

9.6 CrimeStat 187

9.6.1 CrimeStat主要功能 187

9.6.2 CrimeStat应用实例 189

9.7 WinBUGS 190

9.7.1 WinBUGS主要功能 190

9.7.2 WinBUGS应用实例 190

参考文献 193

第10章 贝叶斯辅助决策支持工具包 194

10.1 软件介绍 194

10.2 时空数据的输入与数据预处理 195

10.2.1 时空数据的输入 195

10.2.2 数据预处理 196

10.3 贝叶斯辅助决策支持工具包的建模工具 198

10.3.1 DAG建模方法 198

10.3.2 时空DAG建模方法 202

10.3.3 不确定性建模方法 206

10.4 空间最近邻非监督及关联规则学习 208

10.4.1 空间共享最近邻学习 209

10.4.2 关联规则的发现 210

10.5 建模结果的输出 211

第11章 空间统计并行计算实施 212

11.1 贝叶斯分类器 212

11.2 贝叶斯分类器的并行化 212

11.2.1 离散化 213

11.2.2 网络结构的学习 214

11.2.3 网络参数的学习 216

11.2.4 网络的推断 219

11.3 测试案例 220

11.3.1 案例一 220

11.3.2 案例二 222

参考文献 224

第三篇 综合运用 227

第12章 非监督学习提高耕地调查效率 227

12.1 简介 227

12.2 研究区域及目标 229

12.3 相似性分类器 231

12.3.1 多维栅格格式的数据集 231

12.3.2 相似性的学习及分类 232

12.3.3 评估 238

12.4 分层及估计 239

12.4.1 分区效果 239

12.4.2 结果 241

12.5 小结 245

参考文献 246

第13章 监督学习监测洪水灾害损失 249

13.1 基本原理 249

13.2 洪水风险评估 251

13.2.1 运用核密度函数进行数据预处理 252

13.2.2 定量因素的最优离散化 253

13.2.3 特征选择 254

13.2.4 模型构建及参数估计 254

13.2.5 洪水灾害风险的鲁棒性预测 255

13.3 评价 256

13.3.1 相比较的方法 256

13.3.2 性能指标 256

13.4 实验结论 257

13.4.1 局部网络拓扑结构 257

13.4.2 运用交叉验证的性能比较 258

13.4.3 预测的性能比较 258

参考文献 260

第14章 基于贝叶斯网络的灾害易损性分析及保险定价 262

14.1 基于贝叶斯网络的易损性分析 262

14.1.1 包含的指标 262

14.1.2 空间分析技术 263

14.1.3 贝叶斯网络模拟结构 264

14.1.4 易损性评估 266

14.1.5 保险定价 267

14.1.6 不确定性和敏感性分析 268

14.2 案例研究:地震灾害评估及保险定价 269

14.2.1 研究地区和目标 269

14.2.2 数据集 270

14.2.3 危害分析 272

14.2.4 易损性建模和保险定价 273

14.2.5 不确定性和敏感性分析 277

14.3 讨论 278

参考文献 280

第15章 台风灾害及海啸风险评价 283

15.1 简介 284

15.2 探索气候或生态因素变化与灾害事件之间的时空关系 285

15.2.1 基本原理 285

15.2.2 聚类技术探索相关变量的时间序列模式 286

15.2.3 通过关联规则发现及粗糙集发现相关性 288

15.3 易损性分析 290

15.3.1 关于易损性分析 290

15.3.2 不同的财产或者人的易损性 290

15.3.3 因子的相关性分析 292

15.3.4 易损性时空分布模式分析 292

15.3.5 通过优化技术降低风险及易损性 296

15.4 动态风险及易损性分析 303

15.4.1 贝叶斯网络预测风险及易损性 304

15.4.2 从栅格多维时空数据中学习优化的贝叶斯网络 304

15.4.3 不确定性证据推理 305

15.4.4 风险/易损性水平的不确定性动态推理 305

15.5 总结 308

15.5.1 时空数据挖掘方法探求气候/生态因素变化对我国灾害的影响 308

15.5.2 灾害影响因子的重要性检验及因果关系的建立 308

15.5.3 融合多源信息的信任网进行灾害监测 309

15.5.4 情景模拟的辅助预警 309

参考文献 309