《数据挖掘算法与应用》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:黄添强著
  • 出 版 社:厦门:厦门大学出版社
  • 出版年份:2011
  • ISBN:9787561540046
  • 页数:209 页
图书介绍:数据挖掘是近年来计算机科学中最活跃的研究分支之一。本书基于作者多年研究数据挖掘的成果,分三部分介绍数据挖掘中的三个热点:空间数据挖掘、半监督学习、流形学习。本书介绍空间数据挖掘、半监督学习与流形学习的研究进展,面向需要提出最新的模型、算法与技术。本书可供数据挖掘、机器学习及相关专业的研究人员、教师、研究生和工程人员参考。

第一篇 空间数据挖掘 3

第1章 空间数据挖掘研究绪论 3

一、空间数据挖掘研究背景及意义 3

二、空间数据挖掘与经典数据挖掘的区别 4

三、空间数据挖掘技术的主要方法及特点 5

(一)空间数据概化 5

(二)空间规则挖掘 5

(三)空间分类 5

(四)空间趋势预测 6

(五)空间聚类 6

(六)空间离群点查找 7

四、空间数据挖掘相关研究 7

本章参考文献 13

第2章 空间多维位置相关规则挖掘算法 28

一、已有研究的不足 28

二、基于影响域的空间多维位置相关规则模型(SMARM)的构建 28

三、空间多维位置相关规则的挖掘算法SMARBIA 30

四、算法时间性能分析 34

五、实验 34

六、本章小结 38

本章参考文献 38

第3章 基于多代表点特征树的空间聚类算法 40

一、相关工作 41

二、多代表点特征(MRF)树 41

(一)MRF-树的插入操作 43

(二)MRF-树的重建 45

三、基于MRF-树的算法CAMFT 46

(一)随机取样 47

(二)建树 47

(三)叶结点聚类 47

(四)全局聚类 48

四、算法的时空复杂性分析 48

五、实验 48

(一)算法的有效性 49

(二)算法的效率 50

(三)参数讨论 51

六、本章小结 51

本章参考文献 52

第4章 基于方形邻域的空间离群点挖掘算法 55

一、相关研究 55

二、基于方形邻域的离群点查找算法ODBSN 56

(一)相关的定义 56

(二)基于方形邻域查找的离群点算法 57

三、算法的时间复杂性评估与理论比较 59

四、实验 60

(一)影响效率的因素评价 60

(二)算法的有效性与效率评价 61

五、本章小结 62

本章参考文献 62

第5章 基于偏离因子的空间离群点挖掘算法 65

一、相关研究 65

二、空间偏离因子的初步构建 66

三、空间偏离度量的修正与空间度量的构建 67

四、空间偏离因子的可行性分析 69

五、空间离群点查找算法SOFDetecting与复杂性分析 70

六、实验 73

七、本章小结 74

本章参考文献 75

第6章 基于跳跃取样的空间离群点挖掘算法 77

一、空间离群点模型及其相关概念 78

二、空间离群点查找算法DBSODLS 79

三、DBSODLS算法时间复杂性 81

四、DBSODLS算法与其他基于密度的挖掘算法理论比较 81

(一)DBSODLS算法与GDBSCAN性能比较 81

(二)DBSODLS算法与LOF算法性能的比较 82

五、实验 82

(一)有效性实验 82

(二)算法效率比较 83

(三)影响时间性能的两个主要因素评价 84

本章参考文献 85

第7章 移动对象轨迹的双重插值算法 87

一、一些主要的插值技术 87

(一)牛顿(Newton)插值 87

(二)拉格朗日(Lagrange)插值 88

(三)分段线性插值 88

(四)三次样条插值 89

(五)分段三次Hermite插值 89

二、轨迹插值的研究进展 90

三、移动对象轨迹的双重插值模型与算法 91

(一)模型思想 91

(二)时间序列的保形三次Hermite插值 92

四、性能评价因素 93

(一)轨迹精度 93

(二)插值时间 94

五、实验与分析 94

(一)双重插值模型的插值效率实验 94

(二)双重插值模型的时间效率实验 95

六、本章小结 97

本章参考文献 98

第二篇 流形学习 103

第8章 流形学习研究绪论 103

一、研究背景和意义 103

二、研究现状 104

本章参考文献 107

第9章 流形学习经典算法简介 113

一、流形学习的基本概念 113

(一)流形的概念 113

(二)流形学习的概念 113

二、几种代表性的流形学习算法 114

(一)等距映射算法(ISOMAP) 114

(二)局部线性嵌入(LLE) 115

(三)拉普拉斯特征映射 116

(四)Hessian特征映射 116

(五)局部切空间排列(LTSA) 117

三、经典流形学习算法存在的问题 117

(一)流形的本征维数估计 118

(二)样本外点(Out-of-Sample)学习 118

(三)噪声流形学习 119

四、本章小结 119

本章参考文献 120

第10章 基于局部相关维度的噪音流形学习算法 121

一、局部相关维度的概念 121

二、基于局部相关维度的噪音流形学习算法 122

(一)离群点的性质 122

(二)LCDED算法 125

(三)算法性能分析 126

三、实验结果 126

(一)人工数据集上的实验 126

(二)真实数据上的实验 129

四、本章小结 131

本章参考文献 131

第11章 基于调和平均测地线核的流形学习算法 133

一、引言 133

二、HMGK算法 134

(一)测地线距离(geodesic distance) 134

(二)调和平均规范化(harmonic mean standardization) 134

(三)算法描述 136

三、实验结果分析 136

四、结论 140

本章参考文献 140

第12章 有监督的噪音流形学习算法及其在拉曼光谱数据上的应用 142

一、引言 142

二、基于核方法与监督学习的流形学习算法 143

三、UCI数据上的实验 145

四、算法在拉曼光谱数据上的应用 146

五、本章小结 147

本章参考文献 147

第13章 共享近邻的噪音流形学习算法及其在医院绩效考核中的应用 149

一、共享近邻的概念 149

二、基于共享近邻的非线性降维算法 149

三、实验结果 152

(一)人工数据 152

(二)UCI数据 152

四、算法在医院绩效考核上的应用 154

五、本章小结 155

本章参考文献 155

第三篇 半监督学习 159

第14章 半监督学习研究绪论 159

一、半监督学习研究背景与意义 159

二、研究的主要内容 159

三、半监督学习研究现状 160

(一)半监督学习问题表述 160

(二)半监督聚类 160

(三)协同训练 162

(四)离群点探测 162

(五)半监督学习应用 163

本章参考文献 164

第15章 基于监督聚类的半监督分类算法 170

一、问题的提出 170

二、监督聚类概述 171

三、基于监督聚类的半监督分类算法N2SC 171

(一)N2SC算法简介 171

(二)增加标签数据集 172

(三)不可信目标函数 173

(四)N2SC算法 174

四、实验结果与分析 176

(一)实验环境 176

(二)实验性能评估 177

(三)算法性能评估 179

五、本章小结 180

本章参考文献 180

第16章 半监督技术在复杂数据聚类中的应用 181

一、复杂数据聚类 181

二、基于密度的聚类算法DBSCAN 181

三、面向复杂数据的半监督聚类算法SCDCS 183

(一)SCDCS算法概述 183

(二)相关定义和标识 183

(三)密度分布参数Eps初选 184

(四)密度分布参数Eps精选 185

(五)多步聚类 187

(六)SCDCS算法性能分析 189

四、实验及评估 189

(一)实验环境 189

(二)实验结果及评估 189

五、小结 194

本章参考文献 194

第17章 半监督技术在异常轨迹检测中的应用 196

一、异常轨迹检测概述 196

二、问题分析 196

三、相关定义和标识 198

(一)轨迹描述 198

(二)轨迹片段相似度量 198

(三)轨迹分割 200

(四)局部异常轨迹探测相关定义 201

四、半监督异常轨迹探测算法Semi-TOD 202

(一)基于先验知识的关键参数选取 202

(二)全局角度探测异常轨迹 203

(三)Semi-TOD算法框架 203

五、实验评估 204

(一)飓风数据实验 204

(二)基于时间约束的轨迹片段度量有效性验证 205

(三)全局性异常轨迹探测有效性验证 206

(四)算法参数说明 207

六、小结 208

本章参考文献 208