当前位置:首页 > 工业技术
非数值属性数据异常检测算法
非数值属性数据异常检测算法

非数值属性数据异常检测算法PDF电子书下载

工业技术

  • 电子书积分:10 积分如何计算积分?
  • 作 者:李志华,张海涛,孙雅,耿振民编著
  • 出 版 社:南昌:江西人民出版社
  • 出版年份:2015
  • ISBN:9787210081401
  • 页数:222 页
图书介绍:本书顺应大数据时代赋予异常检测所面临的新问题,侧重于一些常见非数值属性数据的异常检测需求,在简要介绍了一些非数值属性数据的相异性度量方法、异常检测的概念、异常检测的国内外研究现状和异常检测的评价指标基础上,分别从量子理论的角度讨论了异常检测问题、从离群数据的特征和挖掘的角度讨论了异常检测问题、从Mercer核理论的角度讨论了异常检测问题、从信息论的角度讨论了异常检测问题、从时间序列数据析取的角度讨论了时间序列的异常检测问题,以及从时间序列数据挖掘的角度讨论了时间序列的可视化异常检测问题。全书共分成8章,每章的结构相似,但所根据的理论依据和侧重点不同。
《非数值属性数据异常检测算法》目录

第一章 绪论 1

1.1 引言 1

1.2 异常检测相关概念 2

1.3 异常检测方法 2

1.4 异常检测的评估指标 7

1.5 本章小结 8

参考文献 9

第二章 相关基础知识 12

2.1 引言 12

2.2 常见非数值属性数据及度量 13

2.2.1 语义属性数据 13

2.2.2 异构属性数据 13

2.2.3 数据样本的度量 14

2.2.3.1 距离度量方法 15

2.2.3.2 相似性测度 16

2.2.3.3 非度量方法 17

2.2.3.4 异构数据的度量 19

2.3 时间序列数据及度量 20

2.3.1 时间序列的表示 20

2.3.1.1 离散傅里叶变换 21

2.3.1.2 离散小波变换 22

2.3.1.3 分段聚集近似 23

2.3.1.4 符号化聚集近似 24

2.3.1.5 其他方法 25

2.3.2 时间序列的相似性度量 27

2.3.2.1 闵可夫斯基距离 27

2.3.2.2 动态时间弯曲距离 28

2.3.2.3 编辑距离 31

2.3.2.4 最长公共子序列 32

2.3.2.5 MINDIST距离 33

2.3.2.6 其他方法 33

2.4 本章小结 34

参考文献 35

第三章 量子聚类算法的研究及其在异常检测中的应用 40

3.1 引言 40

3.2 量子力学的基本理论 42

3.2.1 概率波函数 42

3.2.2 薛定锷方程 42

3.2.3 量子势能 43

3.3 QC算法与FCM算法的比较研究 44

3.3.1 量子聚类算法 44

3.3.1.1 量子聚类的理论根据 44

3.3.1.2 量子聚类算法 46

3.3.1.3 量子聚类算法的特点 46

3.3.2 FCM算法及其特点 47

3.3.2.1 FCM算法简介 47

3.3.2.2 FCM算法的特点 48

3.3.3 FCM算法的一种量子理论解释 48

3.3.4 QC算法与FCM算法的仿真实验比较 49

3.3.4.1 仿真实验及分析 49

3.3.4.2 QC算法与FCM算法的实验比较结果 56

3.3.5 结论 56

3.4 基于核宽度调节参数估计的量子聚类算法 57

3.4.1 算法概述 57

3.4.2 PeQC算法 58

3.4.2.1 算法中参数的分析 58

3.4.2.2 δ的估计 58

3.4.2.3 PeQC算法 59

3.4.2.4 PeQC聚类算法分析 59

3.4.3 仿真实验及分析 60

3.4.4 算法小结 62

3.5 语义属性数据模糊量子聚类算法 63

3.5.1 算法概述 63

3.5.2 距离量子势能 64

3.5.3 语义属性数据量子聚类算法 65

3.5.3.1 语义属性数据的相异性度量 65

3.5.3.2 NQC算法 66

3.5.3.3 NQC算法的时空复杂度分析 67

3.5.3.4 聚类有效性分析 67

3.5.4 仿真实验及分析 69

3.5.4.1 仿真实验 69

3.5.4.2 soybean disease样本数据集的聚类结果分析 72

3.5.5 算法小结 72

3.6 基于量子聚类的异常检测方法 73

3.6.1 方法概述 73

3.6.2 量子势能中的相异性度量分析 74

3.6.3 异构数据的距离量子聚类算法 74

3.6.3.1 语义属性的相异性度量 74

3.6.3.2 异构样本间的Mahalanobis距离 74

3.6.3.3 距离量子聚类算法 75

3.6.4 基于MDQC算法的异常检测方法 76

3.6.5 仿真实验及分析 76

3.6.5.1 样本的选择及预处理 76

3.6.5.2 实验结果及分析 77

3.6.6 异常检测方法小结 80

3.7 本章小结 81

参考文献 81

第四章 基于语义属性数据离群聚类的异常检测 86

4.1 引言 86

4.2 离群聚类算法介绍 88

4.2.1 主观发现方法 88

4.2.2 客观发现方法 89

4.3 离群聚类算法及分析 90

4.3.1 样本的相异性度量 90

4.3.2 离群聚类算法 91

4.3.3 算法抗离群点干扰能力分析 92

4.3.4 算法的时空复杂度分析 95

4.4 基于离群聚类的异常检测研究 95

4.4.1 检测方法概述 95

4.4.2 异常检测实验及分析 96

4.5 本章小结 98

参考文献 99

第五章 基于语义属性数据核分类方法的异常检测 101

5.1 引言 101

5.2 支撑向量机简介 102

5.3 核方法分析及支撑向量机中的核函数 106

5.3.1 核方法分析 106

5.3.2 支撑向量机中的核函数 108

5.4 语义属性数据的核分类方法及分析 110

5.4.1 样本的相异性度量 110

5.4.2 异构属性样本的核分类方法 111

5.4.3 标准样本集的仿真实验及分析 112

5.5 基于语义属性数据分类方法的异常检测研究 116

5.5.1 检测方法概述 116

5.5.2 异常检测实验及分析 117

5.6 本章小结 120

参考文献 120

第六章 基于结构熵聚类的异常检测 124

6.1 引言 124

6.2 信息论基础 125

6.2.1 自信息 125

6.2.2 信息熵 126

6.2.3 互信息 128

6.3 连续属性的离散化算法 129

6.3.1 离散化问题简述 130

6.3.2 离散化算法 130

6.4 结构熵聚类算法 132

6.4.1 算法概述 132

6.4.2 相异性度量 133

6.4.2.1 语义属性相异性度量的计算 133

6.4.2.2 异构距离的计算 134

6.4.3 结构熵聚类算法 135

6.4.3.1 异构数据结构熵的计算 135

6.4.3.2 结构熵聚类算法 137

6.4.3.3 结构熵聚类方法的时空复杂度分析及特点 138

6.4.3.4 标准样本集的仿真实验及分析 139

6.4.4 算法小结 141

6.5 基于结构熵聚类的异常检测研究 142

6.5.1 检测方法概述 142

6.5.2 异常检测实验及分析 142

6.6 本章小结 145

参考文献 145

第七章 时间序列的异常检测 148

7.1 引言 148

7.2 基于层次析取的时间序列数据异常检测算法 149

7.2.1 算法概述 149

7.2.2 时间序列的层次表示 149

7.2.2.1 时间序列的层次标记 149

7.2.2.2 层次序列的获取 150

7.2.3 基于层次的时间序列数据析取 151

7.2.4 仿真实验及分析 152

7.2.4.1 实验数据 152

7.2.4.2 时间序列的分类 153

7.2.4.3 实验结果及分析 154

7.2.5 基于LETSD的时间序列异常检测 157

7.2.5.1 基于LETSD的时间序列异常检测模型 157

7.2.5.2 仿真实验及分析 160

7.3 基于趋势的时间序列数据析取之异常检测算法 165

7.3.1 算法概述 165

7.3.2 时间序列的趋势符号化 166

7.3.3 时间序列的趋势距离 168

7.3.4 仿真实验及分析 169

7.3.4.1 实验数据 170

7.3.4.2 时间序列的聚类 174

7.3.4.3 实验结果及分析 175

7.3.5 基于TETSD的时间序列异常检测 178

7.3.5.1 基于TETSD的时间序列异常检测模型 178

7.3.5.2 仿真实验及分析 179

7.4 本章小结 181

参考文献 182

第八章 时间序列的可视化异常检测 184

8.1 引言 184

8.2 基于时间序列分类的可视化异常检测算法 185

8.2.1 算法概述 185

8.2.2 时间序列的预处理 185

8.2.3 LMPC分类方法 188

8.2.3.1 实验数据介绍 188

8.2.3.2 分类评价指标 190

8.2.3.3 实验及结果分析 190

8.2.4 基于LMPC的时间序列异常检测方法 195

8.2.4.1 实验数据 195

8.2.4.2 评价标准 197

8.2.4.3 实验结果及分析 197

8.3 基于时间序列聚类的可视化异常检测方法 203

8.3.1 方法概述 203

8.3.2 符号化聚合近似方法的改进 204

8.3.3 基于LMP_SAX的时间序列聚类算法 205

8.3.3.1 实验数据 206

8.3.3.2 评价标准 208

8.3.3.3 实验及结果分析 209

8.3.4 基于LMP_SAX的时间序列异常检测方法 213

8.3.4.1 实验数据 214

8.3.4.2 实验结果及分析 214

8.4 本章小结 220

参考文献 220

附录:本书算法的实验环境 222

相关图书
作者其它书籍
返回顶部