《快速与增量式数据降维算法研究》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:申富饶,竺涛,赵健著
  • 出 版 社:北京:科学出版社
  • 出版年份:2018
  • ISBN:9787030592378
  • 页数:208 页
图书介绍:数据降维技术是高维数据分析与处理中的关键技术之一,近年来受到研究者们的广泛关注。本书结合作者近几年的相关研究工作,对现有经典数据降维算法进行了介绍和总结,针对数据降维算法在快速学习与增量学习方面的不足,提出了数种关于快速降维与增量式降维的新方法,并对其进行了较为详细的介绍。本书的独创性内容主要包含如下方面:1.对线性降维进行了深入分析,提出了一种简单而高效的阈值机制以自动估计目标维数,实现快速降维;2.提出了一种快速的基于数据选择的半非负矩阵分解算法;3.提出了名为正交成分分析的快速正交成分提取算法;4.提出了增量式正交成分分析算法,实现了快速和增量式的线性降维。5.提出了进化式正交成分分析,实现了在线子空间学习;6.提出了拓扑学习嵌入算法,实现了快速和增量式的非线性降维。

第1章 绪论 1

1.1 数据降维算法分类 4

1.2 本书主要内容与组织结构 6

第2章 经典线性降维算法介绍 9

2.1 主成分分析 10

2.2 线性判别分析 14

2.3 独立成分分析 16

2.4 随机投影 18

2.5 非负矩阵分解 19

2.6 局部保持投影 24

2.7 增量式线性判别分析 25

2.8 无偏协方差无关增量主成分分析 30

2.9 典型相关分析 32

2.10 本章小结 34

第3章 线性降维中基本问题的讨论 35

3.1 线性降维与矩阵分解 36

3.2 数据选择与自适应阈值系统 38

3.3 线性方程组的求解问题与矩阵条件数 41

3.4 本章小结 46

第4章 基于数据选择的半非负矩阵分解 48

4.1 引言 49

4.2 相关工作介绍 50

4.3 基于数据选择的semi-NMF算法 52

4.4 实验 55

4.4.1 在单张图片上的矩阵分解实验 56

4.4.2 在真实数据集上的实验 58

4.5 本章小结 63

第5章 正交成分提取分析 64

5.1 引言 65

5.2 OCA算法描述 66

5.3 OCA算法分析 68

5.4 实验 71

5.4.1 在人工数据集上的实验 71

5.4.2 在真实数据集上的实验 74

5.5 本章小结 81

第6章 增量式正交成分分析 83

6.1 引言 84

6.2 IOCA算法描述 86

6.3 IOCA算法分析 88

6.3.1 关于IOCA学习过程的分析 88

6.3.2 关于IOCA有效性的分析 94

6.4 实验 96

6.4.1 在人工数据集上的实验 96

6.4.2 在真实数据集上的实验 99

6.5 本章小结 106

第7章 子空间正交基底在线调整算法 108

7.1 引言 109

7.2 子空间正交基底调整算法 110

7.2.1 子空间的“对齐” 112

7.2.2 子空间的基底的更新 114

7.2.3 新子空间唯一性的证明 116

7.3 EOCA算法 119

7.4 实验 122

7.4.1 在人工数据集上的实验 122

7.4.2 在真实数据集上的实验 124

7.5 本章小结 127

第8章 经典非线性降维算法 128

8.1 拉普拉斯特征映射 129

8.2 经典多维尺度变换 130

8.3 等距特征映射 131

8.4 局部线性嵌入 132

8.5 局部切空间规整 133

8.6 随机近邻嵌入与对称随机近邻嵌入 135

8.7 基于核方法的数据降维 138

8.8 基于神经网络的数据降维 139

8.9 本章小结 141

第9章 改进的基准点选取SL-Isomap算法 142

9.1 引言 143

9.2 SOINN 147

9.3 SL-Isomap算法描述 150

9.3.1 基准点选取 151

9.3.2 测地线距离计算 153

9.3.3 基准点降维映射 154

9.3.4 基于基准点对数据降维映射 154

9.3.5 坐标标准化 155

9.4 拓扑保持分析 155

9.4.1 算法分析 155

9.4.2 计算与空间复杂度分析 155

9.5 对比实验分析 156

9.5.1 Swiss_roll_data数据集 157

9.5.2 含噪声的Swiss_roll_data数据集 158

9.5.3 AT&T face数据集 160

9.5.4 误差分析 162

9.6 本章小结 163

第10章 拓扑学习与在线映射算法 164

10.1 引言 165

10.2 TLOE算法描述 166

10.2.1 基准点近邻图构造 167

10.2.2 基准点测地线距离计算 167

10.2.3 基准点降维映射 168

10.2.4 新数据点测地线距离计算 169

10.2.5 新数据点降维映射 169

10.3 拓扑保持分析 170

10.4 计算与空间复杂度分析 170

10.5 对比实验分析 171

10.5.1 Swiss_roll_data数据集的降维可视化 171

10.5.2 MNIST数据集的分类任务 172

10.6 误差分析 173

10.7 本章小结 174

第11章 基于拓扑学习的流形学习算法 175

11.1 引言 176

11.2 拓扑学习嵌入 178

11.2.1 拓扑学习 179

11.2.2 数据嵌入 184

11.3 实验 185

11.3.1 在人工数据集上的实验 185

11.3.2 在手写数字数据集上的实验 193

11.4 本章小结 195

第12章 总结与展望 196

12.1 主要工作内容 197

12.2 工作展望 198

参考文献 199

索引 207