《数据与数据流的聚类、半监督聚类及加权聚类》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:陈新泉著
  • 出 版 社:成都:电子科技大学出版社
  • 出版年份:2015
  • ISBN:9787564730772
  • 页数:132 页
图书介绍:本书主要讨论多维属性数据和数据流中的聚类算法、半监督聚类算法及加权聚类算法等。从多个角度研究来如何将优化方法应用到不同类型的聚类算法中,为后续进一步的数据处理提供有用的参考信息。本书可作为数据挖掘领域研究生的教学和科研参考书,也可成为智能数据分析与处理技术人员的自学研究参考书。

第一章 绪论 1

1.1 引言 1

1.2 本书的研究背景与意义 1

1.3 与本课题相关的国内外研究进展 2

1.3.1 数据挖掘 2

1.3.2 特征选择和特征加权 2

1.3.3 聚类分析 2

1.3.4 半监督聚类 4

1.4 本书的主要内容 4

第二章 面向数据流的加权聚类及演化分析 7

2.1 引言 7

2.2 问题描述及聚类、聚类簇的定义 8

2.2.1 聚类的数据结构定义 8

2.2.2 聚类簇的数据结构定义 8

2.2.3 聚类的加法和减法定理 9

2.3 聚类的融合及差与聚类簇的融合及差 9

2.3.1 聚类、聚类簇的数据结构定义及相关算法 9

2.3.2 聚类差的数据结构定义及相关算法 10

2.3.3 聚类的融合及差 12

2.3.4 聚类簇的融合及差 12

2.4 面向数据流的加权聚类分析及演化分析框架 14

2.5 仿真实验 15

2.5.1 聚类及演化分析框架的实例说明 15

2.5.2 聚类簇的融合及演化分析的验证实验 16

2.6 结论 17

2.7 本章小结 17

第三章 混合属性数据流的加权聚类及演化分析 18

3.1 引言 18

3.2 混合属性数据流的聚类及聚类簇定义 18

3.2.1 有序属性上的投影聚类及投影聚类簇结构定义 18

3.2.2 无序类别属性上的投影聚类及投影聚类簇结构定义 19

3.2.3 无序类别属性上的投影聚类结构的第二种定义 20

3.2.4 混合属性数据流的聚类及聚类簇结构定义 21

3.2.5 混合属性数据流的聚类和聚类簇的构造方法 23

3.3 混合属性数据流的两步投影聚类方法 23

3.3.1 两步投影聚类方法 23

3.3.2 两步投影聚类方法的改进 24

3.3.3 求两个有序集合的交集 24

3.4 混合属性数据流的分段及融合聚类框架 25

3.4.1 分段策略 25

3.4.2 融合策略 25

3.5 仿真实验 29

3.5.1 混合属性数据集的两步投影聚类方法的有效性验证 29

3.5.2 混合属性数据流的分段及融合聚类框架的有效性验证 31

3.6 本章小结 33

第四章 推进式优化特征权重的K-中心点聚类方法 34

4.1 引言 34

4.2 基于特征权重优化的推进式K-中心点聚类算法 35

4.2.1 问题描述 35

4.2.2 基于特征权重优化的推进式K-中心点聚类算法描述 36

4.3 相异性度量的第一种特征权重优化方法 38

4.3.1 有序属性子集的特征权重优化 38

4.3.2 无序属性子集的特征权重优化 39

4.3.3 第一种特征权重优化方法的描述 40

4.4 相异性度量的第二种特征权重优化方法 41

4.4.1 最小化目标函数 41

4.4.2 最大化目标函数 42

4.4.3 最小化混合目标函数 42

4.4.4 参数λ和γ的自适应优化 44

4.4.5 第二种特征权重优化方法的描述 46

4.5 仿真实验 48

4.5.1 仿真实验设计 48

4.5.2 仿真实验结果 49

4.5.3 实验结果分析及结论 50

4.6 本章小结 50

第五章 基于半监督学习的k平均聚类框架 52

5.1 引言 52

5.2 混合属性数据点集的基于半监督学习的k平均聚类框架 52

5.2.1 问题描述 52

5.2.2 基于半监督学习的k平均聚类框架 53

5.3 基于半监督学习的k平均聚类方法 53

5.3.1 基于MST(Minimum Spanning Tree)的半监督学习算法 53

5.3.2 基于MSF的半监督学习算法 55

5.3.3 基于归属度的k平均聚类算法 56

5.4 仿真实验 58

5.4.1 仿真实验设计 58

5.4.2 仿真实验结果 59

5.4.3 实验结果分析及结论 62

5.5 本章小结 62

第六章 混合属性数据集的基于近邻连接的两阶段聚类算法 63

6.1 引言 63

6.2 问题描述与相关的定义及性质 63

6.2.1 问题描述 63

6.2.2 定义与性质 64

6.3 混合属性数据集的基于近邻连接的两阶段聚类算法 67

6.3.1 算法描述 67

6.3.2 算法的改进与时空复杂度分析 69

6.3.3 参数的设置与优化 71

6.4 仿真实验 72

6.4.1 仿真实验设计 72

6.4.2 仿真实验结果 72

6.4.3 实验结果分析及结论 73

6.5 本章小结 74

第七章 面向混合属性数据集的双重聚类方法 75

7.1 引言 75

7.2 混合属性数据集的双重聚类方法 75

7.2.1 问题描述 75

7.2.2 双重聚类方法的基本流程 76

7.2.3 双重聚类方法 76

7.2.4 几个算法的性能比较 84

7.3 仿真实验 84

7.3.1 仿真实验设计 84

7.3.2 仿真实验结果 85

7.3.3 实验结果分析及结论 86

7.4 本章小结 87

第八章 一种自适应优化相异性度量的基于MST的半监督聚类方法…… 88

8.1 引言 88

8.2 混合属性数据点集的基于MST的半监督聚类分析方法 88

8.2.1 问题描述 88

8.2.2 混合属性数据点集的基于MST的半监督聚类分析方法 89

8.2.3 混合属性数据点集的相异性度量的定义 89

8.2.4 混合属性数据点集的相异性度量的优化 90

8.3 一种自适应优化相异性度量的方法 90

8.3.1 算法描述 90

8.3.2 算法的讨论及分析 91

8.4 基于MST的分离集合并聚类算法 92

8.4.1 算法描述 92

8.4.2 算法的讨论及分析 92

8.5 仿真实验 93

8.5.1 仿真实验设计 93

8.5.2 仿真实验结果 94

8.5.3 实验结果分析及结论 95

8.6 本章小结 95

附录1 第二章 的数据结构定义及相关算法的C语言实现 96

附录2 第三章 的数据结构定义及相关算法的C语言函数声明形式 122

参考文献 127