《基于支持向量机的聚类及文本分类关键技术研究》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:平源,周亚建,杨义先著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2014
  • ISBN:9787115332691
  • 页数:184 页
图书介绍:本书介绍了敏感数据防泄漏模型、关键技术和应用等方面的内容。提出了统一的敏感数据防泄漏模型和系统架构,结合可信计算技术,对模型的功能和安全性进行了形式化描述。对结构化与非结构化的敏感数据的定义、定位与保护技术的理论和设计进行了详细的介绍。

第1章 绪论 1

1.1 引言 1

1.2 机器学习理论 2

1.2.1 无监督学习 3

1.2.2 有监督学习 3

1.2.3 半监督学习 3

1.2.4 增强学习 4

1.3 支持向量机与聚类分析 4

1.4 支持向量机与文本分类 7

1.5 本书的主要工作 10

第2章 支持向量机技术基础 13

2.1 引言 13

2.2 统计学习理论 13

2.3 支持向量机技术 16

2.3.1 支持向量分类机 16

2.3.2 L2-支持向量机 19

2.3.3 多类问题的决策方法 21

2.3.4 支持向量回归机模型 23

2.3.5 支持向量机研究现状 24

2.4 支持向量聚类 29

2.4.1 支持向量聚类模型 29

2.4.2 影响支持向量聚类的关键因素 32

2.5 本章小结 40

第3章 双质心支持向量聚类 41

3.1 引言 41

3.2 噪声数据点消除策略 43

3.2.1 噪声数据分布结构分析 43

3.2.2 噪声数据消除算法 45

3.3 双质心簇标定策略 47

3.3.1 簇的分解策略 47

3.3.2 单组件双质心的构造 48

3.3.3 成员关系的判定规则 50

3.3.4 算法描述 51

3.4 DBC时间性能分析 52

3.5 聚类实验分析 53

3.5.1 数据集 53

3.5.2 实验对比算法 53

3.5.3 噪声数据消除实验 54

3.5.4 DBC聚类效果测试 57

3.5.5 DBC整体性能测试 59

3.5.6 DBC模型的半监督应用测试 60

3.6 本章小结 60

第4章 基于凸分解的簇标定算法 63

4.1 引言 63

4.2 基于凸分解的簇标定算法 64

4.2.1 簇在特征空间中的凸性质 64

4.2.2 支持超凸多面体的凸分解 65

4.2.3 凸包的标定算法 72

4.2.4 标定非凸包样本 76

4.3 CDCL算法时间性能分析 76

4.4 聚类实验分析 78

4.4.1 数据集 78

4.4.2 实验对比算法 79

4.4.3 CDCL算法适应能力分析 80

4.4.4 CDCL算法整体性能测试 82

4.5 本章小结 87

第5章 快速支持向量聚类算法 89

5.1 引言 89

5.2 快速支持向量聚类算法(FASVC) 90

5.2.1 选择簇边界样本 90

5.2.2 构造超球面 92

5.2.3 自适应的簇标定策略 96

5.2.4 FASVC算法的实现 97

5.3 FASVC时间性能及特点分析 99

5.3.1 FASVC时间性能分析 99

5.3.2 FASVC算法特点 100

5.4 聚类实验分析 101

5.4.1 数据集 102

5.4.2 实验对比算法 102

5.4.3 FASVC参数敏感性测试 103

5.4.4 FASVC算法整体性能测试 104

5.4.5 利用FASVC进行文本聚类 110

5.4.6 利用FASVC识别P2P流量 111

5.5 本章小结 112

第6章 基于支持向量机的多模式文本分类研究 113

6.1 引言 113

6.2 文本表示的关键问题与启示 114

6.2.1 场景1:特征的文档频率之外的信息 116

6.2.2 场景2:最大值保留的特征权重与特征的多类别分布信息 116

6.2.3 场景3:文本的结构信息 118

6.3 基于支持向量机的多模式文本分类方案 120

6.3.1 自适应的文本块划分算法 120

6.3.2 兼顾类别贡献度和类间区分度的特征权重方案 121

6.3.3 融合多类别倾向的特征类间区分能力强化方案 122

6.3.4 基于文本块重要性分布加权的特征频率方案 124

6.4 分类实验分析 125

6.4.1 数据集 125

6.4.2 实验对比方案 127

6.4.3 评价指标 129

6.4.4 CCE方案实验结果与分析 130

6.4.5 C2TCTVT算法框架实验结果与分析 135

6.4.6 NWET与N2WET组合方案实验结果与分析 145

6.5 本章小结 153

结束语 154

参考文献 158

名词索引 180