《基于遗传算法的文本分类及聚类研究》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:戴文华著
  • 出 版 社:北京:科学出版社
  • 出版年份:2008
  • ISBN:9787030227416
  • 页数:222 页
图书介绍:文本分类和聚类技术是应信息检索和查询需要而出现的自然语言处理领域的重要研究课题。文本分类和聚类问题中的特征选择和抽取技术、文本特征表示、聚类方法的选择和实现以及分类方法的选择和实现,都将对文本分类和聚类结果产生极大影响。同时针对文本分类和聚类中的文本数据的高维性和稀疏性、同义词和近义词问题、效率与精确度之间的搭配问题以及参数优化问题,本书提出了使用遗传算法与传统分类和聚类方法相结合的思路来进行处理,充分利用了遗传算法的全局优化能力和传统分类及聚类算法的专业知识,有效地提高了文本分类和聚类的效率与精度。

第1章 绪论 1

1.1 研究的目的和意义 1

1.2 国内外研究现状 5

1.3 文本分类和聚类存在的问题 7

1.4 本书研究内容和目标 10

参考文献 12

第2章 文本分类和聚类的基本理论及方法 14

2.1 文本分类和聚类的概念 14

2.2 文本的表示 18

2.3 文本预处理 27

2.4 文本特征选择和抽取 34

2.5 文本分类方法 46

2.6 文本聚类方法 55

2.7 本章小结 63

参考文献 64

第3章 遗传算法基础知识 68

3.1 遗传算法概述 69

3.2 标准遗传算法 80

3.3 遗传算法染色体编码 83

3.4 适应度函数 91

3.5 遗传算子 98

3.6 遗传算法的改进 107

3.7 本章小结 119

参考文献 120

第4章 混合并行遗传算法及其在文本聚类中的应用 121

4.1 k-means算法初始聚类中心的选择 121

4.2 混合并行遗传算法 123

4.3 基于并行遗传算法的文本特征词提取 141

4.4 基于混合并行遗传算法的文本聚类 145

4.5 实验设置及结果分析 146

4.6 本章小结 154

参考文献 154

第5章 混合并行遗传算法在文本分类中的应用 156

5.1 基于混合并行遗传算法的潜在语义挖掘 156

5.2 基于混合并行遗传聚类的KNN改进算法(HPGA-KNN) 162

5.3 SMO-SVM算法 164

5.4 SMO-SVM算法核函数参数优化 166

5.5 改进的KNN-SVM文本分类方法 167

5.6 实验设置及分析 169

5.7 本章小结 172

参考文献 173

第6章 总结和研究展望 174

6.1 总结 174

6.2 后续研究工作展望 175

附录A k-means聚类算法关键代码 176

附录B 遗传算法聚类关键代码 186

附录C 混合遗传聚类关键代码 204