第1章 绪论 1
1.1 研究的目的和意义 1
1.2 国内外研究现状 5
1.3 文本分类和聚类存在的问题 7
1.4 本书研究内容和目标 10
参考文献 12
第2章 文本分类和聚类的基本理论及方法 14
2.1 文本分类和聚类的概念 14
2.2 文本的表示 18
2.3 文本预处理 27
2.4 文本特征选择和抽取 34
2.5 文本分类方法 46
2.6 文本聚类方法 55
2.7 本章小结 63
参考文献 64
第3章 遗传算法基础知识 68
3.1 遗传算法概述 69
3.2 标准遗传算法 80
3.3 遗传算法染色体编码 83
3.4 适应度函数 91
3.5 遗传算子 98
3.6 遗传算法的改进 107
3.7 本章小结 119
参考文献 120
第4章 混合并行遗传算法及其在文本聚类中的应用 121
4.1 k-means算法初始聚类中心的选择 121
4.2 混合并行遗传算法 123
4.3 基于并行遗传算法的文本特征词提取 141
4.4 基于混合并行遗传算法的文本聚类 145
4.5 实验设置及结果分析 146
4.6 本章小结 154
参考文献 154
第5章 混合并行遗传算法在文本分类中的应用 156
5.1 基于混合并行遗传算法的潜在语义挖掘 156
5.2 基于混合并行遗传聚类的KNN改进算法(HPGA-KNN) 162
5.3 SMO-SVM算法 164
5.4 SMO-SVM算法核函数参数优化 166
5.5 改进的KNN-SVM文本分类方法 167
5.6 实验设置及分析 169
5.7 本章小结 172
参考文献 173
第6章 总结和研究展望 174
6.1 总结 174
6.2 后续研究工作展望 175
附录A k-means聚类算法关键代码 176
附录B 遗传算法聚类关键代码 186
附录C 混合遗传聚类关键代码 204