第1章 绪论 1
1.1 课题研究背景及意义 1
1.2 课题国内外研究现状 2
1.3 课题研究难点 4
1.4 文本挖掘概述 6
1.5 本书所研究的核心技术 8
1.6 相关粗糙集基础知识 10
1.7 本书的组织结构、主要工作和创新点 14
第2章 文本特征选择 17
2.1 引言 17
2.2 文本表示方法 17
2.3 常用的文本特征权重计算方法 19
2.4 文本特征选择简介 21
2.5 所提的文本特征选择方法 26
2.6 实验仿真验证 38
2.7 本章小结 45
第3章 文本分类 46
3.1 引言 46
3.2 文本分类的定义 46
3.3 常用的文本分类器 47
3.4 基于粗糙集理论的文本分类研究 49
3.5 ID3算法的优化 57
3.6 本章小结 67
第4章 文本聚类 68
4.1 引言 68
4.2 文本聚类简介 69
4.3 主要聚类方法 69
4.4 K-Means算法的改进 71
4.5 无监督文本特征选择方法研究 76
4.6 本章小结 88
第5章 文本关联分析 89
5.1 引言 89
5.2 文本关联规则 89
5.3 频繁项集挖掘算法 90
5.4 文本关联规则挖掘 94
5.5 本章小结 103
第6章 总结与展望 104
6.1 本书的主要研究内容、成果和创新点 104
6.2 本书研究的不足和进一步工作展望 105
参考文献 106
致谢 120