第一部分 3
第1章 引言 3
1.1研究背景 3
1.2自动标引与自动分类的作用 5
1.3本书的内容与章节安排 7
第2章 文本自动标引与分类研究进展 10
2.1自动标引研究综述 10
2.2文本分类研究综述 23
2.3本章小结 33
第二部分 45
第3章 文本分词技术及抽词词典构造 45
3.1文本分词技术概述 45
3.2分词模式设计及其原理 48
3.3原始抽词词典的构造 49
3.4词典约简算法实验 51
第4章 基于多特征选择及权值计算 57
4.1特征选择方法概述 57
4.2算法设计原理 62
4.3结果分析 66
第5章 自动标引中标引源权重方案确定 68
5.1标引源权重研究综述 68
5.2标引源权重方案的确定 69
5.3本章小结 78
第三部分 83
第6章 分类知识库的制作 83
6.1概述 83
6.2关键词(串)—分类号关联研究综述 85
6.3关键词(串)一分类号关联方法 90
6.4分类知识库的制作 93
6.5分类知识库的性能测评 101
6.6篇名知识库的制作 105
6.7本章小结 109
第7章 基于语义体系的词语相似度计算 111
7.1概述 111
7.2词语相似度研究综述 112
7.3基于语义体系的词语相似度算法 116
7.4基于语义相似度的同义词挖掘 128
7.5本章小结 137
第8章 基于知识库的文本自动分类 141
8.1文本自动系统总体设计 141
8.2文本自动分类系统的测评 143
8.3《全国报刊索引》自动标引与自动分类系统介绍 146
8.4本章小结 147
第四部分 151
第9章 统计与决策规则双重分类算法 151
9.1分类器概述 151
9.2双重分类原理 158
9.3分类规则提取 160
9.4双重分类过程 161
9.5实验结果及分析 163
第10章 层次分类算法实验 166
10.1层次分类原理 166
10.2层次分类算法设计 168
10.3实验结果及分析 171
第11章 基于统计与规则相结合的文本分类系统的实现 174
11.1系统实验用语料选择及分析 174
11.2系统总体框架与模块介绍 178
11.3系统测试分析 181
11.4本章小结 182
名称索引 185
主题索引 190
后记 197