《文本自动标引与自动分类研究》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:章成志,白振田编著
  • 出 版 社:南京:东南大学出版社
  • 出版年份:2009
  • ISBN:9787564119133
  • 页数:198 页
图书介绍:本丛书是在学位论文及社科基金研究报告基础上写成,主题是情报检索语言(或知识组织系统)在网络环境信息组织中的应用。包括了近10年来南京农大信息检索实验室的一批研究成果,诸如:知识组织系统(叙词表、分类表、本体等)的自动构建、文本的自动标引和自动分类;中文同义词的自动识别;情报检索语言的互操作等。其中既有系统全面的理论分析;也有深入的系统和技术要点的讨论。

第一部分 3

第1章 引言 3

1.1研究背景 3

1.2自动标引与自动分类的作用 5

1.3本书的内容与章节安排 7

第2章 文本自动标引与分类研究进展 10

2.1自动标引研究综述 10

2.2文本分类研究综述 23

2.3本章小结 33

第二部分 45

第3章 文本分词技术及抽词词典构造 45

3.1文本分词技术概述 45

3.2分词模式设计及其原理 48

3.3原始抽词词典的构造 49

3.4词典约简算法实验 51

第4章 基于多特征选择及权值计算 57

4.1特征选择方法概述 57

4.2算法设计原理 62

4.3结果分析 66

第5章 自动标引中标引源权重方案确定 68

5.1标引源权重研究综述 68

5.2标引源权重方案的确定 69

5.3本章小结 78

第三部分 83

第6章 分类知识库的制作 83

6.1概述 83

6.2关键词(串)—分类号关联研究综述 85

6.3关键词(串)一分类号关联方法 90

6.4分类知识库的制作 93

6.5分类知识库的性能测评 101

6.6篇名知识库的制作 105

6.7本章小结 109

第7章 基于语义体系的词语相似度计算 111

7.1概述 111

7.2词语相似度研究综述 112

7.3基于语义体系的词语相似度算法 116

7.4基于语义相似度的同义词挖掘 128

7.5本章小结 137

第8章 基于知识库的文本自动分类 141

8.1文本自动系统总体设计 141

8.2文本自动分类系统的测评 143

8.3《全国报刊索引》自动标引与自动分类系统介绍 146

8.4本章小结 147

第四部分 151

第9章 统计与决策规则双重分类算法 151

9.1分类器概述 151

9.2双重分类原理 158

9.3分类规则提取 160

9.4双重分类过程 161

9.5实验结果及分析 163

第10章 层次分类算法实验 166

10.1层次分类原理 166

10.2层次分类算法设计 168

10.3实验结果及分析 171

第11章 基于统计与规则相结合的文本分类系统的实现 174

11.1系统实验用语料选择及分析 174

11.2系统总体框架与模块介绍 178

11.3系统测试分析 181

11.4本章小结 182

名称索引 185

主题索引 190

后记 197