第1章 绪论 1
1.1信息检索基本理论 1
1.1.1信息检索的概念 1
1.1.2信息检索的原理 2
1.1.3信息检索的类型 4
1.2信息检索系统 7
1.2.1信息检索系统的概念 7
1.2.2信息检索系统的类型 9
1.2.3信息检索系统的物理结构 10
1.2.4信息检索系统的逻辑结构 15
1.3信息检索研究 17
1.3.1信息检索的研究内容 17
1.3.2信息检索的相关学科 19
1.3.3信息检索的产生和发展 21
1.3.4信息检索的趋势 24
思考题 26
第2章 信息检索模型 27
2.1引言 27
2.2经典模型 28
2.2.1布尔模型 29
2.2.2向量模型 31
2.2.3概率模型 34
2.3集合理论模型 37
2.3.1模糊集合模型 37
2.3.2扩展布尔模型 39
2.3.3粗糙集模型 41
2.4代数模型 43
2.4.1广义向量空间模型 43
2.4.2潜语义标引模型 44
2.4.3神经网络模型 46
2.5结构化模型 52
2.5.1非重叠链表模型 52
2.5.2邻近节点模型 53
2.5.3扁平浏览模型 54
2.5.4结构导向模型 54
2.5.5超文本模型 55
思考题 56
第3章 文本信息存储与检索 57
3.1引言 57
3.2书目记录 58
3.2.1书目记录结构 59
3.2.2CNMARC数据字段区的构成 60
3.2.3CNMARC数据字段区的标识系统 62
3.3顺排文档 62
3.3.1表展开法 63
3.3.2树展开法 68
3.4倒排文档 74
3.4.1倒排文档的建立 74
3.4.2提问式的编辑 75
3.4.3检索处理 81
3.5文本检索技术 82
3.5.1布尔检索 82
3.5.2截词检索 84
3.5.3限制检索 86
3.5.4加权检索 88
3.6文本聚类检索 91
3.6.1聚类检索的概念 91
3.6.2文献相似度 91
3.6.3文档特征抽取方法 95
3.6.4文本聚类常用技术 95
3.7全文检索 102
3.7.1全文检索的技术指标 102
3.7.2邻接检索 104
3.7.3同句检索 105
3.7.4同字段检索 105
3.7.5同记录检索 106
思考题 106
第4章 多媒体信息存储与检索 108
4.1引言 108
4.2多媒体技术概述 109
4.2.1多媒体的概念 109
4.2.2多媒体技术的关键特征 110
4.2.3多媒体技术的主要研究内容 112
4.3多媒体数据模型 112
4.3.1多媒体数据模型概述 112
4.3.2图像的数据模型 115
4.3.3音频的数据模型 118
4.3.4视频的数据模型 119
4.4多媒体数据压缩技术 120
4.4.1数据压缩技术概述 120
4.4.2图像压缩的标准 123
4.4.3音频压缩的标准 125
4.4.4视频压缩的标准 128
4.5基于内容的多媒体检索技术 129
4.5.1基于内容的多媒体信息检索原理 129
4.5.2基于内容的图像检索 132
4.5.3基于内容的音频检索 134
4.5.4基于内容的视频检索 136
思考题 138
第5章 Web信息存储与检索 139
5.1引言 139
5.2Web信息组织 140
5.2.1超文本 140
5.2.2标记语言 147
5.2.3超文本传输协议 151
5.2.4超文本浏览器 154
5.3Web元数据 155
5.3.1Web元数据概述 155
5.3.2DC元数据集 156
5.3.3其他常用的元数据格式 159
5.4搜索引擎 161
5.4.1搜索引擎的概念与基本功能 161
5.4.2搜索引擎的结构与原理 164
5.4.3搜索引擎的类型 167
思考题 169
第6章 并行与分布式信息检索 170
6.1引言 170
6.2并行信息检索 170
6.2.1并行信息检索的原理 171
6.2.2并行检索的体系结构 172
6.2.3并行检索技术 175
6.2.4并行检索中的索引文档处理 178
6.3分布式信息检索方法 182
6.3.1分布式信息检索的原理 182
6.3.2分布式检索处理技术 183
6.3.3分布式信息检索模式 184
6.3.4分布式检索中的数据集选择 187
6.4异构数据库检索 192
6.4.1异构数据库的特点 192
6.4.2异构数据库跨库检索的原理 194
6.4.3异构数据库跨库检索技术 196
6.4.4异构数据集成 198
思考题 201
第7章 人工智能与自然语言检索 202
7.1引言 202
7.2人工智能技术 202
7.2.1专家系统 203
7.2.2数据挖掘 205
7.2.3知识发现 208
7.2.4信息抽取与知识抽取 210
7.3智能检索 212
7.3.1智能检索接口 212
7.3.2智能检索技术 214
7.3.3智能检索系统与应用 217
7.4自然语言检索 219
7.4.1自然语言理解 219
7.4.2基于语法分析的自然语言检索 222
7.4.3基于语义分析的自然语言检索 224
7.4.4基于本体的自然语言检索 226
7.5跨语言检索 229
7.5.1跨语言检索的实现模式 230
7.5.2跨语言检索中的语言资源 233
7.5.3跨语言检索的关键技术 236
7.5.4提问式翻译的几种方法 238
思考题 240
第8章 用户界面与可视化 241
8.1引言 241
8.2信息检索用户 241
8.2.1用户及其种类 241
8.2.2信息存取的交互模型 243
8.2.3用户检索行为对界面设计的影响 245
8.3用户界面设计 246
8.3.1用户界面设计的原则 246
8.3.2用户界面的种类和风格 248
8.3.3窗口管理与系统举例 251
8.3.4用户界面的评价 257
8.4信息可视化 257
8.4.1什么是信息可视化 257
8.4.2信息可视化的作用 259
8.5信息检索的可视化 260
8.5.1信息检索可视化的优势 260
8.5.2原始信息提供的可视化 262
8.5.3检索结果提供的可视化 264
思考题 266
第9章 信息检索评价与实验 267
9.1引言 267
9.2信息检索相关性理论 268
9.2.1相关性的概念及其特征 268
9.2.2影响相关性判断的变量 270
9.2.3面向系统的相关性 271
9.2.4面向用户的相关性 272
9.3信息检索评价指标体系 273
9.3.1系统性能指标 273
9.3.2系统效益指标 278
9.3.3费用/效果指标 278
9.3.4费用/效益指标 279
9.3.5Web检索系统性能评价存在的问题 279
9.4信息检索评价的过程与方法 280
9.4.1确定评价对象及目标 280
9.4.2选择评价方式 280
9.4.3设计评价方案 281
9.4.4实施评价方案 281
9.5经典的信息检索评价实验 282
9.5.1MEDLARS系统评价实验 282
9.5.2Cranfield实验 284
9.5.3SMART检索实验 289
9.5.4STAIRS工程 291
9.5.5WRU检索实验 293
9.5.6SDI服务评价 294
9.5.7手工与联机回溯检索的费用/效果比较 295
9.5.8讨论 297
9.6信息检索评价实验平台:TREC 298
9.6.1TREC的产生与发展 298
9.6.2TREC的组织机制 299
9.6.3TREC的实验数据集合 300
9.6.4TREC的主要评价项目 302
9.6.5部分往届TREC简介 304
9.6.6关于C-TREC的一些思考 307
思考题 308
参考文献 309