第一章 信息检索概述 1
1.1 信息检索的基本概念 1
1.2 信息检索的基本原理 3
1.3 信息检索的研究对象与研究方法 4
1.3.1 主要研究问题 5
1.3.2 相关学科及领域 6
1.4 信息检索的发展历史 8
1.4.1 手工检索时期 8
1.4.2 计算机化检索时期 9
1.4.3 网络化检索时期 12
思考与练习题 15
第二章 信息检索的数学模型 16
2.1 信息检索系统的形式化表示 17
2.2 集合论检索模型 19
2.2.1 布尔检索模型 19
2.2.2 模糊集合模型 21
2.2.3 扩展布尔模型 24
2.3 代数论检索模型 26
2.3.1 向量空间模型 26
2.3.2 潜在语义索引模型 28
2.3.3 神经网络模型 30
2.4 概率论检索模型 33
2.4.1 经典概率模型 33
2.4.2 基于Bayesian网络的检索模型 35
2.5 其他信息检索模型与数学理论 37
2.5.1 结构化检索模型 38
2.5.2 浏览模型 40
2.5.3 其他新型数学理论 41
思考与练习题 47
第三章 信息检索系统及其构成 49
3.1 信息检索系统及其类型 49
3.1.1 信息检索系统的定义 49
3.1.2 信息检索系统的类型 50
3.2 信息检索系统的基本结构 53
3.2.1 信息检索系统的物理结构 53
3.2.2 信息检索系统的逻辑结构 54
3.3 信息存储各功能模块分析 55
3.3.1 信息资源及其选择与采集 55
3.3.2 信息标引处理 59
3.3.3 数据库创建与维护 64
3.4 信息查询各功能模块分析 66
3.4.1 用户(检索)接口 66
3.4.2 提问处理与检索匹配 70
3.5 知识组织与管理工具模块分析 70
3.5.1 知识组织与管理工具的技术理念 71
3.5.2 知识组织与管理工具的类型 74
3.5.3 知识组织与管理工具的应用方式 76
思考与练习题 78
第四章 文本信息检索技术与方法 80
4.1 文本信息概述 80
4.1.1 文本信息的基本知识 80
4.1.2 自然语言文本中词汇的频率与数量分布规律 82
4.1.3 文本信息预处理 83
4.2 布尔检索 84
4.2.1 布尔逻辑算符及其使用 85
4.2.2 布尔逻辑检索提问式的变换处理 87
4.2.3 布尔检索的技术实现 91
4.3 截词检索 92
4.3.1 后截词检索 93
4.3.2 前截词检索 94
4.3.3 中截词检索 95
4.3.4 截词检索的技术实现 95
4.4 限制检索 96
4.5 位置检索 98
4.5.1 邻接检索 98
4.5.2 同句检索 99
4.5.3 同字段检索和同记录检索 100
4.5.4 位置检索的技术实现 100
4.6 聚类检索 101
4.6.1 聚类检索的概念 101
4.6.2 聚类检索的技术实现 102
4.6.3 聚类检索的进一步分析 102
4.7 相关反馈与提问式扩展技术 103
4.7.1 基于用户反馈法的提问式扩展 104
4.7.2 基于局部自动分析的提问式扩展 105
4.8 可视化检索技术 107
4.8.1 提问式构造可视化 108
4.8.2 检索过程可视化 110
4.8.3 检索结果可视化 111
4.8.4 检索词表(叙词表)可视化 113
4.9 联机检索辅助技术 115
4.9.1 信息的浏览式查询与超链接技术的运用 115
4.9.2 检索结果的翻译和多语种(或跨语种)检索 116
4.9.3 检索结果的后处理 117
思考与练习题 118
第五章 多媒体信息检索技术与方法 120
5.1 多媒体信息概述 120
5.1.1 音频信息 121
5.1.2 图形与图像信息 124
5.1.3 视频信息 126
5.2 多媒体信息的基于内容检索 129
5.2.1 多媒体信息检索的新思想——基于内容检索 129
5.2.2 基于内容检索的研究内容 130
5.2.3 基于内容检索系统的基本框架 131
5.3 音频信息的基于内容检索 133
5.3.1 音频信息基于内容检索的主要查询方式 133
5.3.2 语音检索 134
5.3.3 音乐检索 137
5.3.4 其他音频检索 137
5.4 图像信息的基于内容检索 138
5.4.1 图像信息基于内容检索的主要查询方式 138
5.4.2 基于颜色特征的图像检索 139
5.4.3 基于纹理特征的图像检索 141
5.4.4 基于形状特征的图像检索 142
5.4.5 基于空间关系的图像检索 144
5.4.6 基于组合特征的图像检索 146
5.5 视频信息的基于内容检索 148
5.5.1 视频镜头的检测与表达 149
5.5.2 视频镜头聚类与镜头集合描述 150
5.5.3 视频数据的组织与索引 151
5.5.4 基于内容的视频检索 153
5.5.5 视频检索的常用查询方式 154
5.6 若干基于内容检索系统简介 155
思考与练习题 156
第六章 Web与网络搜索引擎 157
6.1 Web信息搜索概述 157
6.1.1 Web及其信息资源 157
6.1.2 搜索引擎的出现与发展 159
6.1.3 搜索引擎的主要类型 162
6.2 搜索引擎的工作原理 163
6.2.1 独立搜索引擎的工作原理 163
6.2.2 元搜索引擎的工作原理 169
6.3 独立搜索引擎的关键技术分析 171
6.3.1 搜索结果排序 171
6.3.2 个性化搜索 176
6.3.3 分布式搜索引擎系统的创建 179
6.3.4 Semantic Web与语义搜索 179
6.4 元搜索引擎的关键技术分析 183
6.4.1 成员搜索引擎的选择 183
6.4.2 提问式转换 184
6.4.3 结果信息的选择与融合 185
6.4.4 检索结果的整合 186
6.4.5 元搜索引擎的可扩展性 187
思考与练习题 188
第七章 信息检索评价研究 189
7.1 信息检索评价研究概述 189
7.1.1 信息检索评价研究的意义 189
7.1.2 信息检索评价研究的类型 190
7.1.3 信息检索评价研究的发展历史 190
7.2 信息检索评价研究的理论与方法 193
7.2.1 信息检索评价的基本理论问题…相关性及其判断标准的选取 193
7.2.2 信息检索评价研究的基本方法和程序 195
7.2.3 信息检索评价的指标体系 197
7.3 信息检索评价实例 202
7.3.1 Cranfield评价试验 203
7.3.2 MEDLARS系统和SMART系统的评价实验 206
7.3.3 STAIRS评价项目 209
7.3.4 TREC检索评价试验平台 212
思考与练习题 221
第八章 文本信息处理自动化技术 222
8.1 文本聚类 222
8.1.1 文本聚类的基本知识 223
8.1.2 等级聚类法 226
8.1.3 动态聚类法 229
8.1.4 聚类效果的评测方法与指标 234
8.2 文本分类 235
8.2.1 文本分类的基本知识 236
8.2.2 kNN分类法 238
8.2.3 Naive Bayes分类法 239
8.2.4 SVM分类法 240
8.2.5 分类效果的评测方法与指标 244
8.3 文本过滤 246
8.3.1 文本过滤的基本知识 247
8.3.2 基于内容的文本过滤 249
8.3.3 协作过滤 251
8.4 文本摘要 256
8.4.1 自动文摘的基本知识 256
8.4.2 基于统计的自动文摘 258
8.4.3 基于理解的自动文摘 260
8.4.4 基于信息抽取的自动文摘 263
8.4.5 基于结构的自动文摘 265
思考与练习题 267
第九章 信息检索的基本方法与步骤 268
9.1 用户信息需求及其分析 268
9.1.1 用户信息需求及其类型 268
9.1.2 用户信息需求的分析与表达 270
9.2 信息检索策略 271
9.2.1 检索策略的概念 271
9.2.2 常用联机检索策略简介 272
9.3 检索提问式的构造与调整 275
9.3.1 检索提问式的定义 275
9.3.2 检索提问式的构造(或编制) 275
9.3.3 检索提问式的反馈调整 278
9.4 联机检索和网络搜索的基本步骤 279
9.4.1 联机检索前的准备工作 279
9.4.2 登录并熟悉所要使用的检索系统(或工具) 280
9.4.3 拟定并执行具体的检索操作 281
9.4.4 获取并整理检索结果 283
9.4.5 分析评价检索操作与检索结果 284
思考与练习题 286
第十章 常用数据库及国际联机检索服务系统 287
10.1 书目数据库及其检索服务系统 287
10.1.1 书目数据库概述 287
10.1.2 英文书目数据库及其检索服务系统 288
10.1.3 中文书目数据库及其检索服务系统 301
10.2 全文数据库及其检索服务系统 306
10.2.1 全文数据库概述 306
10.2.2 英文全文数据库及其检索服务系统 308
10.2.3 中文全文数据库及其检索服务系统 312
10.3 事实与数值型数据库及其检索服务系统 313
10.3.1 事实与数值型数据库概述 313
10.3.2 英文事实与数值型数据库及其检索服务系统 314
10.3.3 中文事实与数值型数据库及其检索服务系统 318
10.4 国际联机检索服务系统 321
10.4.1 国际联机检索服务系统概述 321
10.4.2 综合性国际联机检索服务系统 323
10.4.3 专业性国际联机检索服务系统 328
思考与练习题 331
第十一章 常用网络搜索引擎服务系统 332
11.1 综合性独立搜索引擎 332
11.1.1 Google 332
11.1.2 Yahoo! 334
11.1.3 百度 337
11.1.4 MSN Live Search 338
11.1.5 其他综合性独立搜索引擎 339
11.2 垂直型独立搜索引擎 341
11.2.1 学科(专业)搜索引擎 341
11.2.2 专利搜索引擎 343
11.2.3 购物搜索引擎 345
11.2.4 博客搜索引擎 347
11.2.5 电子地图搜索服务工具 348
11.2.6 移动搜索引擎 352
11.3 元搜索引擎 354
11.3.1 Dogpile 354
11.3.2 Vivisimo 357
11.3.3 Ixquick和Bbmao 359
11.3.4 其他元搜索引擎 360
11.4 其他网络搜索服务系统 361
11.4.1 提供数据的搜索引擎 361
11.4.2 搜索引擎信息源网站 362
思考与练习题 363
主要参考文献和网络信息源 364
重要名词术语索引 368