当前位置:首页 > 其他书籍
现代信息检索  原理、技术与方法
现代信息检索  原理、技术与方法

现代信息检索 原理、技术与方法PDF电子书下载

其他书籍

  • 电子书积分:13 积分如何计算积分?
  • 作 者:赵丹群编著
  • 出 版 社:北京市:北京大学出版社
  • 出版年份:2008
  • ISBN:7301129262
  • 页数:374 页
图书介绍:本书是北大2006年立项教材。本书是对信息检索领域基本理论、主要技术和应用方法的系统介绍和阐述。全书共分11章,每章后面都提供了数量不等的思考与练习题。另外书后还附有主要参考文献列表和重要名次属于索引表。
《现代信息检索 原理、技术与方法》目录

第一章 信息检索概述 1

1.1 信息检索的基本概念 1

1.2 信息检索的基本原理 3

1.3 信息检索的研究对象与研究方法 4

1.3.1 主要研究问题 5

1.3.2 相关学科及领域 6

1.4 信息检索的发展历史 8

1.4.1 手工检索时期 8

1.4.2 计算机化检索时期 9

1.4.3 网络化检索时期 12

思考与练习题 15

第二章 信息检索的数学模型 16

2.1 信息检索系统的形式化表示 17

2.2 集合论检索模型 19

2.2.1 布尔检索模型 19

2.2.2 模糊集合模型 21

2.2.3 扩展布尔模型 24

2.3 代数论检索模型 26

2.3.1 向量空间模型 26

2.3.2 潜在语义索引模型 28

2.3.3 神经网络模型 30

2.4 概率论检索模型 33

2.4.1 经典概率模型 33

2.4.2 基于Bayesian网络的检索模型 35

2.5 其他信息检索模型与数学理论 37

2.5.1 结构化检索模型 38

2.5.2 浏览模型 40

2.5.3 其他新型数学理论 41

思考与练习题 47

第三章 信息检索系统及其构成 49

3.1 信息检索系统及其类型 49

3.1.1 信息检索系统的定义 49

3.1.2 信息检索系统的类型 50

3.2 信息检索系统的基本结构 53

3.2.1 信息检索系统的物理结构 53

3.2.2 信息检索系统的逻辑结构 54

3.3 信息存储各功能模块分析 55

3.3.1 信息资源及其选择与采集 55

3.3.2 信息标引处理 59

3.3.3 数据库创建与维护 64

3.4 信息查询各功能模块分析 66

3.4.1 用户(检索)接口 66

3.4.2 提问处理与检索匹配 70

3.5 知识组织与管理工具模块分析 70

3.5.1 知识组织与管理工具的技术理念 71

3.5.2 知识组织与管理工具的类型 74

3.5.3 知识组织与管理工具的应用方式 76

思考与练习题 78

第四章 文本信息检索技术与方法 80

4.1 文本信息概述 80

4.1.1 文本信息的基本知识 80

4.1.2 自然语言文本中词汇的频率与数量分布规律 82

4.1.3 文本信息预处理 83

4.2 布尔检索 84

4.2.1 布尔逻辑算符及其使用 85

4.2.2 布尔逻辑检索提问式的变换处理 87

4.2.3 布尔检索的技术实现 91

4.3 截词检索 92

4.3.1 后截词检索 93

4.3.2 前截词检索 94

4.3.3 中截词检索 95

4.3.4 截词检索的技术实现 95

4.4 限制检索 96

4.5 位置检索 98

4.5.1 邻接检索 98

4.5.2 同句检索 99

4.5.3 同字段检索和同记录检索 100

4.5.4 位置检索的技术实现 100

4.6 聚类检索 101

4.6.1 聚类检索的概念 101

4.6.2 聚类检索的技术实现 102

4.6.3 聚类检索的进一步分析 102

4.7 相关反馈与提问式扩展技术 103

4.7.1 基于用户反馈法的提问式扩展 104

4.7.2 基于局部自动分析的提问式扩展 105

4.8 可视化检索技术 107

4.8.1 提问式构造可视化 108

4.8.2 检索过程可视化 110

4.8.3 检索结果可视化 111

4.8.4 检索词表(叙词表)可视化 113

4.9 联机检索辅助技术 115

4.9.1 信息的浏览式查询与超链接技术的运用 115

4.9.2 检索结果的翻译和多语种(或跨语种)检索 116

4.9.3 检索结果的后处理 117

思考与练习题 118

第五章 多媒体信息检索技术与方法 120

5.1 多媒体信息概述 120

5.1.1 音频信息 121

5.1.2 图形与图像信息 124

5.1.3 视频信息 126

5.2 多媒体信息的基于内容检索 129

5.2.1 多媒体信息检索的新思想——基于内容检索 129

5.2.2 基于内容检索的研究内容 130

5.2.3 基于内容检索系统的基本框架 131

5.3 音频信息的基于内容检索 133

5.3.1 音频信息基于内容检索的主要查询方式 133

5.3.2 语音检索 134

5.3.3 音乐检索 137

5.3.4 其他音频检索 137

5.4 图像信息的基于内容检索 138

5.4.1 图像信息基于内容检索的主要查询方式 138

5.4.2 基于颜色特征的图像检索 139

5.4.3 基于纹理特征的图像检索 141

5.4.4 基于形状特征的图像检索 142

5.4.5 基于空间关系的图像检索 144

5.4.6 基于组合特征的图像检索 146

5.5 视频信息的基于内容检索 148

5.5.1 视频镜头的检测与表达 149

5.5.2 视频镜头聚类与镜头集合描述 150

5.5.3 视频数据的组织与索引 151

5.5.4 基于内容的视频检索 153

5.5.5 视频检索的常用查询方式 154

5.6 若干基于内容检索系统简介 155

思考与练习题 156

第六章 Web与网络搜索引擎 157

6.1 Web信息搜索概述 157

6.1.1 Web及其信息资源 157

6.1.2 搜索引擎的出现与发展 159

6.1.3 搜索引擎的主要类型 162

6.2 搜索引擎的工作原理 163

6.2.1 独立搜索引擎的工作原理 163

6.2.2 元搜索引擎的工作原理 169

6.3 独立搜索引擎的关键技术分析 171

6.3.1 搜索结果排序 171

6.3.2 个性化搜索 176

6.3.3 分布式搜索引擎系统的创建 179

6.3.4 Semantic Web与语义搜索 179

6.4 元搜索引擎的关键技术分析 183

6.4.1 成员搜索引擎的选择 183

6.4.2 提问式转换 184

6.4.3 结果信息的选择与融合 185

6.4.4 检索结果的整合 186

6.4.5 元搜索引擎的可扩展性 187

思考与练习题 188

第七章 信息检索评价研究 189

7.1 信息检索评价研究概述 189

7.1.1 信息检索评价研究的意义 189

7.1.2 信息检索评价研究的类型 190

7.1.3 信息检索评价研究的发展历史 190

7.2 信息检索评价研究的理论与方法 193

7.2.1 信息检索评价的基本理论问题…相关性及其判断标准的选取 193

7.2.2 信息检索评价研究的基本方法和程序 195

7.2.3 信息检索评价的指标体系 197

7.3 信息检索评价实例 202

7.3.1 Cranfield评价试验 203

7.3.2 MEDLARS系统和SMART系统的评价实验 206

7.3.3 STAIRS评价项目 209

7.3.4 TREC检索评价试验平台 212

思考与练习题 221

第八章 文本信息处理自动化技术 222

8.1 文本聚类 222

8.1.1 文本聚类的基本知识 223

8.1.2 等级聚类法 226

8.1.3 动态聚类法 229

8.1.4 聚类效果的评测方法与指标 234

8.2 文本分类 235

8.2.1 文本分类的基本知识 236

8.2.2 kNN分类法 238

8.2.3 Naive Bayes分类法 239

8.2.4 SVM分类法 240

8.2.5 分类效果的评测方法与指标 244

8.3 文本过滤 246

8.3.1 文本过滤的基本知识 247

8.3.2 基于内容的文本过滤 249

8.3.3 协作过滤 251

8.4 文本摘要 256

8.4.1 自动文摘的基本知识 256

8.4.2 基于统计的自动文摘 258

8.4.3 基于理解的自动文摘 260

8.4.4 基于信息抽取的自动文摘 263

8.4.5 基于结构的自动文摘 265

思考与练习题 267

第九章 信息检索的基本方法与步骤 268

9.1 用户信息需求及其分析 268

9.1.1 用户信息需求及其类型 268

9.1.2 用户信息需求的分析与表达 270

9.2 信息检索策略 271

9.2.1 检索策略的概念 271

9.2.2 常用联机检索策略简介 272

9.3 检索提问式的构造与调整 275

9.3.1 检索提问式的定义 275

9.3.2 检索提问式的构造(或编制) 275

9.3.3 检索提问式的反馈调整 278

9.4 联机检索和网络搜索的基本步骤 279

9.4.1 联机检索前的准备工作 279

9.4.2 登录并熟悉所要使用的检索系统(或工具) 280

9.4.3 拟定并执行具体的检索操作 281

9.4.4 获取并整理检索结果 283

9.4.5 分析评价检索操作与检索结果 284

思考与练习题 286

第十章 常用数据库及国际联机检索服务系统 287

10.1 书目数据库及其检索服务系统 287

10.1.1 书目数据库概述 287

10.1.2 英文书目数据库及其检索服务系统 288

10.1.3 中文书目数据库及其检索服务系统 301

10.2 全文数据库及其检索服务系统 306

10.2.1 全文数据库概述 306

10.2.2 英文全文数据库及其检索服务系统 308

10.2.3 中文全文数据库及其检索服务系统 312

10.3 事实与数值型数据库及其检索服务系统 313

10.3.1 事实与数值型数据库概述 313

10.3.2 英文事实与数值型数据库及其检索服务系统 314

10.3.3 中文事实与数值型数据库及其检索服务系统 318

10.4 国际联机检索服务系统 321

10.4.1 国际联机检索服务系统概述 321

10.4.2 综合性国际联机检索服务系统 323

10.4.3 专业性国际联机检索服务系统 328

思考与练习题 331

第十一章 常用网络搜索引擎服务系统 332

11.1 综合性独立搜索引擎 332

11.1.1 Google 332

11.1.2 Yahoo! 334

11.1.3 百度 337

11.1.4 MSN Live Search 338

11.1.5 其他综合性独立搜索引擎 339

11.2 垂直型独立搜索引擎 341

11.2.1 学科(专业)搜索引擎 341

11.2.2 专利搜索引擎 343

11.2.3 购物搜索引擎 345

11.2.4 博客搜索引擎 347

11.2.5 电子地图搜索服务工具 348

11.2.6 移动搜索引擎 352

11.3 元搜索引擎 354

11.3.1 Dogpile 354

11.3.2 Vivisimo 357

11.3.3 Ixquick和Bbmao 359

11.3.4 其他元搜索引擎 360

11.4 其他网络搜索服务系统 361

11.4.1 提供数据的搜索引擎 361

11.4.2 搜索引擎信息源网站 362

思考与练习题 363

主要参考文献和网络信息源 364

重要名词术语索引 368

相关图书
作者其它书籍
返回顶部