现代信息检索 原理、技术与方法PDF电子书下载
- 电子书积分:13 积分如何计算积分?
- 作 者:赵丹群编著
- 出 版 社:北京市:北京大学出版社
- 出版年份:2008
- ISBN:7301129262
- 页数:374 页
第一章 信息检索概述 1
1.1 信息检索的基本概念 1
1.2 信息检索的基本原理 3
1.3 信息检索的研究对象与研究方法 4
1.3.1 主要研究问题 5
1.3.2 相关学科及领域 6
1.4 信息检索的发展历史 8
1.4.1 手工检索时期 8
1.4.2 计算机化检索时期 9
1.4.3 网络化检索时期 12
思考与练习题 15
第二章 信息检索的数学模型 16
2.1 信息检索系统的形式化表示 17
2.2 集合论检索模型 19
2.2.1 布尔检索模型 19
2.2.2 模糊集合模型 21
2.2.3 扩展布尔模型 24
2.3 代数论检索模型 26
2.3.1 向量空间模型 26
2.3.2 潜在语义索引模型 28
2.3.3 神经网络模型 30
2.4 概率论检索模型 33
2.4.1 经典概率模型 33
2.4.2 基于Bayesian网络的检索模型 35
2.5 其他信息检索模型与数学理论 37
2.5.1 结构化检索模型 38
2.5.2 浏览模型 40
2.5.3 其他新型数学理论 41
思考与练习题 47
第三章 信息检索系统及其构成 49
3.1 信息检索系统及其类型 49
3.1.1 信息检索系统的定义 49
3.1.2 信息检索系统的类型 50
3.2 信息检索系统的基本结构 53
3.2.1 信息检索系统的物理结构 53
3.2.2 信息检索系统的逻辑结构 54
3.3 信息存储各功能模块分析 55
3.3.1 信息资源及其选择与采集 55
3.3.2 信息标引处理 59
3.3.3 数据库创建与维护 64
3.4 信息查询各功能模块分析 66
3.4.1 用户(检索)接口 66
3.4.2 提问处理与检索匹配 70
3.5 知识组织与管理工具模块分析 70
3.5.1 知识组织与管理工具的技术理念 71
3.5.2 知识组织与管理工具的类型 74
3.5.3 知识组织与管理工具的应用方式 76
思考与练习题 78
第四章 文本信息检索技术与方法 80
4.1 文本信息概述 80
4.1.1 文本信息的基本知识 80
4.1.2 自然语言文本中词汇的频率与数量分布规律 82
4.1.3 文本信息预处理 83
4.2 布尔检索 84
4.2.1 布尔逻辑算符及其使用 85
4.2.2 布尔逻辑检索提问式的变换处理 87
4.2.3 布尔检索的技术实现 91
4.3 截词检索 92
4.3.1 后截词检索 93
4.3.2 前截词检索 94
4.3.3 中截词检索 95
4.3.4 截词检索的技术实现 95
4.4 限制检索 96
4.5 位置检索 98
4.5.1 邻接检索 98
4.5.2 同句检索 99
4.5.3 同字段检索和同记录检索 100
4.5.4 位置检索的技术实现 100
4.6 聚类检索 101
4.6.1 聚类检索的概念 101
4.6.2 聚类检索的技术实现 102
4.6.3 聚类检索的进一步分析 102
4.7 相关反馈与提问式扩展技术 103
4.7.1 基于用户反馈法的提问式扩展 104
4.7.2 基于局部自动分析的提问式扩展 105
4.8 可视化检索技术 107
4.8.1 提问式构造可视化 108
4.8.2 检索过程可视化 110
4.8.3 检索结果可视化 111
4.8.4 检索词表(叙词表)可视化 113
4.9 联机检索辅助技术 115
4.9.1 信息的浏览式查询与超链接技术的运用 115
4.9.2 检索结果的翻译和多语种(或跨语种)检索 116
4.9.3 检索结果的后处理 117
思考与练习题 118
第五章 多媒体信息检索技术与方法 120
5.1 多媒体信息概述 120
5.1.1 音频信息 121
5.1.2 图形与图像信息 124
5.1.3 视频信息 126
5.2 多媒体信息的基于内容检索 129
5.2.1 多媒体信息检索的新思想——基于内容检索 129
5.2.2 基于内容检索的研究内容 130
5.2.3 基于内容检索系统的基本框架 131
5.3 音频信息的基于内容检索 133
5.3.1 音频信息基于内容检索的主要查询方式 133
5.3.2 语音检索 134
5.3.3 音乐检索 137
5.3.4 其他音频检索 137
5.4 图像信息的基于内容检索 138
5.4.1 图像信息基于内容检索的主要查询方式 138
5.4.2 基于颜色特征的图像检索 139
5.4.3 基于纹理特征的图像检索 141
5.4.4 基于形状特征的图像检索 142
5.4.5 基于空间关系的图像检索 144
5.4.6 基于组合特征的图像检索 146
5.5 视频信息的基于内容检索 148
5.5.1 视频镜头的检测与表达 149
5.5.2 视频镜头聚类与镜头集合描述 150
5.5.3 视频数据的组织与索引 151
5.5.4 基于内容的视频检索 153
5.5.5 视频检索的常用查询方式 154
5.6 若干基于内容检索系统简介 155
思考与练习题 156
第六章 Web与网络搜索引擎 157
6.1 Web信息搜索概述 157
6.1.1 Web及其信息资源 157
6.1.2 搜索引擎的出现与发展 159
6.1.3 搜索引擎的主要类型 162
6.2 搜索引擎的工作原理 163
6.2.1 独立搜索引擎的工作原理 163
6.2.2 元搜索引擎的工作原理 169
6.3 独立搜索引擎的关键技术分析 171
6.3.1 搜索结果排序 171
6.3.2 个性化搜索 176
6.3.3 分布式搜索引擎系统的创建 179
6.3.4 Semantic Web与语义搜索 179
6.4 元搜索引擎的关键技术分析 183
6.4.1 成员搜索引擎的选择 183
6.4.2 提问式转换 184
6.4.3 结果信息的选择与融合 185
6.4.4 检索结果的整合 186
6.4.5 元搜索引擎的可扩展性 187
思考与练习题 188
第七章 信息检索评价研究 189
7.1 信息检索评价研究概述 189
7.1.1 信息检索评价研究的意义 189
7.1.2 信息检索评价研究的类型 190
7.1.3 信息检索评价研究的发展历史 190
7.2 信息检索评价研究的理论与方法 193
7.2.1 信息检索评价的基本理论问题…相关性及其判断标准的选取 193
7.2.2 信息检索评价研究的基本方法和程序 195
7.2.3 信息检索评价的指标体系 197
7.3 信息检索评价实例 202
7.3.1 Cranfield评价试验 203
7.3.2 MEDLARS系统和SMART系统的评价实验 206
7.3.3 STAIRS评价项目 209
7.3.4 TREC检索评价试验平台 212
思考与练习题 221
第八章 文本信息处理自动化技术 222
8.1 文本聚类 222
8.1.1 文本聚类的基本知识 223
8.1.2 等级聚类法 226
8.1.3 动态聚类法 229
8.1.4 聚类效果的评测方法与指标 234
8.2 文本分类 235
8.2.1 文本分类的基本知识 236
8.2.2 kNN分类法 238
8.2.3 Naive Bayes分类法 239
8.2.4 SVM分类法 240
8.2.5 分类效果的评测方法与指标 244
8.3 文本过滤 246
8.3.1 文本过滤的基本知识 247
8.3.2 基于内容的文本过滤 249
8.3.3 协作过滤 251
8.4 文本摘要 256
8.4.1 自动文摘的基本知识 256
8.4.2 基于统计的自动文摘 258
8.4.3 基于理解的自动文摘 260
8.4.4 基于信息抽取的自动文摘 263
8.4.5 基于结构的自动文摘 265
思考与练习题 267
第九章 信息检索的基本方法与步骤 268
9.1 用户信息需求及其分析 268
9.1.1 用户信息需求及其类型 268
9.1.2 用户信息需求的分析与表达 270
9.2 信息检索策略 271
9.2.1 检索策略的概念 271
9.2.2 常用联机检索策略简介 272
9.3 检索提问式的构造与调整 275
9.3.1 检索提问式的定义 275
9.3.2 检索提问式的构造(或编制) 275
9.3.3 检索提问式的反馈调整 278
9.4 联机检索和网络搜索的基本步骤 279
9.4.1 联机检索前的准备工作 279
9.4.2 登录并熟悉所要使用的检索系统(或工具) 280
9.4.3 拟定并执行具体的检索操作 281
9.4.4 获取并整理检索结果 283
9.4.5 分析评价检索操作与检索结果 284
思考与练习题 286
第十章 常用数据库及国际联机检索服务系统 287
10.1 书目数据库及其检索服务系统 287
10.1.1 书目数据库概述 287
10.1.2 英文书目数据库及其检索服务系统 288
10.1.3 中文书目数据库及其检索服务系统 301
10.2 全文数据库及其检索服务系统 306
10.2.1 全文数据库概述 306
10.2.2 英文全文数据库及其检索服务系统 308
10.2.3 中文全文数据库及其检索服务系统 312
10.3 事实与数值型数据库及其检索服务系统 313
10.3.1 事实与数值型数据库概述 313
10.3.2 英文事实与数值型数据库及其检索服务系统 314
10.3.3 中文事实与数值型数据库及其检索服务系统 318
10.4 国际联机检索服务系统 321
10.4.1 国际联机检索服务系统概述 321
10.4.2 综合性国际联机检索服务系统 323
10.4.3 专业性国际联机检索服务系统 328
思考与练习题 331
第十一章 常用网络搜索引擎服务系统 332
11.1 综合性独立搜索引擎 332
11.1.1 Google 332
11.1.2 Yahoo! 334
11.1.3 百度 337
11.1.4 MSN Live Search 338
11.1.5 其他综合性独立搜索引擎 339
11.2 垂直型独立搜索引擎 341
11.2.1 学科(专业)搜索引擎 341
11.2.2 专利搜索引擎 343
11.2.3 购物搜索引擎 345
11.2.4 博客搜索引擎 347
11.2.5 电子地图搜索服务工具 348
11.2.6 移动搜索引擎 352
11.3 元搜索引擎 354
11.3.1 Dogpile 354
11.3.2 Vivisimo 357
11.3.3 Ixquick和Bbmao 359
11.3.4 其他元搜索引擎 360
11.4 其他网络搜索服务系统 361
11.4.1 提供数据的搜索引擎 361
11.4.2 搜索引擎信息源网站 362
思考与练习题 363
主要参考文献和网络信息源 364
重要名词术语索引 368
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《Prometheus技术秘笈》百里燊 2019
- 《中央财政支持提升专业服务产业发展能力项目水利工程专业课程建设成果 设施农业工程技术》赵英编 2018
- 《药剂学实验操作技术》刘芳,高森主编 2019
- 《林下养蜂技术》罗文华,黄勇,刘佳霖主编 2017
- 《脱硝运行技术1000问》朱国宇编 2019
- 《催化剂制备过程技术》韩勇责任编辑;(中国)张继光 2019
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019