《现代信息检索技术基本原理教程》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:王冲主编
  • 出 版 社:西安:西安电子科技大学出版社
  • 出版年份:2013
  • ISBN:9787560632292
  • 页数:312 页
图书介绍:本书内容包括信息检索技术概述、信息检索技术的一般数学原理、基于文本的索引构建技术、基于语言建模的信息检索技术、文本分类与朴素贝叶斯原理、信息检索聚类技术、跨语言信息检索技术、图像检索技术、音频检索技术、视频检索技术、Web搜索技术等。

第1章 信息检索技术概述 1

1.1信息检索技术的含义 1

1.1.1信息的含义 1

1.1.2检索的界定 2

1.1.3信息检索的含义 3

1.1.4信息检索技术的范畴和领域 4

1.2信息检索技术研究概览 5

1.2.1国外信息检索技术研究概览 6

1.2.2信息检索技术的国内研究状况 11

1.3信息检索技术的前沿问题与研究热点 14

1.3.1信息检索技术涉及的相关重要领域 14

1.3.2信息检索技术的发展趋势 15

1.3.3信息检索技术的研究热点 17

1.4本章小结 19

1.5习题 20

第2章 现代信息检索技术一般数学原理 22

2.1信息检索集合论 22

2.2简单布尔检索模型 22

2.2.1基本原理 22

2.2.2布尔检索模型的特点 23

2.3信息检索模糊集合论 24

2.3.1模糊检索的数学描述 25

2.3.2文献对标引词的隶属度 25

2.3.3提问语言的相关性描述 25

2.4扩展布尔检索模型 27

2.4.1基于两个标引词的情形 27

2.4.2推广到n个标引词空间 28

2.5检索代数模型 30

2.5.1向量空间信息检索模型原理 30

2.5.2潜在语义索引模型 35

2.5.3神经网络检索模型 38

2.6概率论检索模型 42

2.6.1经典概率检索模型 43

2.6.2贝叶斯网络检索模型 45

2.7其它检索模型的一般数学原理 48

2.7.1进化计算与遗传算法 48

2.7.2粗糙集理论 53

2.8本章小结 58

2.9习题 59

第3章 基于文本的索引构建技术 61

3.1基于块的排序索引技术 61

3.1.1索引文档建立必须考虑的硬件性能 61

3.1.2基于块的排序索引方法 62

3.2基于内存单次扫描的索引构建技术 65

3.3顺排文档索引 66

3.3.1表展开法索引 66

3.3.2逻辑树索引 68

3.4倒排文档索引 71

3.4.1倒排文档索引的建立 71

3.4.2逻辑提问式的转换 73

3.4.3检索指令表的生成 74

3.4.4检索实施 77

3.5本章小结 77

3.6习题 78

第4章 基于语言模型的信息检索技术 79

4.1语言模型概述 79

4.1.1有穷自动机和语言模型 79

4.1.2有穷自动机与语言模型举例分析 80

4.2语言模型创建 82

4.2.1语言模型创建过程 82

4.2.2选择建模对象 83

4.2.3选择模型的阶数 83

4.2.4平滑方法选择 83

4.2.5排序 84

4.3语言模型的检索语言基础 85

4.3.1检索语言 85

4.3.2语言模型分类 86

4.4查询似然模型 90

4.4.1信息检索中的查询似然模型 90

4.4.2查询生成概率的估计 91

4.5本章小结 92

4.6习题 93

第5章 文本分类与朴素贝叶斯分类原理 94

5.1文本分类 95

5.1.1文本分类的基本思想 95

5.1.2文本分类的发展简介 96

5.2朴素贝叶斯文本分类 97

5.2.1贝叶斯分类器 97

5.2.2条件概率和乘法定理 98

5.2.3极大后验假设和极大似然假设 98

5.2.4贝叶斯定理 98

5.2.5多项式朴素贝叶斯 99

5.3朴素贝叶斯分类模型改进 101

5.3.1改进方法 101

5.3.2朴素贝叶斯分类的提升模型 102

5.3.3基于特征相关的改进加权朴素贝叶斯分类 103

5.3.4基于特征相关的改进加权朴素贝叶斯文本分类 104

5.4贝努利模型 105

5.5多项式模型与贝努利模型的性质比较 106

5.6文本分类特征选择 109

5.6.1文本分类特征选择的作用 109

5.6.2特征选择的方法 109

5.6.3特征选择方法类型 110

5.6.4文本互信息选择 111

5.6.5 x2统计量特征选择 112

5.6.6基于频率的特征选择方法 113

5.7文本分类评价 113

5.7.1数据集对象 114

5.7.2文本分类评价方法 114

5.7.3文本分类评价标准 115

5.8本章小结 118

5.9习题 119

第6章 信息检索聚类技术 120

6.1信息聚类的含义 120

6.2典型的聚类算法类型 121

6.3聚类假设及聚类应用 123

6.3.1聚类假设及信息检索的一般聚类应用 123

6.3.2信息聚类的检索应用举例 124

6.4聚类算法的目标函数描述 126

6.5聚类算法评价 127

6.6 K均值算法 129

6.6.1 K - Means聚类算法的目标函数 129

6.6.2 K-Means的算法流程 131

6.6.3 K-Means聚类算法改进 132

6.7基于模型的聚类 133

6.8凝聚式层次聚类 136

6.8.1凝聚式层次聚类思想 136

6.8.2凝聚式层次聚类算法应用举例 137

6.9单连接与全连接聚类算法 138

6.10组平均凝聚式聚类与质心聚类 140

6.10.1组平均凝聚式聚类 140

6.10.2质心聚类 141

6.11本章小结 143

6.12习题 144

第7章 跨语言信息检索技术 145

7.1跨语言信息检索技术概述 145

7.2跨语言信息检索技术的研究发展 146

7.3跨语言信息检索技术的基本框架 147

7.4跨语言信息检索技术及其分类 148

7.4.1同源匹配技术 149

7.4.2查询翻译技术 149

7.4.3中间语言翻译方法 154

7.4.4文献翻译 154

7.4.5不翻译技术 155

7.4.6基于媒体对象的跨语言信息检索分类 155

7.5跨语言信息检索的主要研究热点 156

7.5.1跨语言信息检索中的翻译歧义研究 156

7.5.2跨语言信息检索中的翻译资源构建研究 156

7.5.3跨语言信息检索中的专有名词识别与音译研究 157

7.5.4跨语言信息检索中的翻译技术研究 157

7.5.5跨语言信息检索中的系统评价研究 157

7.5.6有关中英文跨语言信息检索的研究 160

7.6本章小结 161

7.7习题 162

第8章 图像检索技术 164

8.1图像检索技术概述 164

8.1.1图像检索一般模型 164

8.1.2基于文本方式的图像检索技术 165

8.1.3基于知识和视觉特征的图像检索技术 166

8.1.4基于内容的图像检索技术 166

8.1.5图像内容描述的标准化 167

8.2基于图像内容特征提取的检索技术 167

8.2.1基于颜色特征的图像检索技术 168

8.2.2基于纹理特征的图像检索技术 171

8.2.3基于形状特征的图像检索技术 172

8.2.4基于空间特征的图像检索技术 179

8.2.5单个特征图像检索的不足 179

8.3基于多特征的图像检索技术 180

8.3.1综合颜色和形状特征的图像检索技术 180

8.3.2综合形状和空间特征的图像检索技术 180

8.3.3综合形状和纹理特征的图像检索 181

8.3.4综合颜色、形状和空间的图像检索 181

8.4基于视觉特征的图像检索系统 181

8.4.1基于视觉特征的图像检索系统的整体架构 182

8.4.2图像分割技术 183

8.4.3相似性度量 187

8.4.4图像索引 188

8.4.5相关反馈技术 192

8.5典型的图像检索系统 193

8.6图像检索技术的发展方向 195

8.6.1融合人工反馈 195

8.6.2高层语义和低层视觉特征结合 195

8.6.3面向网络图像检索应用 195

8.7本章小结 195

8.8习题 196

第9章 音频信息检索技术 198

9.1音频的特点 198

9.1.1音频信息的基本特征 198

9.1.2音频信息的内容层次 199

9.2音频信息检索技术的分类和发展 199

9.2.1基于文本的音频检索技术 200

9.2.2基于内容特征的音频检索技术 201

9.3音频信息检索架构与模型 201

9.3.1音频信息检索架构 201

9.3.2向量空间模型借鉴 202

9.3.3概率模型借鉴 203

9.4表示级的音频检索技术 204

9.4.1基于直接匹配的音频样例检索 204

9.4.2基于索引的音频样例检索方法 206

9.4.3基于GPU通用计算的音频样例快速检索 211

9.5语义级的语音文档检索 218

9.5.1语音文档检索的预处理技术 218

9.5.2语音文档检索的索引和搜索技术 220

9.6语音文档检索中的容错技术 224

9.6.1基于模糊匹配策略的容错方法 224

9.6.2基于融合策略的容错方法 225

9.6.3基于扩充网络的容错方法 226

9.6.4基于词片语言模型的容错方法 226

9.7说话人检索 227

9.7.1说话人检索 227

9.7.2说话人语音分割 228

9.7.3检索中的说话人识别技术 228

9.7.4直接利用说话人识别实现的检索技术 228

9.7.5间接利用说话人识别实现的检索技术 229

9.8本章小结 229

9.9习题 231

第10章 视频检索技术 232

10.1视频检索技术研究现状 232

10.2数字视频的相关基础知识 233

10.2.1数字视频的基本概念 233

10.2.2数字视频模型 234

10.2.3数字视频的特点 235

10.3基于内容的视频检索系统结构 235

10.4视频镜头分割 236

10.4.1非压缩域的镜头分割方法 237

10.4.2压缩域中镜头分割方法 239

10.4.3镜头切换 240

10.5关键帧提取及语义提取 240

10.5.1关键帧提取的基本原理和准则 241

10.5.2关键帧提取的方法 241

10.5.3视频语义提取 243

10.6视频特征提取 243

10.6.1全局运动矢量的计算方法 244

10.6.2运动估计数学模型 245

10.6.3两类运动估计 245

10.6.4运动矢量估计的常用算法 248

10.7视频聚类 252

10.8视频结构索引 253

10.8.1视频结构索引的机制 253

10.8.2索引信息的存储 254

10.9视频摘要 255

10.9.1视频摘要的基本概念 255

10.9.2视频摘要的分类 255

10.9.3视频概要的实现技术 256

10.9.4缩略视频的实现技术 256

10.9.5视频摘要的应用 257

10.10视频语义检索模型 258

10.10.1底层特征提取模块 259

10.10.2底层特征向高层语义映射模块 259

10.10.3视频语义查询模块 260

10.10.4语义词典的应用 260

10.11典型的视频检索系统 260

10.12视频检索技术研究领域存在的主要困难 261

10.13本章小结 262

10.14习题 263

第11章Web搜索技术 265

11.1搜索引擎概述 265

11.1.1搜索引擎基本结构 265

11.1.2传统搜索引擎基本类型 266

11.1.3智能搜索引擎基本类型 267

11.2搜索引擎主要支撑技术 271

11.2.1分词技术 271

11.2.2网络蜘蛛 272

11.2.3索引技术 272

11.2.4词频相关指数 273

11.2.5自动推理技术 273

11.2.6本体知识系统 273

11.2.7专家系统 274

11.3 Web采集 275

11.3.1 Web采集概述 275

11.3.2采集器的功能与特点 275

11.3.3 Web采集 276

11.3.4 DNS解析 278

11.3.5待采集URL池 280

11.3.6分布式索引 281

11.3.7 Web图 284

11.4主要网页排序算法 286

11.4.1 PageRank网页排序算法 286

11.4.2 Topic-Sensitive PageRank算法 287

11.4.3 Hilltop算法 287

11.4.4 HITS算法 288

11.4.5 SALSA算法 289

11.4.6 BFS算法 289

11.4.7 PHITS算法 290

11.5 PageRank算法基本原理 290

11.5.1基本PageRank 290

11.5.2扩展的PageRank 296

11.5.3 PageRank的性质 301

11.6本章小结 304

11.7习题 304

参考文献 306