《转折 在情境中集成信息查寻与检索》PDF下载

  • 购买积分:14 如何计算积分?
  • 作  者:张新民等编译
  • 出 版 社:北京:科学技术文献出版社
  • 出版年份:2007
  • ISBN:7502356746
  • 页数:439 页
图书介绍:本书在分析信息查导与检索研究的基础上,提出了信息查导和信息检索的集成研究的新途径,在广泛的IS&R领域首次实现了研究的集成——从系统导向的实验室信息检查研究到社科学导向的信息查导研究。

1 引言 1

1.1 动机与目的 2

1.2 基于实验室的信息检索评价 4

1.3 基于实验室的信息检索评价中存在的问题 6

1.4 基于实验室的信息检索评价的扩展 9

1.5 信息查寻与检索领域中的模型 10

1.6 本书的结构 15

1.7 一些重要概念 17

1.7.1 信息查寻与检索的组件或参与者 17

1.7.2 任务 18

1.7.3 内容 18

1.7.4 需求与相关性 19

1.7.5 过程 19

2 信息的认知框架 21

2.1 认知观 21

2.1.1 认知观的核心思想 23

2.1.2 个体主义认知观 26

2.1.3 整体主义认知观 27

2.1.4 情境在个体认知中的作用 28

2.2 信息查寻与检索中的认知信息概念 29

2.2.1 认知模型的特性 31

2.2.2 自动标引:“中国房子”案例 32

2.2.3 认知失落与重建 34

2.2.4 其他重要的信息概念 36

2.2.5 与条件信息认知概念的关系 39

2.3 认知信息概念的含义 40

2.3.1 信息与意义 40

2.3.2 信息查寻与检索中的基本知识类型 44

2.4 信息采集:从感知数据到科学发现 45

2.4.1 从未知的信号中采集信息 46

2.4.2 从感知数据中采集信息:Okawango探险 47

2.4.3 从科学发现中采集信息 50

3 信息查寻研究进展 52

3.1 研究问题与发现 53

3.1.1 文献综述 53

3.1.2 信息查寻模型 55

3.1.3 理论的演进 67

3.1.4 实验发现 74

3.2 研究方法 80

3.2.1 研究策略 81

3.2.2 数据采集方法 83

3.2.3 数据分析方法 90

3.2.4 非实验性研究的方法学 94

3.3 局限性和有待解决的问题 95

3.3.1 理论的发展和局限 95

3.3.2 实验性研究的发展和局限 100

3.3.3 方法论的发展和局限 101

4 系统导向的信息检索 102

4.1 系统导向的信息检索研究中的模型 105

4.2 系统导向的信息检索研究的主要进展 110

4.3 文献、请求和相关性:问题与发现 113

4.3.1 文献 113

4.3.2 请求 116

4.3.3 相关性评价 118

4.4 标引、分类和聚类:问题与发现 119

4.5 界面与可视化:问题与发现 124

4.6 交互与提问式修改:问题与发现 128

4.6.1 提问式修改时的相关反馈 129

4.6.2 基于集合相依的知识结构的提问式修改 131

4.6.3 基于本体的提问式修改 132

4.6.4 提问式修改中的结构化提问式 134

4.6.5 实用型系统交互研究中的提问式修改 138

4.7 自然语言处理:问题与发现 138

4.7.1 自然语言处理的层次 140

4.7.2 信息检索中的形态学分析 141

4.7.3 信息检索中的句法与消歧问题 143

4.7.4 信息检索中的语义分析和话语分析 146

4.7.5 信息检索中自然语言处理的三个抽象层次 147

4.8 用于信息检索的专家系统和界面:问题与发现 149

4.8.1 信息检索专家系统的知识与功能 150

4.8.2 I3R——信息检索专家系统的一个实例 152

4.8.3 信息检索专家系统的问题与发现 155

4.9 研究方法 156

4.9.1 实验室评价研究 157

4.9.2 实用系统评价研究 160

4.9.3 TREC的交互式检索实验 162

4.10 新的测试集和性能指标 163

4.10.1 评价指标:相对相关性和排序半衰期 164

4.10.2 评价指标:泛化的查全率与查准率 165

4.10.3 评价指标:累积收益率 166

4.11 局限性和有待解决的问题 170

5 认知与用户导向的信息检索 174

5.1 认知信息检索研究的模型 178

5.1.1 早期的信息检索交互模型 178

5.1.2 认知信息检索研究的模型 180

5.2 认知信息查寻与检索理论构建:ASK-多元表示:问题与发现 186

5.2.1 Taylor的信息需求形成阶段及五个过滤器 186

5.2.2 ASK假说 187

5.2.3 多元表示的原理 188

5.2.4 多元表示的实验证据 191

5.3 检索者行为、认知模型与风格——问题与发现 195

5.4 标准的联机信息检索交互——问题及发现 199

5.4.1 检索策略及Bates的“拾野莓”方法 199

5.4.2 人类中介的行为 200

5.4.3 终端用户联机信息检索交互研究 202

5.4.4 联机检索效果的解释 203

5.4.5 基于任务的交互式信息检索的发现 205

5.5 Web信息检索中的交互 206

5.5.1 大型搜索引擎研究 206

5.5.2 以用户为中心的调查 208

5.5.3 儿童在Web上的搜索行为 210

5.5.4 数字图书馆研究 211

5.6 与检索者关联的最佳匹配信息检索交互 211

5.6.1 交互式OKAPI的实验 212

5.6.2 新一代交互式最佳匹配实验 213

5.7 相关性:问题与发现 215

5.7.1 早期的相关性研究 215

5.7.2 相关性的维度 216

5.7.3 分析性和理论性的相关性研究进展 217

5.7.4 重要的相关性实验研究 221

5.8 研究方法 224

5.8.1 研究中的变量和策略 225

5.8.2 数据采集方法 226

5.8.3 数据分析方法 228

5.9 交互式信息检索的评价方法:工作任务情景仿真 231

5.10 主要成就、局限性和有待解决的问题 234

5.10.1 局限性和有待解决的问题 235

6 集成的信息查寻与检索(IS&R)研究框架 239

6.1 建立理论框架 243

6.1.1 信息对象的作者 244

6.1.2 标引员——使信息对象增值的人 245

6.1.3 作为系统界面和IT算法设计者的认知行动者 248

6.1.4 选择者——负责使信息对象具有可获得性和可存取性的行动者 250

6.1.5 信息查寻者——感知数据的采集者 251

6.2 理解IS&R的复杂性 252

6.2.1 信息查寻者:IS&R框架中的主要行动者 255

6.2.2 当前状态与情境模型 256

6.2.3 工作任务和检索任务 260

6.2.4 任务框架中的知识类型 262

6.2.5 IS&R框架中工作任务和检索任务的复杂性 264

6.2.6 从工作任务到检索任务中信息需求的形成 267

6.2.7 标识效应 272

6.2.8 IS&R框架中的核心流程——交互 276

6.2.9 IS&R效果评价中的认知利用 280

6.3 IS&R模型特点总结 281

6.3.1 IS&R认知框架的主要特征 281

6.3.2 作为元理论模型的IS&R认知框架 283

6.3.3 IS&R认知研究框架的评价 284

7 信息查寻与检索(IS&R)认知框架的含义 287

7.1 IS&R的设计与评估框架 290

7.1.1 孤立的信息检索研究 292

7.1.2 孤立的信息查寻研究 294

7.1.3 IS&R设计与评估框架 295

7.2 组织任务维度的变量 297

7.2.1 IS&R任务的表示——检索任务变量 300

7.2.2 信息检索研究的问题:获取任务类型及其表示形式 301

7.2.3 信息查寻研究:获取工作任务情境 302

7.3 行动者和感知到的任务维变量 305

7.3.1 行动者认知空间的多元表示 308

7.3.2 信息检索研究:获取检索者和信息需求的证据 309

7.3.3 对信息需求不变性的假设 310

7.3.4 信息查寻研究:从检索者认知空间中获取证据 313

7.4 文献和来源类型:变量范围 314

7.4.1 信息对象的多元表示 315

7.4.2 信息检索研究:获取文献及其来源的证据 316

7.4.3 信息查寻研究:获取文献及其来源的证据 316

7.5 算法与系统组件:各个维度的变量 317

7.5.1 信息检索研究:获取算法与系统组件的证据 318

7.5.2 文献组件的多元表示和通过认知空间表述的多元表示 319

7.5.3 对特征(术语)独立性的假设 321

7.5.4 信息查寻研究:获取算法与系统组件的证据 323

7.6 访问类型:交互方面的变量 324

7.6.1 信息检索研究:获取访问与交互方面的证据 325

7.6.2 独立的相关性评估假设 326

7.6.3 信息查寻研究:获取有关访问与交互方面的证据 327

7.7 多维研究设计模块 329

8 迈向新的研究计划 331

8.1 信息对象、IT和自然任务情境 333

8.2 信息对象、IT和行动者 336

8.2.1 替代性的研究问题 339

8.3 信息对象、界面和行动者 340

8.4 界面、行动者和社会组织情境 342

8.5 方法论问题的说明与小结 346

9 结论 349

名词解释 352

参考文献 364

中英文术语对照表 423

图1.1 实验室模型系统化表达 5

图1.2 实验室模型的验证(Kek?l?inen&J?rvelin 2002a) 6

图1.3 检索中的情景相关性(Kek?l?inen&J?rvelin 2002a) 9

图2.1 情报学、信息查寻与IR中的认知通信系统 31

图2.2 “中国房子”案例转换为一个自动标引场景 33

图2.3 作者理解的波普尔的“三个世界”理论 45

图2.4 日语文本示例 46

图2.5 简化的科学发现阶段 50

图3.1 意义建构法示意图(基于Dervin 1983) 57

图3.2 Ellis的特征集过程图(Wilson 1999) 60

图3.3 Kuhlthau模型示意图(1991) 61

图3.4 Wilson的信息模型(1997) 63

图3.5 Bystr?m和J?rvelin的信息查寻表面模型(1995) 64

图3.6 Bystr?m—J?rvelin的信息查寻模型(1995) 65

图3.7 话语分析 67

图3.8 任务复杂性分类(Bystr?m和J?rvelin 1995) 70

图3.9 任务目标、任务过程、信息和信息查寻以及信息系统之间的相互作用 73

图3.10 Bystr?m和J?rvelin的日志形式(1995) 87

图3.11 Bystr?m和J?rvelin的工作图 88

表3.1(a) 两个常规决策任务的实际流程表 92

表3.1(b) 两个常规决策任务的实际流程表(a)和思考过程表(b)(Bystr?m&J?rvelin 1995) 93

图4.1 信息检索的基本实验室模型 106

图4.2(a) 精确匹配模型及其细分(由Belkin和Croft 1987扩展) 107

图4.2(b) 最佳匹配模型(由Belkin和Croft 1987扩展) 107

图4.3 基于特征的文献表示方法的分类 115

图4.4 文本检索的请求表示方法的分类 118

表4.1 按类型划分的检索点(源于2001年Hj?rland和Nielsen的例子) 122

图4.5 界面分析维:表示的对象类型、提供的功能类型 125

图4.6 提问式扩展类型(Efthimiakis 1996) 129

图4.7 提问式结构的类型 135

图4.8(a) 弱相关文献 136

图4.8(b) 强相关文献 137

图4.9 提问式构造与扩展的抽象层 148

图4.10 信息传递的认知模型(Ingwersen 1992;1996) 150

图4.11 信息检索专家系统的主要知识结构(Ingwersen,1992) 151

图4.12 中介模型的13种主要功能(Ingwersen 1992,p204) 152

图4.13 I3R的结构(Croft 1986) 153

图4.14 I3R中的专家(Croft和Thompson 1987) 154

表4.2 I3R中所用的模型、数据结构和工具 154

表4.3 信息检索实验中的实验设置 158

图4.15 平均CG与DCG向量可视化的例子 168

图4.16 平均的标准DCG向量可视化的例子 169

图5.1 信息检索的研究领域(Ingwersen和Wormell 1989年) 174

图5.2 信息行为的嵌套模型(改自威尔逊,1999) 180

图5.3 工作任务与检索任务执行中的阶段(Vakkari 2001b) 182

图5.4 文献选择决策阶段(Wang与Soergel 1998,p118) 184

图5.5 学术文献多元表示或多元证据原理 189

图5.6 对于一个由关键词A构成的组面和另一个文献特征,传统的布尔联机信息检索(左)与基于多元表示的检索(右)的差别 190

图5.7 主要的相关性关系类型示意图 218

图5.8 检索有关‘技术起草人’的信息的口头草案语段 229

图5.9 工作任务情景仿真实例(Borlund 2000a-b) 232

图5.10 六种情景A-F、两个系统X-Y和6个测试人1—6的排列 233

图6.1 交互式信息查寻、检索及行为过程 241

图6.2 与IS&R相关的信息对象-作者认知模型 244

图6.3 IS&R中负责信息对象自动标引的认知行动者的认知模型 247

图6.4 独立于现有情境中信息系统之外的一个逻辑-物理实体界面的设计情境 248

图6.5 一个独立的情境中的信息检索系统配置中的界面设计 249

图6.6 计划委员会成员的信息选择示例 251

图6.7 从自然中采集科学信息的认知框架 252

图6.8 长期性IS&R的认知框架 253

图6.9 以信息查寻者为中心的IS&R认知框架核心组件 256

图6.10 IS&R中的情境层次嵌套模型 258

表6.1 任务类型维度定义的知识类型和技能矩阵 262

表6.2 从三个维度定义的固有信息需求类型 268

图6.11 与感知到的工作任务状态相关的查寻任务的复杂性 271

表6.3 IS&R过程中八种信息需求中的四种人类本质信息需求矩阵 274

图6.12 情境中的IS&R短期交互情景 278

图7.1 传统IS&R研究关注的焦点 289

图7.2 基于任务的IS&R的嵌套情境与评价标准 293

图7.3 通过IS&R加强工作任务的绩效 298

表7.1 按知识类型和经验级别划分的查寻行动者类型 306

图7.4 多元表示的连续统 320

图7.5 建立在两个引擎之上的多元表示 321

表7.2 九个IS&R研究变量的研究设计模块 329

表8.1 在扩展的实验室实验中考察的独立变量(深色阴影)和受控变量(浅色阴影) 335

表8.2 独立变量(深色阴影)和受控变量(浅色阴影)在交互式信息检索实验中的组合 338

表8.3 独立变量(深色阴影)和受控变量(浅色阴影)在交互式信息检索实验中的组合 342

表8.4 在研究社会-组织情境中的界面和行动者时要考察的独立变量(深色阴影)和受控变量(浅色阴影) 344