《多语言网络学术信息挖掘与检索》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:吴丹著
  • 出 版 社:北京:科学出版社
  • 出版年份:2014
  • ISBN:9787030410207
  • 页数:229 页
图书介绍:本书对多语言网络学术信息资源的利用进行了以下四个方面的理论与实践研究:(1)多语言网络学术信息用户需求与行为研究。就两类网络学术信息资源--数字图书馆和新型网络学术信息资源,展开多语言用户需求与行为调查。(2)多语言网络学术信息表示与规范方法研究。对能够提供学术信息的新型网站,包括图书标注系统、学术论文标注系统、学术博客等的社会标签与主题词表的进行比较实验。(3)多语言网络学术信息翻译与测评技术研究。以图书情报领域为例,构建了两个图书情报领域的语义词典和一套图书情报领域多语言学术信息检索测评体系。(4)多语言网络学术信息检索系统实现与实验研究。开发了一个多语言网络学术信息检索系统Milk-Tea,并进一步进行了跨语言信息检索实验。

第一章 网络学术信息概述 1

第一节 网络学术交流方式 2

一、正式的网络学术信息交流方式 2

二、半正式的网络学术信息交流方式 3

三、非正式的网络学术信息交流方式 4

第二节 网络学术信息的特点 6

第三节 网络学术信息的组织 7

一、数据库 8

二、学术搜索引擎 8

三、数字图书馆 8

四、用户标注 9

第四节 未来网络学术信息的无缝获取——cyberscholarship 9

第五节 多语言网络学术信息研究述评 10

本章参考文献 13

第二章 多语言网络学术信息用户需求与行为调查 16

第一节 网络学术信息的用户研究 16

一、用户使用信息资源的类型 17

二、不同国家用户的信息行为 18

三、大学生的信息行为 18

四、团队的信息行为 19

第二节 数字图书馆用户的多语言信息需求与期望调查 20

一、调查目的 20

二、问卷设计 21

三、调查对象 22

四、问卷信度和效度测试 23

五、问卷结果统计分析 24

第三节 用户与新型网络学术信息资源的交互行为调查 34

一、调查目的 34

二、问卷设计 35

三、调查对象 36

四、问卷结果统计分析 37

第四节 用户对多语言网络学术信息的需求与行为分析 45

一、用户对多语言网络学术信息的需求 45

二、用户对多语言网络学术信息的行为 47

第五节 本章小结 48

本章参考文献 49

第三章 多语言网络学术信息标签规范与挖掘 53

第一节Web2.0环境下的网络学术信息资源 53

一、图书标注系统 53

二、学术论文标注系统 55

三、学术博客 57

第二节 社会标签——网络学术信息表示的新方法 58

一、社会标签在网络学术信息表示中的作用 59

二、社会标注与主题标引的比较 61

第三节 中英文学术资源网站的社会标签规范性测评实验——以图书情报领域为例 63

一、图书标注的规范性测评 63

二、学术论文标注的规范性测评 76

三、学术博客标注的规范性测评 81

第四节 网络学术信息表示的规范控制方法 85

一、图书标注规范性控制 86

二、学术论文标注规范性控制 87

三、学术博客标注规范性控制 89

第五节 本章小结 90

本章参考文献 90

第四章 多语言网络学术信息翻译资源与测评体系构建 93

第一节 多语言网络学术信息检索的关键技术 93

一、跨语言信息检索技术 93

二、机器翻译技术 97

三、跨语言信息检索评价体系 98

第二节 翻译资源及其构建方法 100

一、双语词典 100

二、双语语料库 102

三、机器翻译系统 103

四、多语叙词表 104

五、多语本体 105

第三节 图书情报领域多语言学术信息的翻译资源构建 107

一、专业术语翻译的特点 107

二、图书情报领域中英文专业词典构建 108

三、图书情报领域中英文标注词典构建 112

四、词典构建的特点 113

第四节 图书情报领域多语言学术信息的检索测评体系构建 114

一、测试文档集建立 114

二、检索主题设计 117

三、标准答案集构建 122

四、该测评体系的特点 126

第五节 本章小结 126

本章参考文献 127

第五章 多语言网络学术信息检索系统实现 130

第一节 系统实现的流程与环境 130

一、系统实现的流程 131

二、系统实现的环境 132

第二节 系统相关资源与算法 132

一、系统语料 132

二、翻译资源 132

三、查询翻译 134

四、检索模块 134

五、检索结果翻译 136

第三节 系统主要功能及界面 137

一、用户管理 137

二、图书情报领域多语言学术信息检索测评 140

三、图书情报领域跨语言学术信息检索 140

第四节 本章小结 145

本章参考文献 145

第六章 多语言网络学术信息检索实验 146

第一节 自动检索实验设计 146

一、实验目的 146

二、评价指标 147

第二节 自动检索实验结果分析 148

一、短查询实验结果 148

二、长查询实验结果 151

第三节 用户检索实验设计 153

一、实验目的 153

二、检索主题选择 154

三、系统界面及参数设置 154

四、实验用户确定 155

五、实验步骤 157

第四节 用户检索实验结果分析——系统检索性能 157

一、平均NDCG值 158

二、最佳NDCG值 160

三、用户实验的NDCG值与自动实验的比较 163

第五节 用户检索实验结果分析——用户评价 166

一、用户背景 167

二、用户对每次检索的评价 168

三、用户对 Milk-Tea的综合评价 170

第六节 用户检索实验结果分析——用户行为 171

一、针对每个检索主题的用户行为分析 171

二、针对每个查询式的用户行为分析 174

第七节 实验结论 177

一、自动检索实验结论 177

二、用户检索实验结论 178

本章参考文献 178

附录 180

附录1数字图书馆用户的多语言信息需求与期望调查问卷(中文版) 180

附录2数字图书馆用户的多语言信息需求与期望调查问卷(英文版) 185

附录3用户与新型网络学术信息资源的交互行为调查问卷(中文版) 191

附录4用户与新型网络学术信息资源的交互行为调查问卷(英文版) 194

附录5用于“中英文学术资源网站的社会标签规范性测评实验”的图书情报领域中英文检索词 198

附录6 50个图书情报领域检索主题的部分字段(中文) 199

附录7 50个图书情报领域检索主题的部分字段(英文) 207

附录8用于用户检索实验的10个图书情报领域检索主题的全部字段(中文) 218

附录9 Milk-Tea用户检索实验调查问卷 223

后记 229