《情报学视域下的数据研究 理论、原理与方法》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:曹祺著
  • 出 版 社:武汉:武汉大学出版社
  • 出版年份:2018
  • ISBN:9787307205970
  • 页数:217 页
图书介绍:本书主要介绍数据管理和数据分析以及新技术对情报学数据管理的启发。情报学数据分为元数据和全文数据两种,元数据管理相对简单,全文数据管理相对复杂。其中第二章、第三章介绍元数据部分,全文数据的管理分为数据存储和数据渲染,在第四章、第五章、第六章介绍数据存储原理,在第七章、第八章、第九章介绍数据渲染原理。接着对数据分析进行介绍了,分为分析可视化,分析理论和分析方法三个章节,其中第十章介绍可视化原理,第十一章介绍数据分析理论,第十二章介绍数据分析方法。最后第十三章介绍区块链技术和情报学的结合。

第1章 引言 1

第2章 元数据管理研究 2

2.1 Handle系统 2

2.2 DOI系统 7

2.3 元数据溯源研究 20

第3章 全文数据管理研究:专利数据为例 31

3.1 专利全文数据 31

3.2 专利文件结构 33

3.3 专利数据清洗 40

第4章 页式全文数据存储原理:PDF为例 42

4.1 对象树 42

4.2 图像 42

4.3 坐标系统 43

4.4 内联图片 45

第5章 流式全文数据存储原理:WORD为例 47

5.1 复合文档存储原理 47

5.2 流式数据对象分类 48

5.3 文本内容数据存储原理 50

5.4 文本样式数据存储原理 53

5.5 段落及其样式数据存储原理 56

5.6 表格及其样式数据存储原理 61

5.7 图片及其样式数据存储原理 64

5.8 列表及其样式数据存储原理 64

5.9 默认样式数据存储原理 66

5.10 章节数据存储原理 69

5.11 书签数据存储原理 71

5.12 页眉、页脚数据存储原理 72

5.13 艺术图像数据存储原理 72

第6章 数据库系统存储原理:专利数据为例 75

6.1 基于关系型数据库的数据管理 75

6.2 基于XML数据库的数据管理 76

第7章 页式全文数据渲染原理:PDF为例 78

7.1 相关概念 78

7.2 页式渲染器文档结构模型 79

7.3 页式渲染器元件绘制原理 83

7.4 页式渲染器视图绘制原理 84

7.5 分页原理 89

第8章 流式全文数据渲染原理:WORD为例 91

8.1 流式渲染器和页式渲染器的区别 91

8.2 流式渲染器视图绘制原理 92

8.3 流式渲染器元件绘制原理 96

第9章 流式全文数据编辑原理:WORD为例 98

9.1 编辑器实现原理 98

9.2 编辑器坐标转换原理 100

9.3 编辑器光标绘制原理 101

9.4 编辑器光标定位原理 102

9.5 编辑器创建保存原理 103

9.6 编辑器视图设计原理 103

9.7 编辑器局部刷新原理 105

9.8 编辑器的撤销删除原理 106

9.9 编辑器的测试与优化 108

第10章 数据分析可视化研究:专利数据为例 117

10.1 可视化工具 117

10.2 结构可视化 117

10.3 关键词词频可视化 119

10.4 网络可视化 120

10.5 关键词降维可视化 121

10.6 关键词词频趋势可视化 125

第11章 数据分析理论研究:专利数据为例 127

11.1 NLP技术与专利 127

11.2 专利文本挖掘相关理论 130

11.3 TRIZ理论及其相关理论 149

第12章 数据分析方法研究:专利数据为例 155

12.1 基于NLP技术的词频分析法 155

12.2 基于TRIZ理论的词法分析法 168

12.3 网络分析法 190

第13章 数据传播网络应用研究 198

13.1 数据评价网络的应用研究:论文评议为例 198

13.2 数据发布网络的应用研究:公文传播为例 208