第1章 引言 1
第2章 元数据管理研究 2
2.1 Handle系统 2
2.2 DOI系统 7
2.3 元数据溯源研究 20
第3章 全文数据管理研究:专利数据为例 31
3.1 专利全文数据 31
3.2 专利文件结构 33
3.3 专利数据清洗 40
第4章 页式全文数据存储原理:PDF为例 42
4.1 对象树 42
4.2 图像 42
4.3 坐标系统 43
4.4 内联图片 45
第5章 流式全文数据存储原理:WORD为例 47
5.1 复合文档存储原理 47
5.2 流式数据对象分类 48
5.3 文本内容数据存储原理 50
5.4 文本样式数据存储原理 53
5.5 段落及其样式数据存储原理 56
5.6 表格及其样式数据存储原理 61
5.7 图片及其样式数据存储原理 64
5.8 列表及其样式数据存储原理 64
5.9 默认样式数据存储原理 66
5.10 章节数据存储原理 69
5.11 书签数据存储原理 71
5.12 页眉、页脚数据存储原理 72
5.13 艺术图像数据存储原理 72
第6章 数据库系统存储原理:专利数据为例 75
6.1 基于关系型数据库的数据管理 75
6.2 基于XML数据库的数据管理 76
第7章 页式全文数据渲染原理:PDF为例 78
7.1 相关概念 78
7.2 页式渲染器文档结构模型 79
7.3 页式渲染器元件绘制原理 83
7.4 页式渲染器视图绘制原理 84
7.5 分页原理 89
第8章 流式全文数据渲染原理:WORD为例 91
8.1 流式渲染器和页式渲染器的区别 91
8.2 流式渲染器视图绘制原理 92
8.3 流式渲染器元件绘制原理 96
第9章 流式全文数据编辑原理:WORD为例 98
9.1 编辑器实现原理 98
9.2 编辑器坐标转换原理 100
9.3 编辑器光标绘制原理 101
9.4 编辑器光标定位原理 102
9.5 编辑器创建保存原理 103
9.6 编辑器视图设计原理 103
9.7 编辑器局部刷新原理 105
9.8 编辑器的撤销删除原理 106
9.9 编辑器的测试与优化 108
第10章 数据分析可视化研究:专利数据为例 117
10.1 可视化工具 117
10.2 结构可视化 117
10.3 关键词词频可视化 119
10.4 网络可视化 120
10.5 关键词降维可视化 121
10.6 关键词词频趋势可视化 125
第11章 数据分析理论研究:专利数据为例 127
11.1 NLP技术与专利 127
11.2 专利文本挖掘相关理论 130
11.3 TRIZ理论及其相关理论 149
第12章 数据分析方法研究:专利数据为例 155
12.1 基于NLP技术的词频分析法 155
12.2 基于TRIZ理论的词法分析法 168
12.3 网络分析法 190
第13章 数据传播网络应用研究 198
13.1 数据评价网络的应用研究:论文评议为例 198
13.2 数据发布网络的应用研究:公文传播为例 208