《XML非完全结构查询技术》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:李晓光编
  • 出 版 社:北京:北京师范大学出版社
  • 出版年份:2011
  • ISBN:9787303119462
  • 页数:184 页
图书介绍:本书较全面、系统地介绍了XML非完全结构查询技术,全书共分为七章,主要内容包括:第1章介绍传统的XML查询处理技术;第2章概要介绍XML非完全结构查询的背景、关键研究技术和当前研究现状;第3章介绍XML非完全结构查询的有意义查询结果判断技术;第4章介绍高效处理NFS查询的方法和技术;第5章介绍NFS查询结果聚类方法;第6章介绍基于模型的非偏斜文档聚类方法;第7章介绍基于信息论的潜在概念与文档聚类方法。

第1章XML查询处理技术 1

1.1XML文档标准 1

1.1.1XML简介 1

1.1.2DTD 4

1.1.3XSD 7

1.2XML文档模型 10

1.2.1对象交换模型(OEM) 10

1.2.2文档对象模型(DOM) 11

1.3完全结构下的XML查询技术 12

1.3.1FS查询模型 12

1.3.2XPath 13

1.3.3XQuery 17

1.3.4FS模型比较 19

1.4基于编码的XML查询技术 21

1.4.1XML编码技术 21

1.4.2基于编码的结构连接方法 23

1.5基于结构索引的XML查询技术 24

第2章非完全结构下的XML查询概述 27

2.1背景与动机 27

2.2NFS查询关键技术 29

2.3XML检索查询模型 32

2.3.1基于关键字的查询模型 32

2.3.2基于标签和关键字的查询模型 33

2.4FS查询扩展 34

2.5NFS查询模型 38

第3章有意义的NFS查询结果 40

3.1一致文档片段 40

3.2Interconnection关系 42

3.3有意义的最近公共祖先 43

3.4最小全部目标对象网(MTTON) 45

3.5PE模型 48

3.5.1讨论 48

3.5.2相关概念 49

3.5.3PE模式和实体 50

3.5.4PE规则 52

3.5.5等价模式和等价查询项 53

3.5.6比较分析 54

3.6GPE模型 57

3.6.1概念与定义 59

3.6.2GPE模式与实体 59

3.6.3GPE规则 60

3.6.4GPE等价模式 61

3.6.5性能分析 63

第4章NFS查询处理关键技术 66

4.1Interconnection关系计算 66

4.2MLCAS计算 67

4.2.1Timber 68

4.2.2基于图的MLCA求解方法 72

4.3PE模型计算 82

4.3.1XML编码 82

4.3.2PE索引 83

4.3.312P倒排索引 84

4.3.4判别方法 85

4.3.5算法设计 86

4.3.6比较分析 91

4.4L(k)-index 95

4.4.1基于k双拟的结构索引 96

4.4.2基本概念与定义 97

4.4.3L(k)-index索引结构 98

4.4.4查询处理 101

4.4.5L(k)-index创建与更新 101

4.4.6性能分析 109

第5章NFS查询结果聚类 114

5.1引言 114

5.2文档特征降维技术 115

5.2.1特征选取技术 116

5.2.2基于概念的降维技术 118

5.3基于传统聚类技术的文档聚类方法 120

5.3.1基于相似性的聚类方法 120

5.3.2基于模型的聚类方法 123

5.3.3基于划分的聚类方法 124

5.3.4基于层次的聚类方法 126

5.4面向文档特性的聚类方法 126

5.4.1潜在语义分析 127

5.4.2基于信息论的文档聚类方法 128

5.4.3双向聚类方法 131

5.5聚类质量评价方法 132

第6章基于模型的非偏斜文档聚类方法 134

6.1引言 134

6.2相关工作 135

6.2.1基于多项式分布的硬聚类 135

6.2.2基于平衡约束的聚类方法 136

6.3聚类偏斜的分析 137

6.3.1相关概念与定义 137

6.3.2聚类偏斜产生的原因 138

6.4MMPClust聚类方法 140

6.4.1基于内容特性的簇模型 141

6.4.2估计样本选取 142

6.4.3MMPClust算法 145

6.5实验分析 147

6.5.1数据集 147

6.5.2实验方法与评价方法 148

6.5.3实验结果与分析 148

6.6小结 153

第7章基于信息论的潜在概念获取与文档聚类方法 154

7.1相关工作 154

7.2模型提出 156

7.2.1词、潜在概念、文档和主题的关系 156

7.2.2模型描述 157

7.3模型求解 159

7.3.1给定β下目标函数求解 160

7.3.2潜在概念个数确定 165

7.3.3算法设计 165

7.4实验分析 167

7.4.1数据集和实验方法 167

7.4.2性能分析 168

7.5小结 171

参考文献 173