当前位置:首页 > 工业技术
关系Top-N查询处理和优化
关系Top-N查询处理和优化

关系Top-N查询处理和优化PDF电子书下载

工业技术

  • 电子书积分:10 积分如何计算积分?
  • 作 者:朱亮著
  • 出 版 社:北京:科学出版社
  • 出版年份:2018
  • ISBN:9787030588999
  • 页数:201 页
图书介绍:Top-N查询(也称Top-K查询,排序查询或kNN查询等)检索出N个元组使其最好地匹配,但不一定完全匹配查询条件,并按指定的排序函数对输出的结果集合排序。本书主要内容包括三类Top-N查询的处理和优化。1.基于数值属性的Top-N查询,即“数值Top-N查询”包括:(1)基于学习的Top-N查询处理方法;(2)基于区域聚类的多Top-N查询优化;(3)Top-N查询流处理和优化。2.对于文本属性,在数据库中对关键词搜索得到Top-N结果,即“关键词Top-N查询”。3.对于具有自然语言语义的文本属性,基于语义相似度/语义距离的Top-N查询,即“语义Top-N查询”。
《关系Top-N查询处理和优化》目录

第1章 绪论 1

1.1数学概念和术语 1

1.1.1集合及其运算 2

1.1.2度量空间 4

1.2关系数据库 8

1.2.1关系模式 8

1.2.2关系代数 10

1.2.3规范化理论 13

1.2.4关系模式的分解 17

1.3 Top-N查询模式 19

1.3.1距离空间KNN查询 19

1.3.2单调排序函数的Top-K查询 20

1.3.3数值属性的关系Top-N查询 22

参考文献 26

第2章 基于学习的Top-N查询处理 28

2.1关系Top-N查询处理 28

2.1.1基于直方图的方法 30

2.1.2基于抽样的方法 31

2.1.3数据维数对查询处理的影响 32

2.2基于学习的Top-N查询处理方法 33

2.2.1查询信息的存储 33

2.2.2新提交查询的处理 34

2.2.3知识库P的维护 38

2.2.4知识库P的稳定性 40

2.3实验与数据分析 43

2.3.1数据集和准备 43

2.3.2性能比较 46

2.3.3 LB方法的其他实验 48

2.3.4重复查询的效果 52

2.3.5知识库的稳定性 53

2.4本章小结 58

参考文献 59

第3章 基于区域聚类的多Top-N查询优化 61

3.1问题分析 61

3.2区域聚类 64

3.2.1算法和术语 65

3.2.2区域聚类模型 71

3.3多个Top-N查询搜索区域的聚类 73

3.4 Top-N元组检索 76

3.4.1搜索Top-N元组 76

3.4.2确保获得Top-N元组 77

3.5实验与数据分析 78

3.5.1数据集和准备 78

3.5.2通过训练确定聚类模型和阈值 80

3.5.3性能比较 82

3.6本章小结和相关研究 87

参考文献 88

第4章 基于知识库的Top-N查询流处理 89

4.1问题分析 89

4.2 Top-N查询流的处理 92

4.2.1术语和结构 93

4.2.2 LRC方法与LB和RCM的对比 94

4.2.3知识库的创建 95

4.2.4处理新提交的Top-N查询 98

4.2.5确保得到所有Top-N元组 100

4.3知识库的维护 101

4.3.1简档集合P的维护 101

4.3.2 ?和t-List的维护 101

4.4性能分析 101

4.4.1空间开销 101

4.4.2时间开销 102

4.5实验与数据分析 103

4.5.1数据集和准备 104

4.5.2耗用时间 105

4.5.3 I/O请求次数 109

4.5.4检索元组的数目 110

4.5.5知识库的空间开销 113

4.5.6查询结果不同N值的影响 114

4.5.7实验小结 116

4.6本章小结 116

参考文献 117

第5章 基于语义距离的Top-N查询处理 118

5.1亲缘词和语义距离 120

5.1.1亲缘词 120

5.1.2语义距离和Top-N查询 121

5.1.3排序方式比较 124

5.2查询的语义搜索 125

5.2.1索引创建过程 126

5.2.2 w-索引的结构和创建 129

5.2.3 w-索引的维护 131

5.2.4查询处理 131

5.3实验与数据分析 135

5.3.1数据集和准备 135

5.3.2实验结果 138

5.4本章小结 144

参考文献 144

第6章 基于索引技术的中文关键词Top-N查询处理 146

6.1引言 146

6.2相关工作 149

6.3索引和索引表 150

6.3.1索引表的创建 152

6.3.2索引表的维护 155

6.4中文关键词Top-N查询处理 156

6.4.1候选元组查找和排序结构 157

6.4.2候选元组生成 157

6.4.3相似度 159

6.4.4获得查询结果 160

6.4.5相似度的短语修正 160

6.4.6时间和空间开销 162

6.5实验与数据分析 163

6.5.1单表数据库 163

6.5.2多表数据库 165

6.6本章小结 169

参考文献 170

第7章 n维赋范空间中的Top-N查询处理 172

7.1查询模式和理论分析 172

7.2 Top-N查询处理算法 175

7.2.1关于一般范数的算法 176

7.2.2关于x-单调范数的算法 183

7.3缓冲区大小和最优性 187

7.3.1 G-算法和m-算法缓冲区的大小 187

7.3.2 m-算法的伪实例最优性 187

7.3.3 NNS优化算法和TA-类算法的比较 191

7.4实验与数据分析 192

7.4.1数据集和准备 193

7.4.2处理查询耗用的时间 193

7.4.3顺序访问次数 195

7.4.4不同结果大小N的影响 196

7.4.5算法性能比较 197

7.5本章小结 199

参考文献 200

返回顶部