第一部分 2
第1章 Web数据库基础理论和相关技术 2
1.1 Web数据库 2
1.2 相关定义 4
1.2.1 Deep Web 4
1.2.2 Web数据库查询 4
1.2.3 查询历史 5
1.3 关系数据模型 6
1.3.1 关系 7
1.3.2 关系模式 8
1.3.3 关系数据库 8
1.4 Web数据库查询相关技术 8
1.4.1 关联规则挖掘 8
1.4.2 直方图 10
1.4.3 Top-k排序 11
1.4.4 决策树分类 12
1.5 实验测试集和评价指标 13
1.5.1 测试数据集 13
1.5.2 评价指标 14
1.6 本章小结 15
1.7 参考文献 15
第2章 Web数据库自适应查询松弛方法 17
2.1 引言 17
2.2 相关方法介绍 18
2.3 查询松弛的基本思想和定义 19
2.3.1 查询松弛的基本思想 19
2.3.2 查询松弛的定义 19
2.4 查询指定属性的权重分配 20
2.4.1 分类型属性权重评估 20
2.4.2 数值型属性权重评估 20
2.4.3 实例分析 22
2.5 属性值之间的语义相关度评估 22
2.5.1 分类型属性值之间的语义相关度评估 23
2.5.2 数值型属性值之间的语义相关度评估 26
2.6 查询松弛重写算法和查询结果排序方法 27
2.6.1 查询松弛重写算法 27
2.6.2 查询结果排序方法 29
2.7 效果与性能实验评价 29
2.7.1 实验环境 29
2.7.2 IDF权重评估算法测试 30
2.7.3 语义相关度评估算法测试 31
2.7.4 查询松弛和结果排序方法的效果测试 32
2.7.5 响应时间测试 36
2.8 本章小结 37
2.9 参考文献 37
第3章 Web数据库多查询结果排序方法 39
3.1 引言 39
3.2 上下文偏好 40
3.2.1 定性偏好与定量偏好 40
3.2.2 上下文偏好定义 41
3.2.3 上下文偏好获取 41
3.2.4 上下文偏好处理 42
3.2.5 上下文偏好关系图 44
3.3 基于上下文偏好的多查询结果排序 44
3.3.1 排序问题定义 44
3.3.2 解决方案 46
3.4 实现算法 47
3.4.1 元组排列创建 47
3.4.2 元组排列聚类 48
3.4.3 Top-k排序 50
3.5 与偏好类无关元组的处理 52
3.6 效果与性能实验评价 52
3.6.1 实验环境 52
3.6.2 偏好模型表达能力测试 53
3.6.3 元组排列聚类算法测试 54
3.6.4 返回Top-k个元组的准确性测试 55
3.6.5 结果排序方法的效果测试 55
3.6.6 Top-k排序算法的性能测试 56
3.7 本章小结 58
3.8 参考文献 58
第4章 Web数据库多查询结果分类方法 60
4.1 引言 60
4.2 分类基本思想和分类树 61
4.2.1 分类基本思想 61
4.2.2 分类树和搜索代价 62
4.2.3 解决方案 62
4.3 元组聚类 63
4.3.1 查询聚合 63
4.3.2 元组聚类 66
4.4 分类树构建 67
4.4.1 分类树构建算法 67
4.4.2 属性划分 68
4.4.3 分裂标准 70
4.5 效果与性能实验评价 72
4.5.1 实验环境 72
4.5.2 用户调查结果 73
4.5.3 查询之间的语义相关度评估方法的合理性测试 76
4.5.4 查询聚合对元组聚类和分类效果的影响 77
4.5.5 数值型属性的多元划分对分类效果的影响 78
4.5.6 分类树创建算法的执行时间测试 79
4.6 本章小结 79
4.7 参考文献 80
第5章 Web数据库关键字查询推荐方法 81
5.1 关键字查询方法 81
5.2 基本概念和解决方案 82
5.2.1 基本概念 82
5.2.2 解决方案 83
5.3 关键字之间的耦合关系评估 84
5.3.1 关键字之间的内耦合关系评估 84
5.3.2 关键字之间的间耦合关系评估 85
5.3.3 关键字之间的耦合关系评估 87
5.4 关键字查询的语义相关度计算与典型程度分析 88
5.4.1 关键字查询的语义相关度计算 88
5.4.2 关键字查询的典型程度分析 89
5.5 候选查询的Top-k多样性选取 91
5.5.1 选取代表性查询 92
5.5.2 创建代表性序列 92
5.5.3 候选查询的Top-k选取 92
5.6 性能实验评价 93
5.6.1 实验环境 93
5.6.2 关键字耦合关系的准确性测试 94
5.6.3 关键字查询语义相关度的用户调查 96
5.6.4 候选查询Top-k多样性选取的合理性测试 97
5.6.5 Top-k选取算法的响应时间测试 98
5.7 本章小结 98
5.8 参考文献 99
第二部分 102
第6章 XML基础理论和查询技术 102
6.1 XML数据模型 102
6.1.1 XML文档及相关标准 102
6.1.2 文档定义类型DTD 103
6.2 XML编码方案 105
6.3 XML查询技术 107
6.3.1 XPath 107
6.3.2 XML查询 108
6.4 本章小结 110
6.5 参考文献 110
第7章 XML数据近似查询方法 112
7.1 引言 112
7.2 XML近似查询相关定义和框架 113
7.2.1 XML近似查询相关定义 113
7.2.2 XML近似查询框架 114
7.3 属性单元重要程度排序 114
7.3.1 挖掘函数依赖关系 115
7.3.2 求近似候选码 116
7.4 XML近似查询方法 118
7.4.1 属性单元内容相关度知识库 118
7.4.2 查询匹配方法 119
7.4.3 XML近似查询TwigAE算法 121
7.5 实验测试及分析 121
7.5.1 实验环境和测试数据 121
7.5.2 属性单元松弛过程性能测试 121
7.5.3 TwigAE与TwigStack的查询结果对比 123
7.6 本章小结 125
7.7 参考文献 125
第三部分 128
第8章 空间关键字查询方法 128
8.1 空间数据库查询 128
8.2 空间索引结构 129
8.2.1 空间索引结构概述 129
8.2.2 空间索引R-Tree 129
8.3 文本索引结构 136
8.4 空间关键字语义近似查询 136
8.4.1 文本词条之间的语义相关度评估 137
8.4.2 空间和语义相结合的索引结构 139
8.5 本章小结 144
8.6 参考文献 144
第9章 空间兴趣点聚类分析方法 146
9.1 引言 146
9.2 基本概念和解决方案 147
9.2.1 基本概念 147
9.2.2 解决方案 147
9.3 空间对象的地理-社会关系模型 147
9.3.1 地理-社会关系模型 148
9.3.2 社会关系紧密度评估 148
9.4 实现算法 149
9.5 效果与性能实验分析 151
9.5.1 聚类效果测试 151
9.5.2 社会关系效果评估 153
9.6 本章小结 155
9.7 参考文献 155
参考文献 157