第一篇 基于匿名模型的隐私保护数据发布 3
第1章 绪论 3
1.1 隐私保护数据发布 3
1.2 匿名隐私保护模型 4
1.2.1 k-匿名模型 4
1.2.2 l-多样性模型 5
1.2.3 t-Closeness 6
1.3 数据质量度量 6
1.4 匿名隐私保护的主要研究方向 7
1.5 隐私保护数据发布研究展望 8
参考文献 8
第2章 k-匿名组规模的上界讨论 10
2.1 引言 10
2.2 现有算法的k-匿名组规模上界 10
2.3 基于取整划分函数的k-匿名算法 11
2.3.1 均衡二划分存在的问题 12
2.3.2 基于取整划分函数的划分策略 13
2.3.3 基于取整划分函数的k-匿名算法的匿名组规模上界 14
2.3.4 基于取整划分函数的k-匿名算法(划分部分)时间复杂度分析 16
2.4 实验结果与分析 17
2.5 本章小结 18
参考文献 18
第3章 基于空间划分的隐私保护关系型数据发布算法 20
3.1 引言 20
3.2 基于动态规划的最优k-匿名严格划分算法 22
3.2.1 相关工作 22
3.2.2 基于子空间多维划分的最优k-匿名问题 23
3.2.3 基于子空间划分的最优k-匿名动态规划算法 26
3.2.4 实验结果与分析 29
3.3 基于动态规划的最优严格划分数据发布算法 36
3.3.1 算法框架 37
3.3.2 实验结果与分析 38
3.4 基于混合划分技术的数据发布算法 41
3.4.1 严格划分的数据可以在信息损失上进一步改进 41
3.4.2 非严格划分的数据可能在可用性上不如严格划分数据 42
3.4.3 混合划分技术及算法 44
3.4.4 实验结果与分析 45
3.5 本章小结 48
参考文献 48
第4章 隐私保护增量数据重发布 50
4.1 引言 50
4.1.1 问题实例 50
4.1.2 已有研究与不足 52
4.2 问题与相关知识 53
4.2.1 问题描述 53
4.2.2 多维划分 53
4.2.3 数据质量度量 54
4.3 增量更新数据的发布 54
4.3.1 增量更新数据的概化 54
4.3.2 单调概化原则 56
4.4 增量更新k-匿名算法 57
4.4.1 算法描述 57
4.4.2 算法的运行实例 58
4.4.3 算法讨论 58
4.5 实验分析 59
4.5.1 隐私泄露比较 59
4.5.2 数据质量比较 60
4.5.3 执行时间比较 61
4.6 本章小结 62
参考文献 62
第5章 面向多敏感属性的隐私保护数据发布 64
5.1 引言 64
5.2 基础知识与问题描述 65
5.2.1 基本定义 65
5.2.2 问题描述 65
5.3 p-覆盖k-匿名模型 66
5.4 面向多敏感属性保护的p-覆盖k-匿名算法 67
5.4.1 相关性质 67
5.4.2 算法描述 68
5.4.3 算法实例 69
5.5 实验结果与分析 69
5.5.1 敏感属性泄露比较 70
5.5.2 数据质量比较 70
5.5.3 运行时间比较 70
5.6 本章小结 73
参考文献 74
第6章 隐私保护事务型数据发布 75
6.1 引言 75
6.2 基于剖分的隐私保护事务型数据发布 75
6.3 事务型数据发布的p-剖分l-多样化算法 78
6.3.1 属性剖分 78
6.3.2 记录划分 78
6.3.3 算法时间复杂度分析 79
6.4 实验结果与分析 79
6.4.1 关联规则数量测试 80
6.4.2 关联规则挖掘正确率测试 80
6.5 本章小结 82
参考文献 82
第7章 隐私保护社会网络数据发布 84
7.1 引言 84
7.2 基础知识与相关隐私保护技术 85
7.2.1 社会网络的定义和数学表示 85
7.2.2 社会网络数据的特点 86
7.2.3 社会网络中的隐私模型 86
7.2.4 攻击者的背景知识 86
7.2.5 匿名后的数据可用性 86
7.2.6 社会网络数据匿名技术 87
7.3 面向度数攻击的隐私保护社会网络数据发布 88
7.3.1 问题提出 88
7.3.2 相关工作 88
7.3.3 度数攻击模型 89
7.3.4 防止度数攻击的社会网络匿名算法 89
7.3.5 实验数据与分析 91
7.4 面向子图攻击的隐私保护社会网络数据发布 96
7.4.1 问题提出 96
7.4.2 相关工作 97
7.4.3 (d,k)-匿名社会网络模型 97
7.4.4 防止子图攻击的社会网络匿名算法 98
7.4.5 实验结果与分析 101
7.5 本章小结 106
参考文献 106
第8章 隐私保护轨迹数据发布 108
8.1 引言 108
8.2 基础知识与相关隐私保护技术 108
8.2.1 相关定义 108
8.2.2 基于聚类的轨迹数据隐私保护技术 109
8.3 基于聚类杂交的隐私保护轨迹数据发布算法 111
8.3.1 相关工作 111
8.3.2 二次聚类攻击 111
8.3.3 基于聚类杂交的轨迹数据发布算法 117
8.3.4 实验结果与分析 118
8.4 隐私保护轨迹数据发布的l-多样化算法 128
8.4.1 问题提出 128
8.4.2 轨迹l-多样化隐私保护算法 129
8.4.3 实验结果与分析 132
8.5 个性化隐私保护轨迹数据发布 137
8.5.1 问题提出 137
8.5.2 问题描述 137
8.5.3 个性化轨迹发布隐私保护算法 138
8.5.4 实验结果与分析 140
8.6 基于网格划分的轨迹分段匿名隐私保护算法 145
8.6.1 问题提出 145
8.6.2 基于空间网格划分的不规则分段轨迹隐私保护算法 145
8.6.3 防止重叠攻击的轨迹分段匿名算法 147
8.6.4 实验结果与分析 148
8.7 本章小结 152
参考文献 152
第9章 面向LBS应用的位置隐私保护 154
9.1 引言 154
9.2 基础知识与相关位置隐私保护技术 155
9.2.1 系统结构 155
9.2.2 位置隐私保护技术 157
9.3 欧氏空间下面向连续查询的位置隐私保护 158
9.3.1 问题提出 158
9.3.2 相关定义与问题性质 159
9.3.3 基于历史轨迹的连续查询隐私保护算法 161
9.3.4 实验结果与分析 162
9.4 公路网络下防止边权分布攻击的位置隐私保护 165
9.4.1 问题提出 165
9.4.2 基础知识与相关定义 166
9.4.3 防止边权分布攻击的位置隐私保护算法 167
9.4.4 实验结果与分析 169
9.5 欧氏空间下的交互式位置隐私保护 173
9.5.1 问题提出 173
9.5.2 交互式模型与协议 173
9.5.3 交互式位置隐私保护算法 176
9.5.4 防止速度关联攻击的交互式位置隐私保护算法 182
9.6 本章小结 189
参考文献 189
第二篇 基于差分隐私的隐私保护数据发布 195
第10章 基于差分隐私的统计数据发布概述 195
10.1 ε-差分隐私模型 195
10.2 差分隐私的实现机制 196
10.2.1 Laplace机制 197
10.2.2 指数机制 198
10.3 差分隐私的组合特性 198
10.4 差分隐私数据保护框架 198
10.5 差分隐私保护方法的性能度量 199
参考文献 200
第11章 基于k叉平均树的差分隐私数据发布 202
11.1 引言 202
11.2 问题与相关性质 203
11.2.1 问题提出 203
11.2.2 相关性质 204
11.3 基于k叉平均树的差分隐私直方图发布算法 204
11.3.1 算法思想及描述 204
11.3.2 算法分析 206
11.3.3 与同类算法的噪声比较 208
11.3.4 实验结果与分析 209
11.4 面向多维组合查询的差分隐私直方图发布算法 212
11.4.1 多维组合查询问题 212
11.4.2 算法思想及描述 213
11.4.3 算法分析 215
11.4.4 实验结果与分析 215
11.5 本章小结 219
参考文献 219
第12章 面向任意区间树结构的差分隐私直方图发布 220
12.1 引言 220
12.2 基础知识与问题提出 221
12.2.1 基础知识 221
12.2.2 问题提出 222
12.3 面向任意区间树结构的差分隐私直方图发布迭代算法 222
12.3.1 k-区间树 222
12.3.2 局部最优线性无偏估计及其算法 224
12.3.3 基于LBLUE解全局最优线性无偏估计的迭代算法 225
12.3.4 算法分析 226
12.3.5 实验结果与分析 230
12.4 面向任意区间树结构的差分隐私直方图发布线性时间算法 235
12.4.1 差分隐私区间树中节点权值的最优线性无偏估计 235
12.4.2 求解差分隐私区间树节点权值最优线性无偏估计的算法 236
12.4.3 算法复杂度分析 238
12.4.4 实验结果与分析 238
12.5 本章小结 242
参考文献 242
第13章 基于树重构的差分隐私直方图发布 243
13.1 引言 243
13.2 基于区间查询概率的差分隐私直方图发布 243
13.2.1 问题提出 243
13.2.2 基于区间计数查询概率的差分隐私直方图发布算法 246
13.2.3 实验结果与分析 250
13.3 基于哈尔小波有损压缩的直方图发布 253
13.3.1 哈尔小波变换 254
13.3.2 问题提出 257
13.3.3 基于哈尔小波零树压缩的直方图发布算法EHWT-DP 258
13.3.4 实验结果与分析 262
13.4 本章小结 269
参考文献 269
第14章 异方差加噪下的差分隐私直方图发布 270
14.1 引言 270
14.2 基础知识与问题 270
14.3 异方差加噪下面向任意树结构的差分隐私直方图发布算法 271
14.3.1 节点覆盖概率计算 272
14.3.2 节点系数计算及隐私预算分配 272
14.3.3 算法描述与分析 276
14.4 实验结果与分析 280
14.4.1 查询精度比较 281
14.4.2 算法运行效率比较 284
14.5 本章小结 285
参考文献 285
第15章 差分隐私连续数据发布 287
15.1 引言 287
15.2 相关工作与基础知识 288
15.2.1 相关工作 288
15.2.2 矩阵机制 289
15.3 基于矩阵机制的差分隐私连续数据发布 289
15.4 隐私连续数据发布算法 290
15.4.1 策略矩阵的构建 290
15.4.2 查询均方误差的降低 293
15.4.3 最小误差的快速求解 294
15.4.4 优化效果分析 298
15.5 实验结果与分析 299
15.5.1 与朴素方法的对比实验结果与分析 300
15.5.2 与基于二叉树方法的对比实验结果与分析 300
15.5.3 与静态数据发布方法的对比实验结果与分析 301
15.6 本章小结 302
参考文献 302
第16章 面向二维数据流的差分隐私统计发布 305
16.1 引言 305
16.2 基础知识与相关定义 306
16.3 固定长度二维数据流的差分隐私统计发布 306
16.3.1 问题描述 306
16.3.2 算法思想与描述 307
16.3.3 算法空间复杂度分析 311
16.4 任意长度二维数据流的差分隐私连续统计发布 311
16.4.1 算法思想与描述 311
16.4.2 算法分析 312
16.5 实验结果与分析 312
16.5.1 差分隐私统计发布固定长度二维数据流的可用性 312
16.5.2 差分隐私统计发布任意长度二维数据流的可用性 313
16.6 本章小结 314
参考文献 314
第17章 差分隐私二维空间数据划分发布 316
17.1 引言 316
17.2 基础知识与相关定义 316
17.3 基于kd-树的差分隐私二维空间数据划分发布算法 318
17.3.1 问题提出 318
17.3.2 算法思想与描述 318
17.3.3 实验结果与分析 320
17.4 基于四分树的差分隐私二维空间数据划分发布算法 324
17.4.1 问题提出 324
17.4.2 算法思想与描述 325
17.4.3 实验结果与分析 328
17.5 本章小结 332
参考文献 332
第18章 面向低频统计值的差分隐私数据发布 334
18.1 引言 334
18.2 面向低频计数值的差分隐私直方图发布 334
18.2.1 问题提出 334
18.2.2 算法思想与描述 335
18.2.3 算法分析及优化 336
18.2.4 算法运行实例 337
18.2.5 实验结果与分析 338
18.3 差分隐私稀疏列联表发布 340
18.3.1 问题提出 340
18.3.2 算法思想与描述 342
18.3.3 实验结果与分析 346
18.4 本章小结 354
参考文献 354
第19章 差分隐私下的频繁模式挖掘 355
19.1 引言 355
19.2 基础知识与问题 355
19.3 差分隐私下的频繁模式挖掘问题分析 357
19.3.1 全局敏感度分析 357
19.3.2 误差分析 357
19.3.3 单调性分析 358
19.4 基于事务截断的差分隐私频繁模式挖掘 358
19.4.1 基于指数机制的事务截断方法 359
19.4.2 基于最小噪声支持度的差分隐私频繁模式挖掘 360
19.4.3 频繁模式挖掘结果集的单调性调节 361
19.5 实验结果与分析 363
19.5.1 全局敏感度比较 365
19.5.2 数据可用性比较 366
19.5.3 引入最小噪声支持度的实验分析 367
19.5.4 频繁模式挖掘结果集的单调性实验分析 368
19.6 本章小结 371
参考文献 371