第一部分 隐私保护数据发布和隐私保护模型 3
第一章 绪论 3
第二章 隐私保护数据发布 5
2.1 隐私信息 5
2.2 数据发布 6
2.3 隐私泄露 7
2.4 隐私保护 11
2.5 数据可用性 11
2.6 隐私保护数据发布 12
第三章 隐私保护模型 13
3.1 k-匿名隐私保护模型 13
3.1.1 基本思想 13
3.1.2 基本概念 14
3.1.3 匿名操作 17
3.1.4 k-匿名隐私保护模型的关键问题 18
3.1.5 研究现状 20
3.2 k-匿名隐私保护模型的扩展模型 21
3.2.1 e-多样性(e-diversity)隐私保护模型 21
3.2.2 信心限定(confidence bounding)隐私保护模型 21
3.2.3(XY)匿名隐私保护模型 22
3.2.4(X, Y)-隐私(Privacy)模型 22
3.2.5(α,k)-匿名 22
3.2.6 t-Closeness隐私保护模型 22
3.2.7 个性化隐私 23
3.2.8 FF-匿名隐私保护模型 23
3.3 概率隐私保护模型 23
3.3.1 δ-存在隐私保护模型 23
3.3.2 m-机密性隐私保护模型 24
3.3.3 ε-差异隐私 24
3.3.4(d,γ)-隐私 24
3.4 其他隐私保护模型 25
3.4.1 多样发布 25
3.4.2 顺序发布 25
3.4.3 连续发布 26
第二部分 基于k-匿名隐私保护模型的数据发布方法 29
第四章 基于超图的准标识符求解方法 29
4.1 引言 29
4.2 基本定义 31
4.3 视图集向超图的映射方法 31
4.4 相关视图集的求解 34
4.5 准标识符的求解 39
4.5.1 准标识符组成特征 39
4.5.2 准标识符求解算法 40
第五章 k值的优化选择方法 42
5.1 引言 42
5.2 基本定义 43
5.3 k值、数据质量、隐私保护关系 44
5.4 满足隐私保护要求的k取值选择 46
5.4.1 一个实体对应一条元组 47
5.4.2 一个实体对应多条元组 48
5.5 满足数据质量要求的k取值选择 50
5.6 k值的优化选择算法 51
第六章 发布数据的匿名化方法 54
6.1 引言 54
6.2 基本符号 55
6.3 匿名数据最佳值的近似求解方法 55
6.3.1 问题描述 55
6.3.2 基本定义 56
6.3.3 准标识符最佳值的求解问题 58
6.3.4 准标识符最佳值近似求解方法 59
6.4 基于最大隐私泄露率的匿名化方法 63
6.4.1 问题描述 63
6.4.2 基本定义 63
6.4.3 基于最大隐私泄露率的匿名化方法 65
6.5 应用聚类分析的匿名化方法 69
6.5.1 问题描述 69
6.5.2 基本定义 70
6.5.3 应用聚类分析的匿名化算法 71
6.6 基于多敏感属性的匿名化方法 76
6.6.1 问题描述 76
6.6.2 基本定义 76
6.6.3 基于多敏感属性的匿名化方法 78
6.7 保持数据依赖的匿名化方法 83
6.7.1 问题描述 83
6.7.2 基本定义 85
6.7.3 匿名数据集上的数据依赖 86
6.7.4 基于k-MSD的k-匿名化算法 90
6.7.5 保持函数依赖或多值依赖的k-匿名化算法 94
第七章 k-匿名数据集的增量更新方法 101
7.1 引言 101
7.2 符号及定义 102
7.2.1 基本符号及定义 102
7.2.2 更新操作相关符号 103
7.3 基于类B-树的k-匿名数据集增量更新方法 103
7.3.1 类B-树结构 103
7.3.2 元组到多维空间点的映射方法 105
7.3.3 类B-树的构建 106
7.3.4 基于类B-树的k-匿名数据集增量更新方法 107
7.4 基于多维桶的k-匿名数据集增量更新方法 114
7.4.1 多维桶构造方法及相关操作 114
7.4.2 基于多维桶的k-匿名数据集增量更新算法 117
7.5 基于元组相似性的k-匿名数据集增量更新方法 120
7.5.1 插入更新操作 122
7.5.2 删除更新操作 124
7.5.3 修改更新操作 126
7.6 面向视图的k-匿名数据集增量更新方法 128
7.6.1 问题描述 128
7.6.2 视图相关符号及定义 130
7.6.3 泛化视图相关符号及定义 131
7.6.4 泛化视图的更新一致性反应 133
7.6.5 泛化视图的更新一致性算法 135
第三部分 基于概率隐私保护模型的数据发布方法 145
第八章 面向静态视图的数据发布方法 145
8.1 引言 145
8.2 相关工作 145
8.3 隐私泄露测量方法 147
8.3.1 符号及定义 147
8.3.2 隐私泄露测量方法 148
8.4 基于关键元组的隐私泄露消除方法 149
8.4.1 判定关键元组算法 150
8.4.2 隐私泄露测量算法 151
8.4.3 基于关键元组的隐私泄露消除算法 151
第九章 面向动态视图的数据发布方法 154
9.1 引言 154
9.2 基本符号和定义 154
9.3 隐私泄露概率计算 159
9.3.1 选择条件相同 159
9.3.2 选择条件有交集 160
9.3.3 选择条件无交集 163
9.4 动态视图安全发布 163
9.4.1 动态视图安全发布方法 163
9.4.2 视图安全发布算法 164
9.4.3 算法实例 167
9.4.4 算法优化 168
第四部分 基于熵隐私保护模型的数据发布方法 173
第十章 基于熵隐私保护模型的数据发布方法 173
10.1 引言 173
10.2 基本定义 173
10.3 基于熵的隐私保护模型 174
10.3.1 熵的定义 174
10.3.2 发布视图熵 175
10.3.3 隐私查询熵 175
10.3.4 隐私查询和发布视图联合熵 176
10.3.5 基于熵的视图安全判定定理 176
10.3.6 基于熵的隐私保护模型 177
10.4 基于熵隐私保护模型的数据发布 177
10.4.1 布尔查询集 177
10.4.2 等价二维表 178
10.4.3 合并规则 179
10.4.4 基于熵隐私保护模型的数据发布算法 180
第五部分 抵御多次连接探秘的数据发布方法 185
第十一章 存在标识属性的多次连接探秘数据发布方法 185
11.1 基本定义 185
11.2 最大熵原理 186
11.3 多次连接视图的安全判定 187
11.3.1 视图安全判定定理 187
11.3.2 条件概率求解算法 187
11.3.3 视图的安全判定算法 189
11.3.4 实例分析 190
11.4 抵御多次连接探秘的数据发布算法 192
第十二章 不存在标识属性的多次连接探秘数据发布方法 194
12.1 基本定义及定理 194
12.2 基于准标识符的视图安全判定算法 194
12.3 多次连接探秘数据发布算法 197
主要参考文献 199