《隐私保护数据发布 模型与算法》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:吴英杰著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2015
  • ISBN:9787302421771
  • 页数:372 页
图书介绍:本书主要阐述数据共享发布中的隐私保护模型及其关键算法。全书分为2篇,第1篇(1-9章)阐述匿名隐私保护数据发布,涉及匿名隐私模型、k-匿名组规模的上界、关系型数据发布及其扩展背景下的隐私保护、非关系型数据发布中的隐私保护、面向LBS应用的位置隐私保护等;第2篇(10-19章)阐述差分隐私保护数据发布,涉及差分隐私模型介绍、面向任意区间树结构及其扩展背景下的差分隐私直方图发布、面向其他应用背景的差分隐私数据发布等。

第一篇 基于匿名模型的隐私保护数据发布 3

第1章 绪论 3

1.1 隐私保护数据发布 3

1.2 匿名隐私保护模型 4

1.2.1 k-匿名模型 4

1.2.2 l-多样性模型 5

1.2.3 t-Closeness 6

1.3 数据质量度量 6

1.4 匿名隐私保护的主要研究方向 7

1.5 隐私保护数据发布研究展望 8

参考文献 8

第2章 k-匿名组规模的上界讨论 10

2.1 引言 10

2.2 现有算法的k-匿名组规模上界 10

2.3 基于取整划分函数的k-匿名算法 11

2.3.1 均衡二划分存在的问题 12

2.3.2 基于取整划分函数的划分策略 13

2.3.3 基于取整划分函数的k-匿名算法的匿名组规模上界 14

2.3.4 基于取整划分函数的k-匿名算法(划分部分)时间复杂度分析 16

2.4 实验结果与分析 17

2.5 本章小结 18

参考文献 18

第3章 基于空间划分的隐私保护关系型数据发布算法 20

3.1 引言 20

3.2 基于动态规划的最优k-匿名严格划分算法 22

3.2.1 相关工作 22

3.2.2 基于子空间多维划分的最优k-匿名问题 23

3.2.3 基于子空间划分的最优k-匿名动态规划算法 26

3.2.4 实验结果与分析 29

3.3 基于动态规划的最优严格划分数据发布算法 36

3.3.1 算法框架 37

3.3.2 实验结果与分析 38

3.4 基于混合划分技术的数据发布算法 41

3.4.1 严格划分的数据可以在信息损失上进一步改进 41

3.4.2 非严格划分的数据可能在可用性上不如严格划分数据 42

3.4.3 混合划分技术及算法 44

3.4.4 实验结果与分析 45

3.5 本章小结 48

参考文献 48

第4章 隐私保护增量数据重发布 50

4.1 引言 50

4.1.1 问题实例 50

4.1.2 已有研究与不足 52

4.2 问题与相关知识 53

4.2.1 问题描述 53

4.2.2 多维划分 53

4.2.3 数据质量度量 54

4.3 增量更新数据的发布 54

4.3.1 增量更新数据的概化 54

4.3.2 单调概化原则 56

4.4 增量更新k-匿名算法 57

4.4.1 算法描述 57

4.4.2 算法的运行实例 58

4.4.3 算法讨论 58

4.5 实验分析 59

4.5.1 隐私泄露比较 59

4.5.2 数据质量比较 60

4.5.3 执行时间比较 61

4.6 本章小结 62

参考文献 62

第5章 面向多敏感属性的隐私保护数据发布 64

5.1 引言 64

5.2 基础知识与问题描述 65

5.2.1 基本定义 65

5.2.2 问题描述 65

5.3 p-覆盖k-匿名模型 66

5.4 面向多敏感属性保护的p-覆盖k-匿名算法 67

5.4.1 相关性质 67

5.4.2 算法描述 68

5.4.3 算法实例 69

5.5 实验结果与分析 69

5.5.1 敏感属性泄露比较 70

5.5.2 数据质量比较 70

5.5.3 运行时间比较 70

5.6 本章小结 73

参考文献 74

第6章 隐私保护事务型数据发布 75

6.1 引言 75

6.2 基于剖分的隐私保护事务型数据发布 75

6.3 事务型数据发布的p-剖分l-多样化算法 78

6.3.1 属性剖分 78

6.3.2 记录划分 78

6.3.3 算法时间复杂度分析 79

6.4 实验结果与分析 79

6.4.1 关联规则数量测试 80

6.4.2 关联规则挖掘正确率测试 80

6.5 本章小结 82

参考文献 82

第7章 隐私保护社会网络数据发布 84

7.1 引言 84

7.2 基础知识与相关隐私保护技术 85

7.2.1 社会网络的定义和数学表示 85

7.2.2 社会网络数据的特点 86

7.2.3 社会网络中的隐私模型 86

7.2.4 攻击者的背景知识 86

7.2.5 匿名后的数据可用性 86

7.2.6 社会网络数据匿名技术 87

7.3 面向度数攻击的隐私保护社会网络数据发布 88

7.3.1 问题提出 88

7.3.2 相关工作 88

7.3.3 度数攻击模型 89

7.3.4 防止度数攻击的社会网络匿名算法 89

7.3.5 实验数据与分析 91

7.4 面向子图攻击的隐私保护社会网络数据发布 96

7.4.1 问题提出 96

7.4.2 相关工作 97

7.4.3 (d,k)-匿名社会网络模型 97

7.4.4 防止子图攻击的社会网络匿名算法 98

7.4.5 实验结果与分析 101

7.5 本章小结 106

参考文献 106

第8章 隐私保护轨迹数据发布 108

8.1 引言 108

8.2 基础知识与相关隐私保护技术 108

8.2.1 相关定义 108

8.2.2 基于聚类的轨迹数据隐私保护技术 109

8.3 基于聚类杂交的隐私保护轨迹数据发布算法 111

8.3.1 相关工作 111

8.3.2 二次聚类攻击 111

8.3.3 基于聚类杂交的轨迹数据发布算法 117

8.3.4 实验结果与分析 118

8.4 隐私保护轨迹数据发布的l-多样化算法 128

8.4.1 问题提出 128

8.4.2 轨迹l-多样化隐私保护算法 129

8.4.3 实验结果与分析 132

8.5 个性化隐私保护轨迹数据发布 137

8.5.1 问题提出 137

8.5.2 问题描述 137

8.5.3 个性化轨迹发布隐私保护算法 138

8.5.4 实验结果与分析 140

8.6 基于网格划分的轨迹分段匿名隐私保护算法 145

8.6.1 问题提出 145

8.6.2 基于空间网格划分的不规则分段轨迹隐私保护算法 145

8.6.3 防止重叠攻击的轨迹分段匿名算法 147

8.6.4 实验结果与分析 148

8.7 本章小结 152

参考文献 152

第9章 面向LBS应用的位置隐私保护 154

9.1 引言 154

9.2 基础知识与相关位置隐私保护技术 155

9.2.1 系统结构 155

9.2.2 位置隐私保护技术 157

9.3 欧氏空间下面向连续查询的位置隐私保护 158

9.3.1 问题提出 158

9.3.2 相关定义与问题性质 159

9.3.3 基于历史轨迹的连续查询隐私保护算法 161

9.3.4 实验结果与分析 162

9.4 公路网络下防止边权分布攻击的位置隐私保护 165

9.4.1 问题提出 165

9.4.2 基础知识与相关定义 166

9.4.3 防止边权分布攻击的位置隐私保护算法 167

9.4.4 实验结果与分析 169

9.5 欧氏空间下的交互式位置隐私保护 173

9.5.1 问题提出 173

9.5.2 交互式模型与协议 173

9.5.3 交互式位置隐私保护算法 176

9.5.4 防止速度关联攻击的交互式位置隐私保护算法 182

9.6 本章小结 189

参考文献 189

第二篇 基于差分隐私的隐私保护数据发布 195

第10章 基于差分隐私的统计数据发布概述 195

10.1 ε-差分隐私模型 195

10.2 差分隐私的实现机制 196

10.2.1 Laplace机制 197

10.2.2 指数机制 198

10.3 差分隐私的组合特性 198

10.4 差分隐私数据保护框架 198

10.5 差分隐私保护方法的性能度量 199

参考文献 200

第11章 基于k叉平均树的差分隐私数据发布 202

11.1 引言 202

11.2 问题与相关性质 203

11.2.1 问题提出 203

11.2.2 相关性质 204

11.3 基于k叉平均树的差分隐私直方图发布算法 204

11.3.1 算法思想及描述 204

11.3.2 算法分析 206

11.3.3 与同类算法的噪声比较 208

11.3.4 实验结果与分析 209

11.4 面向多维组合查询的差分隐私直方图发布算法 212

11.4.1 多维组合查询问题 212

11.4.2 算法思想及描述 213

11.4.3 算法分析 215

11.4.4 实验结果与分析 215

11.5 本章小结 219

参考文献 219

第12章 面向任意区间树结构的差分隐私直方图发布 220

12.1 引言 220

12.2 基础知识与问题提出 221

12.2.1 基础知识 221

12.2.2 问题提出 222

12.3 面向任意区间树结构的差分隐私直方图发布迭代算法 222

12.3.1 k-区间树 222

12.3.2 局部最优线性无偏估计及其算法 224

12.3.3 基于LBLUE解全局最优线性无偏估计的迭代算法 225

12.3.4 算法分析 226

12.3.5 实验结果与分析 230

12.4 面向任意区间树结构的差分隐私直方图发布线性时间算法 235

12.4.1 差分隐私区间树中节点权值的最优线性无偏估计 235

12.4.2 求解差分隐私区间树节点权值最优线性无偏估计的算法 236

12.4.3 算法复杂度分析 238

12.4.4 实验结果与分析 238

12.5 本章小结 242

参考文献 242

第13章 基于树重构的差分隐私直方图发布 243

13.1 引言 243

13.2 基于区间查询概率的差分隐私直方图发布 243

13.2.1 问题提出 243

13.2.2 基于区间计数查询概率的差分隐私直方图发布算法 246

13.2.3 实验结果与分析 250

13.3 基于哈尔小波有损压缩的直方图发布 253

13.3.1 哈尔小波变换 254

13.3.2 问题提出 257

13.3.3 基于哈尔小波零树压缩的直方图发布算法EHWT-DP 258

13.3.4 实验结果与分析 262

13.4 本章小结 269

参考文献 269

第14章 异方差加噪下的差分隐私直方图发布 270

14.1 引言 270

14.2 基础知识与问题 270

14.3 异方差加噪下面向任意树结构的差分隐私直方图发布算法 271

14.3.1 节点覆盖概率计算 272

14.3.2 节点系数计算及隐私预算分配 272

14.3.3 算法描述与分析 276

14.4 实验结果与分析 280

14.4.1 查询精度比较 281

14.4.2 算法运行效率比较 284

14.5 本章小结 285

参考文献 285

第15章 差分隐私连续数据发布 287

15.1 引言 287

15.2 相关工作与基础知识 288

15.2.1 相关工作 288

15.2.2 矩阵机制 289

15.3 基于矩阵机制的差分隐私连续数据发布 289

15.4 隐私连续数据发布算法 290

15.4.1 策略矩阵的构建 290

15.4.2 查询均方误差的降低 293

15.4.3 最小误差的快速求解 294

15.4.4 优化效果分析 298

15.5 实验结果与分析 299

15.5.1 与朴素方法的对比实验结果与分析 300

15.5.2 与基于二叉树方法的对比实验结果与分析 300

15.5.3 与静态数据发布方法的对比实验结果与分析 301

15.6 本章小结 302

参考文献 302

第16章 面向二维数据流的差分隐私统计发布 305

16.1 引言 305

16.2 基础知识与相关定义 306

16.3 固定长度二维数据流的差分隐私统计发布 306

16.3.1 问题描述 306

16.3.2 算法思想与描述 307

16.3.3 算法空间复杂度分析 311

16.4 任意长度二维数据流的差分隐私连续统计发布 311

16.4.1 算法思想与描述 311

16.4.2 算法分析 312

16.5 实验结果与分析 312

16.5.1 差分隐私统计发布固定长度二维数据流的可用性 312

16.5.2 差分隐私统计发布任意长度二维数据流的可用性 313

16.6 本章小结 314

参考文献 314

第17章 差分隐私二维空间数据划分发布 316

17.1 引言 316

17.2 基础知识与相关定义 316

17.3 基于kd-树的差分隐私二维空间数据划分发布算法 318

17.3.1 问题提出 318

17.3.2 算法思想与描述 318

17.3.3 实验结果与分析 320

17.4 基于四分树的差分隐私二维空间数据划分发布算法 324

17.4.1 问题提出 324

17.4.2 算法思想与描述 325

17.4.3 实验结果与分析 328

17.5 本章小结 332

参考文献 332

第18章 面向低频统计值的差分隐私数据发布 334

18.1 引言 334

18.2 面向低频计数值的差分隐私直方图发布 334

18.2.1 问题提出 334

18.2.2 算法思想与描述 335

18.2.3 算法分析及优化 336

18.2.4 算法运行实例 337

18.2.5 实验结果与分析 338

18.3 差分隐私稀疏列联表发布 340

18.3.1 问题提出 340

18.3.2 算法思想与描述 342

18.3.3 实验结果与分析 346

18.4 本章小结 354

参考文献 354

第19章 差分隐私下的频繁模式挖掘 355

19.1 引言 355

19.2 基础知识与问题 355

19.3 差分隐私下的频繁模式挖掘问题分析 357

19.3.1 全局敏感度分析 357

19.3.2 误差分析 357

19.3.3 单调性分析 358

19.4 基于事务截断的差分隐私频繁模式挖掘 358

19.4.1 基于指数机制的事务截断方法 359

19.4.2 基于最小噪声支持度的差分隐私频繁模式挖掘 360

19.4.3 频繁模式挖掘结果集的单调性调节 361

19.5 实验结果与分析 363

19.5.1 全局敏感度比较 365

19.5.2 数据可用性比较 366

19.5.3 引入最小噪声支持度的实验分析 367

19.5.4 频繁模式挖掘结果集的单调性实验分析 368

19.6 本章小结 371

参考文献 371