《大数据中的因果关系发现》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:蔡瑞初,郝志峰著
  • 出 版 社:北京:科学出版社
  • 出版年份:2018
  • ISBN:9787030584762
  • 页数:115 页
图书介绍:因果关系严格区分了“因”变量和“果”变量,在揭示事物发生机制、指导干预行为等方面有相关关系不能替代的重要作用。因果关系方向判断困难、结构发现能力不足、适用场景有限等仍然严重阻碍着因果推断领域的发展,是当前因果关系研究的难点和热点。本书从因果关系与相关关系之间的区别与联系出发,在因果关系模型、因果关系方向发现方法、因果关系结构发现方法、时序因果关系发现模型等角度对上述难题进行了深入探讨,并介绍因果关系理论在医疗大数据、社交网络大数据等方面的典型应用。本书是因果关系发现算法方面近期研究进展的总结,将为有志从事因果关系研究学者提供因果关系发现理论、算法及应用等方面一个较为完整的介绍。

第1章 导论 1

1.1因果关系的概念 1

1.2因果关系与相关关系 2

1.3因果关系与机器学习 3

1.4基于实验与基于观察数据的因果关系发现 4

1.5小结 6

参考文献 6

第2章 基础知识 7

2.1贝叶斯网络 7

2.2函数因果模型 9

2.3独立性假设检验 10

2.3.1离散数据的G2检验 11

2.3.2线性数据的偏相关检验 12

2.3.3非线性数据的核条件独立性检验 13

2.4回归分析 15

2.4.1线性数据的最小二乘回归 15

2.4.2非线性数据的高斯过程回归 17

2.5小结 19

参考文献 19

第3章 基于约束的方法 20

3.1因果网络结构学习问题 20

3.2PC算法和IC算法 21

3.2.1PC算法 21

3.2.2IC算法 24

3.3基于V-结构组装的方法 26

3.3.1V-结构的误发现问题 26

3.3.2V-结构的组装策略 26

3.4应用 33

3.5小结 35

参考文献 36

第4章 基于函数因果模型的方法 38

4.1典型数据的函数因果模型 38

4.1.1面向线性非高斯噪声数据的方法 38

4.1.2面向非线性噪声数据的方法 42

4.1.3面向后非线性数据的方法 46

4.2离散数据的低秩隐状态函数因果模型 47

4.2.1低秩隐状态函数因果模型 48

4.2.2低秩隐状态函数因果模型的可识别性 51

4.3应用 52

4.3.1移动通信网络性能之间的因果关系 52

4.3.2鲍鱼身体特征与年龄的因果关系 54

4.3.3匹兹堡桥结构参数之间的因果关系 56

4.4小结 57

参考文献 58

第5章 混合型方法 59

5.1分治策略 59

5.1.1算法框架 59

5.1.2因果分割集搜索算法 62

5.1.3局部结构化合并算法 63

5.1.4理论分析 65

5.2组装策略 67

5.2.1算法框架 67

5.2.2局部结构生成算法 69

5.2.3基于传播的权重增强算法 70

5.2.4基于最大无环子图的因果排序算法 71

5.2.5结合因果排序的冗余边剔除算法 74

5.3融合策略 75

5.3.1函数因果似然度模型 75

5.3.2函数因果似然度模型的可识别性分析 78

5.4应用 79

5.5小结 81

参考文献 81

第6章 其他相关主题 83

6.1时序数据上的因果关系发现 83

6.1.1格兰杰因果关系 83

6.1.2基于函数因果模型的时序因果关系发现算法 85

6.1.3时序因果关系发现在社交网络上的应用 87

6.2不完全观察数据上的隐变量发现 97

6.2.1隐变量发现算法 98

6.2.2基于函数因果模型的隐变量发现算法 99

6.2.3隐变量发现在外行星探测中的应用 104

6.3因果关系与迁移学习 105

6.3.1迁移策略 106

6.3.2不同因果机制下的可迁移性问题 108

6.3.3迁移学习在遥感图像分类中的应用 111

6.4小结 113

参考文献 114