第1章 绪论 1
1.1 蛋白质互作网络 3
1.1.1 蛋白质相互作用数据库 4
1.1.2 算法预测的蛋白质相互作用数据库 7
1.2 蛋白质互作网络相关研究 12
1.2.1 蛋白质相互作用的预测 14
1.2.2 蛋白质复合物的识别 14
1.2.3 蛋白质网络比对 16
1.2.4 蛋白质网络可视化 17
1.3 本章小结 18
第2章 蛋白质互作网络的研究进展 19
2.1 蛋白质相互作用的预测 20
2.2 传统的预测PPI方法 22
2.3 检测PPI的计算方法 25
2.3.1 基于基因组信息的计算方法 25
2.3.2 基于进化信息的计算方法 26
2.3.3 基于蛋白质三维结构的计算方法 27
2.3.4 基于领域数据的计算方法 28
2.3.5 基于蛋白质一级结构的预测方法 29
2.3.6 基于图论的预测方法 30
2.4 蛋白质复合物的识别 31
2.4.1 基于图划分的蛋白质复合物识别 32
2.4.2 基于层次聚类的蛋白质复合物识别 32
2.4.3 基于密度局部搜索的蛋白质复合物识别 33
2.4.4 其他方法 35
2.4.5 融合多元数据的蛋白质复合物挖掘研究 35
2.5 本章小结 36
第3章 利用BenefitRank在加权网络上进行链路预测 37
3.1 链路预测问题的分析 39
3.2 相关工作 41
3.3 相关背景知识 43
3.3.1 图的相关知识 43
3.3.2 马尔科夫性质 45
3.3.3 弱连接与强连接 46
3.4 问题定义 48
3.5 利用BenefitRank链路预测算法 50
3.5.1 预测算法相关定义 50
3.5.2 BenefitRank值的计算 52
3.6 链路预测相似性函数定义 54
3.6.1 基于共同邻居的BenefitRank度量 56
3.6.2 基于Adamic-Adar的BenefitRank度量 56
3.6.3 基于资源分配的BenefitRank度量 57
3.7 实验结果 58
3.7.1 实验数据集介绍 58
3.7.2 实验设置 59
3.7.3 实验结果与分析 59
3.8 本章小结 68
第4章 基于图模型的蛋白质复合物识别 70
4.1 HP-index图模型分析 73
4.2 问题描述与定义 74
4.3 基于HP-index图模型的蛋白质复合物识别算法分析 76
4.3.1 HP-index图模型的蛋白质复合物识别算法描述 77
4.3.2 算法分析 79
4.4 实验结果 79
4.5 本章小结 85
第5章 基于随机游走模型的蛋白质复合物识别算法 87
5.1 图上的随机游走理论 90
5.2 随机过程 91
5.3 基因本体论相关研究 91
5.3.1 GO的结构 92
5.3.2 GO的应用 95
5.4 蛋白质网络上的随机游走 96
5.4.1 经典算法 96
5.4.2 重启型随机游走 97
5.5 蛋白质加权网络上的随机游走 98
5.6 基于GO语义相似性的假阳性过滤 102
5.7 基于随机游走的蛋白质复合物识别算法 105
5.8 实验结果与分析 108
5.8.1 实验数据 108
5.8.2 评价标准 110
5.8.3 结果分析 112
5.9 本章小结 114
第6章 总结 116
参考文献 120