第1章 绪论 1
1.1 研究背景 1
1.1.1 生物信息学概述 1
1.1.2 后基因组时代与蛋白质组学 2
1.1.3 蛋白质序列、结构和功能之间的关系 3
1.1.4 蛋白质相互作用与功能 5
1.1.5 机器学习在生物信息学中的应用 6
1.2 研究目的和意义 7
1.3 研究内容和成果 8
1.4 本文的章节安排 10
第2章 基础知识与研究进展 12
2.1 蛋白质相互作用位点预测 12
2.2 蛋白质相互作用能量热点预测 13
2.2.1 能量热点的定义 13
2.2.2 能量热点的识别 13
2.2.3 现有的计算识别方法 15
2.3 蛋白质相互作用预测 17
2.4 蛋白质功能预测 17
2.4.1 蛋白质功能描述 18
2.4.2 已有蛋白质功能预测方法 19
第3章 蛋白质相互作用位点预测 22
3.1 基于集成学习的相互作用位点预测 22
3.1.1 实验数据集 23
3.1.2 性能评价指标 23
3.1.3 基于自协方差的特征生成 24
3.1.4 支持向量机 27
3.1.5 子集成分类器(Sub-Ensermble Classifier) 29
3.1.6 基于加权投票的子集成分类器融合 29
3.1.7 实验结果及分析 32
3.1.8 识别潜在药物标靶 40
3.2 基于结构邻居模板的相互作用界面预测 41
3.2.1 蛋白质结构比对 42
3.2.2 蛋白质结构相似度评估 42
3.2.3 结构邻居搜索 44
3.2.4 基于结构邻居模板的预测算法 45
3.2.5 实验结果与分析 46
3.2.6 相互作用位点预测Web服务器 48
3.3 本章小结 50
第4章 蛋白质相互作用能量热点预测 52
4.1 基于半监督学习的能量热点预测 52
4.1.1 半监督学习 52
4.1.2 迭代半监督支持向量机 55
4.1.3 特征提取 56
4.1.4 实验结果与分析 59
4.1.5 案例研究 62
4.2 基于结构邻居特征和集成学习的能量热点预测 63
4.2.1 残基特征获取 64
4.2.2 结构邻居特征 66
4.2.3 基于随机森林的特征选择 69
4.2.4 集成预测模型 69
4.2.5 实验结果与分析 70
4.2.6 能量热点预测Web服务器 77
4.3 本章小结 78
第5章 基于结构的全基因组蛋白质相互作用预测 79
5.1 基于贝叶斯网络的预测模型 79
5.1.1 贝叶斯网络 79
5.1.2 蛋白质结构与结构域 80
5.1.3 结构邻居与复合物模板 81
5.1.4 非结构信息 81
5.1.5 基于结构的相互作用集成预测模型 82
5.2 实验结果与分析 86
5.2.1 参考数据集 86
5.2.2 与已有方法比较 86
5.2.3 案例分析 87
5.3 蛋白质相互作用数据库 88
5.4 本章小结 88
第6章 蛋白质功能预测 93
6.1 基于序列组成信息的蛋白质功能预测 93
6.1.1 蛋白质序列基本组成模块 93
6.1.2 基于LSA和NMF的特征提取方法 94
6.1.3 实验结果与分析 95
6.2 基于结构比对和多数据源的蛋白质功能预测 99
6.2.1 基于结构邻居的功能预测方法 99
6.2.2 基于朴素贝叶斯和多数据源的集成功能预测方法 101
6.2.3 蛋白质功能预测性能评估策略 102
6.2.4 蛋白质功能语义相似分数 103
6.2.5 实验结果及分析 104
6.2.6 案例分析 106
6.3 本章小结 107
第7章 总结与展望 109
7.1 论文工作总结 109
7.2 未来工作展望 110
参考文献 111
致谢 125
个人简历、在学期间发表的学术论文与研究成果 126