《蛋白质结构预测 支持向量机的应用 典藏版》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:孙向东,刘拥军,黄保续,谢仲伦编著
  • 出 版 社:北京:科学出版社
  • 出版年份:2016
  • ISBN:9787030474872
  • 页数:199 页
图书介绍:应用生物技术大系和现代生命科学前沿系列图书分别被列为“十一五”和“十二五”国家重点图书出版规划项目。本丛书针对生命科学领域前沿重点发展方向以及应用生物技术领域的新成果、新思路、新方法和新技术,全面展示了其最新的发展动态,涵盖了其基础理论和主要技术方法,呈现了新的概念与理论、技术,在更深层次上阐明了生命的本质规律,给人们提供了新的认识生命本质的手段,也为生物技术服务于人类开辟了新的途径。涉及领域包括生物医药、干细胞技术、工业微生物学、蛋白质及蛋白质组、系统生物学、合成生物学、生物材料、农业生物技术、环境生物技术、海洋生物技术、生物资源与安全等领域。

第1章 蛋白质结构预测概述 1

1.1蛋白质预测基本方法简介 1

1.2蛋白质二级结构和结构域预测方法简介 2

第2章 相关知识背景 5

2.1生物信息学 5

2.1.1生物信息学的定义、目的、内容和发展趋势 5

2.1.2基因组学 7

2.1.3蛋白质组学 8

2.1.4数据库 9

2.2蛋白质序列、结构与功能的关系 11

2.3机器学习 13

2.3.1机器学习的定义和特点 13

2.3.2基本的机器学习模型 15

2.3.3机器学习方法分类 16

2.3.4应用于生物信息学领域的机器学习方法 16

第3章 统计学习理论 21

3.1学习问题的表示方法 21

3.1.1概述 21

3.1.2学习问题的一般表示 22

3.1.3学习问题的模型 23

3.1.4经验风险最小化原则 24

3.1.5复杂性和推广能力 24

3.1.6模式识别问题 25

3.2统计学习理论的四个部分 25

3.2.1学习过程的一致性 25

3.2.2学习过程收敛速度的界 28

3.2.3控制学习过程推广能力的理论 30

第4章 构造支持向量机 34

4.1优化理论 34

4.1.1问题公式化 34

4.1.2拉格朗日理论 35

4.1.3KKT理论 36

4.2支持向量机 37

4.2.1支持向量机基本原理简介 37

4.2.2线性分类 38

4.2.3非线性分类 47

4.2.4多重分类 52

第5章 应用于支持向量机的主要算法 55

5.1支持向量机算法中目前的研究状况 55

5.2分解算法 56

5.3顺序最小优化算法 57

5.3.1顺序最小优化算法的原理 57

5.3.2两个拉格朗日乘子的优化问题 58

5.3.3选择待优化拉格朗日乘子的启发式方法 59

5.3.4每次最小优化后的重置工作 59

5.3.5顺序最小优化算法的特点和优势 60

第6章 Libsvm简介 61

6.1公式 61

6.1.1C-支持向量分类(二元) 61

6.1.2v支持向量分类(二元) 61

6.2二次规划问题的解决 62

6.2.1C-SVC的分解算法 62

6.2.2工作集的选择和停止循环的标准 63

6.2.3v支持向量分类的分解方法 64

6.2.4解析解法 65

6.2.5b和p的计算 67

6.3压缩和缓存 67

6.3.1压缩 67

6.3.2缓存 69

6.4多元分类 69

6.5非平衡数据集 70

6.6模型的选择 70

6.7预测蛋白质结构中运用Libsvm的基本操作方法 71

第7章 蛋白质二级结构预测 73

7.1蛋白质结构 73

7.1.1蛋白质的一级结构 73

7.1.2蛋白质的二级结构特征 74

7.1.3蛋白质结构域、三级结构与四级结构 76

7.2蛋白质二级结构定义 76

7.2.1DSSP数据库中的蛋白质二级结构特征识别 77

7.2.2蛋白质二级结构鉴别方法 80

7.2.3DEFINE算法对于蛋白质二级结构的定义 83

7.2.4P-Cruve方法 86

7.3蛋白质二级结构预测 89

7.3.1概述 89

7.3.2样本集的选择 92

7.3.3二级结构规类方法 93

7.3.4运用支持向量机进行蛋白质结构预测的样本提取方法与编码规则 94

7.3.5二级结构预测准确率评估方法 98

7.3.6蛋白质二级结构预测结果 101

第8章 蛋白质折叠类型的预测 108

8.1简介 108

8.2蛋白质结构域数据 110

8.2.1DALI算法和FSSP数据库——距离矩阵比对的蛋白质结构比较 110

8.2.2CATH蛋白质结构域数据库 113

8.2.3SCOP数据库 118

8.2.4SCOP、CATH和FSSP的关系 119

8.3蛋白质结构域的支持向量机预测方法 119

8.3.1蛋白质结构域预测中的样本集选择 119

8.3.2编码方法 120

8.3.3拓扑预测准确率的评估方法 121

8.3.4分类器设计与软件使用方法 125

8.3.5结果与分析 126

8.4小结 152

8.4.1结论 152

8.4.2讨论 153

参考文献 156

附表1RS126数据集 165

附表2CB513数据集 166

附表3蛋白质结构域拓扑层预测样本集 170

附表4蛋白质结构域同源超族层预测样本集 173

附表5蛋白质结构域序列家族层样本集 179