当前位置:首页 > 生物
蛋白质结构预测  支持向量机的应用
蛋白质结构预测  支持向量机的应用

蛋白质结构预测 支持向量机的应用PDF电子书下载

生物

  • 电子书积分:9 积分如何计算积分?
  • 作 者:孙向东,刘拥军,黄保续等编著
  • 出 版 社:北京:科学出版社
  • 出版年份:2008
  • ISBN:9787030223876
  • 页数:199 页
图书介绍:统计学习理论是在上个世纪90年代逐渐成熟的机器学习理论,以这种理论为基础的支持向量机与以往的学习机器相比具有支持小样本、不会陷入局部势井、具有很好的鲁棒性以及运算成本低等优势。实现这种理论的支持向量机算法已经成为机器学习和知识挖掘的标准工具。从2001年支持向量机首次被运用进行蛋白质二级结构的预测以来,这种算法已经被用于对于蛋白质的结构类型、亚细胞结构和膜蛋白的结构等领域的预测中。本书对运用支持向量机进行蛋白质结构预测进行了前瞻性的探索并取得了一定的结果。
《蛋白质结构预测 支持向量机的应用》目录

第1章 蛋白质结构预测概述 1

1.1 蛋白质预测基本方法简介 1

1.2 蛋白质二级结构和结构域预测方法简介 2

第2章 相关知识背景 5

2.1 生物信息学 5

2.1.1 生物信息学的定义、目的、内容和发展趋势 5

2.1.2 基因组学 7

2.1.3 蛋白质组学 8

2.1.4 数据库 9

2.2 蛋白质序列、结构与功能的关系 11

2.3 机器学习 13

2.3.1 机器学习的定义和特点 13

2.3.2 基本的机器学习模型 15

2.3.3 机器学习方法分类 16

2.3.4 应用于生物信息学领域的机器学习方法 16

第3章 统计学习理论 21

3.1 学习问题的表示方法 21

3.1.1 概述 21

3.1.2 学习问题的一般表示 22

3.1.3 学习问题的模型 23

3.1.4 经验风险最小化原则 24

3.1.5 复杂性和推广能力 24

3.1.6 模式识别问题 25

3.2 统计学习理论的四个部分 25

3.2.1 学习过程的一致性 25

3.2.2 学习过程收敛速度的界 28

3.2.3 控制学习过程推广能力的理论 30

第4章 构造支持向量机 34

4.1 优化理论 34

4.1.1 问题公式化 34

4.1.2 拉格朗日理论 35

4.1.3 KKT理论 36

4.2 支持向量机 37

4.2.1 支持向量机基本原理简介 37

4.2.2 线性分类 38

4.2.3 非线性分类 47

4.2.4 多重分类 52

第5章 应用于支持向量机的主要算法 55

5.1 支持向量机算法中目前的研究状况 55

5.2 分解算法 56

5.3 顺序最小优化算法 57

5.3.1 顺序最小优化算法的原理 57

5.3.2 两个拉格朗日乘子的优化问题 58

5.3.3 选择待优化拉格朗日乘子的启发式方法 59

5.3.4 每次最小优化后的重置工作 59

5.3.5 顺序最小优化算法的特点和优势 60

第6章 Libsvm简介 61

6.1 公式 61

6.1.1 C-支持向量分类(二元) 61

6.1.2 v支持向量分类(二元) 61

6.2 二次规划问题的解决 62

6.2.1 C-SVC的分解算法 62

6.2.2 工作集的选择和停止循环的标准 63

6.2.3 v支持向量分类的分解方法 64

6.2.4 解析解法 65

6.2.5 b和p的计算 67

6.3 压缩和缓存 67

6.3.1 压缩 67

6.3.2 缓存 69

6.4 多元分类 69

6.5 非平衡数据集 70

6.6 模型的选择 70

6.7 预测蛋白质结构中运用Libsvm的基本操作方法 71

第7章 蛋白质二级结构预测 73

7.1 蛋白质结构 73

7.1.1 蛋白质的一级结构 73

7.1.2 蛋白质的二级结构特征 74

7.1.3 蛋白质结构域、三级结构与四级结构 76

7.2 蛋白质二级结构定义 76

7.2.1 DSSP数据库中的蛋白质二级结构特征识别 77

7.2.2 蛋白质二级结构鉴别方法 80

7.2.3 DEFINE算法对于蛋白质二级结构的定义 83

7.2.4 P-Cruve方法 86

7.3 蛋白质二级结构预测 89

7.3.1 概述 89

7.3.2 样本集的选择 92

7.3.3 二级结构规类方法 93

7.3.4 运用支持向量机进行蛋白质结构预测的样本提取方法与编码规则 94

7.3.5 二级结构预测准确率评估方法 98

7.3.6 蛋白质二级结构预测结果 101

第8章 蛋白质折叠类型的预测 108

8.1 简介 108

8.2 蛋白质结构域数据 110

8.2.1 DALI算法和FSSP数据库——距离矩阵比对的蛋白质结构比较 110

8.2.2 CATH蛋白质结构域数据库 113

8.2.3 SCOP数据库 118

8.2.4 SCOP、CATH和FSSP的关系 119

8.3 蛋白质结构域的支持向量机预测方法 119

8.3.1 蛋白质结构域预测中的样本集选择 119

8.3.2 编码方法 120

8.3.3 拓扑预测准确率的评估方法 121

8.3.4 分类器设计与软件使用方法 125

8.3.5 结果与分析 126

8.4 小结 152

8.4.1 结论 152

8.4.2 讨论 153

参考文献 156

附表1 RS126数据集 165

附表2 CB513数据集 166

附表3 蛋白质结构域拓扑层预测样本集 170

附表4 蛋白质结构域同源超族层预测样本集 173

附表5 蛋白质结构域序列家族层样本集 179

相关图书
作者其它书籍
返回顶部