当前位置:首页 > 生物
生物信息学中的数据挖掘方法及应用
生物信息学中的数据挖掘方法及应用

生物信息学中的数据挖掘方法及应用PDF电子书下载

生物

  • 电子书积分:10 积分如何计算积分?
  • 作 者:梁艳春等著
  • 出 版 社:北京:科学出版社
  • 出版年份:2011
  • ISBN:9787030326584
  • 页数:206 页
图书介绍:生物信息学是一门新兴的交叉学科,本书针对该领域的一些前沿课题,在简要介绍基因组学和转录组学基础知识及有关研究方向的背景后,以数据挖掘算法为中心,系统地介绍了机器学习、统计学习及多种智能算法在生物信息学相关领域的应用,为生物信息方向的初学者提供了入门知识,也为相关研究人员在特定方向进一步深入研究提供参考信息。本书的主要包括操纵子预测、原核生物系统发生树的构建、基于数据扰动的误标记样本检测、差异表达基因识别以及微阵列数据的特征选择等内容。
《生物信息学中的数据挖掘方法及应用》目录

第1章 绪论 1

1.1什么是生物信息学 1

1.2生物信息学的研究对象 2

1.2.1基因组数据 2

1.2.2蛋白质组数据 2

1.2.3基因表达数据 5

1.3生物信息学的研究领域 10

1.4生物信息学的进展和存在的问题 11

1.4.1生物信息学的进展 11

1.4.2生物信息学存在的问题 13

参考文献 14

第2章 操纵子预测 16

2.1操纵子预测的研究背景及现状 16

2.1.1操纵子简介 16

2.1.2操纵子预测的研究现状 17

2.2操纵子预测的相关数据 18

2.2.1基因间距离 18

2.2.2 COG功能分类 19

2.2.3保守基因对(簇) 20

2.2.4系统进化谱 22

2.2.5基因本体 24

2.2.6 KEGG同源 27

2.2.7同义密码子使用偏好性 29

2.2.8其他属性信息 31

2.2.9基因组和已知操纵子数据 32

2.3操纵子预测的相关基础 32

2.3.1预测问题定义 32

2.3.2预测数据预处理 33

2.3.3预测效果评价 35

2.4基于神经网络的操纵子预测模型 35

2.4.1模型的具体流程 36

2.4.2模型的实验验证 40

2.5基于图聚类方法的操纵子预测模型 43

2.5.1模型预测流程概括 44

2.5.2模型预测的具体流程 45

2.5.3模型的实验验证 53

2.6小结 55

参考文献 56

第3章 原核生物系统发生树的构建 59

3.1系统发生树构建的研究背景及现状 59

3.1.1系统发生树简介 59

3.1.2原核生物系统发生树构建的研究现状 59

3.2系统发生树构建的相关数据和基础 60

3.2.1原核生物基因组数据 60

3.2.2已知系统进化树数据 62

3.2.3直系同源信息 62

3.2.4水平转移基因信息 64

3.2.5操纵子信息 65

3.2.6构建问题定义 65

3.2.7结果性能估计 65

3.3基于连续直系同源基因的系统发生树构建方法 66

3.3.1方法描述 66

3.3.2方法的具体流程 67

3.3.3方法的实验验证 69

3.4基于全基因组序列和注释信息的系统发生树构建方法 72

3.4.1方法描述 72

3.4.2方法具体流程 73

3.4.3方法的实验验证 83

3.5小结 88

参考文献 89

第4章 基于数据扰动的误标记样本检测 92

4.1误标记样本检测的研究背景及现状 92

4.2基于LOOPC矩阵的误标记样本检测方法 93

4.2.1 LOOPC矩阵 94

4.2.2 CL-stability方法 95

4.2.3 LOOE-sensitivity方法 96

4.3基于扰动影响值的误标记样本检测方法 98

4.3.1扰动影响值 98

4.3.2基于扰动影响值的列算法 101

4.3.3基于扰动影响值的行算法 103

4.3.4行算法中的阈值调整策略 105

4.3.5渐进修正的行算法 108

4.4误标记样本检测方法的比较分析 111

4.4.1测试数据集说明 111

4.4.2测试指标说明 113

4.4.3实验结果分析 113

4.5小结 122

参考文献 122

第5章 基因表达数据中的差异表达基因识别 125

5.1差异表达基因的研究背景及现状 125

5.2 T -test假设检验方法 126

5.3 SAM方法 127

5.4 RankProd方法 128

5.5基于总体数据集变化量评估的检测方法 129

5.5.1基因的表达变化量 129

5.5.2总体数据集变化量评估 134

5.5.3总体数据集评估方法的效果分析 136

5.6小结 142

参考文献 142

第6章 基于微阵列数据的特征选择 144

6.1特征选择算法的研究背景及现状 144

6.1.1特征选择在基因芯片中的应用 144

6.1.2基于微阵列数据的特征选择算法的研究现状 145

6.2特征选择算法研究的相关基础 146

6.2.1支持向量机(SVM) 146

6.2.2支持向量机递归特征剔除(SVM-RFE) 147

6.2.3改进的支持向量聚类算法(SVC-KM) 148

6.2.4局部支持向量机(LLA) 148

6.3多阶段特征选择算法 149

6.3.1算法描述 149

6.3.2算法流程 150

6.3.3算法的实验验证 153

6.4双向局部化特征选择算法 160

6.4.1算法描述 160

6.4.2算法流程 161

6.4.3算法的实验验证 164

6.5基于改进遗传算法的特征选择方法 169

6.5.1算法描述 169

6.5.2算法过程概括 169

6.5.3算法流程 170

6.5.4算法效果的实验分析 174

6.6小结 177

参考文献 179

第7章 改进的双聚类算法在癌症基因芯片数据中的应用 182

7.1基因芯片数据聚类算法简介 182

7.1.1传统聚类算法概述 182

7.1.2常用的传统聚类算法及其特点 183

7.1.3传统聚类存在的不足 185

7.1.4双聚类算法分类及其特点 185

7.1.5 Cheng-Church算法 187

7.2改进的Cheng-Church算法及模拟数据分析 190

7.2.1 Cheng-Church算法的优缺点 190

7.2.2 Cheng-Church算法的改进 191

7.2.3模拟数据分析 192

7.3癌症基因芯片数据的双聚类分析 194

7.3.1癌症基因芯片数据分析的意义 194

7.3.2实验数据来源 195

7.3.3特征基因的选择 199

7.3.4双聚类分析 200

7.4小结 205

参考文献 206

返回顶部