生物信息学中的数据挖掘方法及应用PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:梁艳春等著
- 出 版 社:北京:科学出版社
- 出版年份:2011
- ISBN:9787030326584
- 页数:206 页
第1章 绪论 1
1.1什么是生物信息学 1
1.2生物信息学的研究对象 2
1.2.1基因组数据 2
1.2.2蛋白质组数据 2
1.2.3基因表达数据 5
1.3生物信息学的研究领域 10
1.4生物信息学的进展和存在的问题 11
1.4.1生物信息学的进展 11
1.4.2生物信息学存在的问题 13
参考文献 14
第2章 操纵子预测 16
2.1操纵子预测的研究背景及现状 16
2.1.1操纵子简介 16
2.1.2操纵子预测的研究现状 17
2.2操纵子预测的相关数据 18
2.2.1基因间距离 18
2.2.2 COG功能分类 19
2.2.3保守基因对(簇) 20
2.2.4系统进化谱 22
2.2.5基因本体 24
2.2.6 KEGG同源 27
2.2.7同义密码子使用偏好性 29
2.2.8其他属性信息 31
2.2.9基因组和已知操纵子数据 32
2.3操纵子预测的相关基础 32
2.3.1预测问题定义 32
2.3.2预测数据预处理 33
2.3.3预测效果评价 35
2.4基于神经网络的操纵子预测模型 35
2.4.1模型的具体流程 36
2.4.2模型的实验验证 40
2.5基于图聚类方法的操纵子预测模型 43
2.5.1模型预测流程概括 44
2.5.2模型预测的具体流程 45
2.5.3模型的实验验证 53
2.6小结 55
参考文献 56
第3章 原核生物系统发生树的构建 59
3.1系统发生树构建的研究背景及现状 59
3.1.1系统发生树简介 59
3.1.2原核生物系统发生树构建的研究现状 59
3.2系统发生树构建的相关数据和基础 60
3.2.1原核生物基因组数据 60
3.2.2已知系统进化树数据 62
3.2.3直系同源信息 62
3.2.4水平转移基因信息 64
3.2.5操纵子信息 65
3.2.6构建问题定义 65
3.2.7结果性能估计 65
3.3基于连续直系同源基因的系统发生树构建方法 66
3.3.1方法描述 66
3.3.2方法的具体流程 67
3.3.3方法的实验验证 69
3.4基于全基因组序列和注释信息的系统发生树构建方法 72
3.4.1方法描述 72
3.4.2方法具体流程 73
3.4.3方法的实验验证 83
3.5小结 88
参考文献 89
第4章 基于数据扰动的误标记样本检测 92
4.1误标记样本检测的研究背景及现状 92
4.2基于LOOPC矩阵的误标记样本检测方法 93
4.2.1 LOOPC矩阵 94
4.2.2 CL-stability方法 95
4.2.3 LOOE-sensitivity方法 96
4.3基于扰动影响值的误标记样本检测方法 98
4.3.1扰动影响值 98
4.3.2基于扰动影响值的列算法 101
4.3.3基于扰动影响值的行算法 103
4.3.4行算法中的阈值调整策略 105
4.3.5渐进修正的行算法 108
4.4误标记样本检测方法的比较分析 111
4.4.1测试数据集说明 111
4.4.2测试指标说明 113
4.4.3实验结果分析 113
4.5小结 122
参考文献 122
第5章 基因表达数据中的差异表达基因识别 125
5.1差异表达基因的研究背景及现状 125
5.2 T -test假设检验方法 126
5.3 SAM方法 127
5.4 RankProd方法 128
5.5基于总体数据集变化量评估的检测方法 129
5.5.1基因的表达变化量 129
5.5.2总体数据集变化量评估 134
5.5.3总体数据集评估方法的效果分析 136
5.6小结 142
参考文献 142
第6章 基于微阵列数据的特征选择 144
6.1特征选择算法的研究背景及现状 144
6.1.1特征选择在基因芯片中的应用 144
6.1.2基于微阵列数据的特征选择算法的研究现状 145
6.2特征选择算法研究的相关基础 146
6.2.1支持向量机(SVM) 146
6.2.2支持向量机递归特征剔除(SVM-RFE) 147
6.2.3改进的支持向量聚类算法(SVC-KM) 148
6.2.4局部支持向量机(LLA) 148
6.3多阶段特征选择算法 149
6.3.1算法描述 149
6.3.2算法流程 150
6.3.3算法的实验验证 153
6.4双向局部化特征选择算法 160
6.4.1算法描述 160
6.4.2算法流程 161
6.4.3算法的实验验证 164
6.5基于改进遗传算法的特征选择方法 169
6.5.1算法描述 169
6.5.2算法过程概括 169
6.5.3算法流程 170
6.5.4算法效果的实验分析 174
6.6小结 177
参考文献 179
第7章 改进的双聚类算法在癌症基因芯片数据中的应用 182
7.1基因芯片数据聚类算法简介 182
7.1.1传统聚类算法概述 182
7.1.2常用的传统聚类算法及其特点 183
7.1.3传统聚类存在的不足 185
7.1.4双聚类算法分类及其特点 185
7.1.5 Cheng-Church算法 187
7.2改进的Cheng-Church算法及模拟数据分析 190
7.2.1 Cheng-Church算法的优缺点 190
7.2.2 Cheng-Church算法的改进 191
7.2.3模拟数据分析 192
7.3癌症基因芯片数据的双聚类分析 194
7.3.1癌症基因芯片数据分析的意义 194
7.3.2实验数据来源 195
7.3.3特征基因的选择 199
7.3.4双聚类分析 200
7.4小结 205
参考文献 206
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《生物质甘油共气化制氢基础研究》赵丽霞 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《奶制品化学及生物化学》(爱尔兰)福克斯(FoxP.F.)等 2019
- 《基于地质雷达信号波的土壤重金属污染探测方法研究》赵贵章 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《数学物理方法与仿真 第3版》杨华军 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Helmholtz方程的步进计算方法研究》李鹏著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《美国小学分级阅读 二级D 地球科学&物质科学》本书编委会 2016
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《强磁场下的基础科学问题》中国科学院编 2020
- 《小牛顿科学故事馆 进化论的故事》小牛顿科学教育公司编辑团队 2018
- 《小牛顿科学故事馆 医学的故事》小牛顿科学教育公司编辑团队 2018
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019