第1章 生物信息学简介 1
1.1引言 2
1.2生物信息学的发展历史 3
1.2.1生物信息学的诞生 3
1.2.2生物信息学的兴起 5
1.2.3生物信息学的蓬勃发展 6
1.3生物信息学的研究内容 6
1.3.1基因组学研究 7
1.3.2转录组数据分析 8
1.3.3蛋白质组学分析 9
1.3.4生物网络分析 10
1.3.5系统生物学研究 11
1.3.6医学相关研究 13
1.4生物信息学的研究资源 14
1.4.1研究机构 14
1.4.2数据库 15
1.4.3文献资源 25
1.4.4分析工具 27
1.4.5编程语言 33
1.5生物信息学的应用 35
1.5.1辅助实验设计 36
1.5.2提供数据分析的工具 36
1.5.3探索生物规律 36
1.5.4促进医学研究 37
1.6生物信息学展望 37
1.6.1导致重大的科学规律的发现 38
1.6.2促进不同学科的交融 38
1.6.3提供对于复杂系统的分析能力 38
1.6.4展现巨大的应用前景 39
习题 39
参考文献 40
第2章 生物学基础 42
2.1生命概述 43
2.2生命科学的研究历史 43
2.2.1描述生物学阶段 43
2.2.2实验生物学阶段 44
2.2.3现代生物学阶段 45
2.3生命的有序结构 47
2.3.1细胞的定义和功能 48
2.3.2细胞的基本组分 48
2.3.3细胞分裂 50
2.4生命活动的动态运行 52
2.4.1基因概述 53
2.4.2中心法则 55
2.4.3蛋白质解说 60
2.5生物学研究展望 64
习题 66
参考文献 66
第3章 生物信息学算法介绍 67
3.1生物信息学算法概述 68
3.2数学统计方法 68
3.2.1统计假设检验 68
3.2.2回归与相关 72
3.2.3隐马尔可夫模型 76
3.3特征选择与优化方法 77
3.3.1特征提取算法 77
3.3.2数据压缩算法 80
3.4模式分类方法 86
3.4.1 K近邻法 87
3.4.2贝叶斯分类器 90
3.4.3决策树方法 96
3.4.4支持向量机方法 101
3.4.5人工神经网络 103
3.4.6遗传算法 106
3.4.7聚类算法 109
3.4.8分类器的选择 113
3.5模型评估方法 114
3.5.1构建标准数据集 114
3.5.2评价指标 115
3.6生物信息学算法展望 117
习题 117
参考文献 119
第4章 基因组技术与研究方法 120
4.1基因组概述 121
4.2人类基因组计划 122
4.2.1人类基因组计划的提出 122
4.2.2人类基因组计划的主要任务 122
4.2.3大规模测序的基本策略 124
4.2.4人类基因组计划的完成 124
4.2.5人类基因组计划对生物信息学的挑战 130
4.3功能基因组 131
4.3.1基因组注释 132
4.3.2进化论和比较基因组学 137
4.4差异基因组学 147
4.4.1人类遗传多态性 148
4.4.2单核苷酸的多态性 148
4.5基于MATLAB工具箱的基因序列分析 153
4.5.1序列比对 153
4.5.2系统发生树构建 160
4.6基因组研究展望 164
习题 166
参考文献 166
第5章 转录组技术与数据分析 168
5.1转录组概述 169
5.2转录组研究的实验技术 170
5.2.1基因芯片技术 171
5.2.2基因表达序列分析 174
5.2.3 RNA测序技术 176
5.2.4转录组检测技术比较 176
5.3生物信息学方法在转录组研究中的应用 178
5.3.1基因芯片数据标准 179
5.3.2基因芯片设计 179
5.3.3数据分析算法 182
5.4基因芯片数据分析与处理 182
5.4.1基因表达数据预处理 183
5.4.2芯片数据的统计学分析 189
5.4.3基因芯片的生物学分析 198
5.4.4芯片数据分析软件 204
5.5基于MATLAB工具箱的基因芯片数据分析 207
5.5.1基因芯片数据来源 207
5.5.2基因表达谱数据分析 207
5.5.3芯片数据分析小结 215
5.6转录组研究展望 216
习题 217
参考文献 217
第6章 蛋白质组学技术与数据分析 219
6.1蛋白质组概述 220
6.2蛋白质组学的定义 221
6.2.1蛋白质组学发展历史 221
6.2.2蛋白质组学研究内容 223
6.3蛋白质组学实验技术 224
6.3.1蛋白质分离技术 224
6.3.2蛋白质鉴定与定量技术 227
6.4质谱数据分析 236
6.4.1质谱数据的特点 236
6.4.2蛋白质鉴定 238
6.4.3蛋白质定量 251
6.4.4翻译后修饰 263
6.5蛋白质组学研究展望 265
参考文献 266
第7章 生物分子网络研究 270
7.1生物网络概述 271
7.2生物网络分类介绍 271
7.2.1蛋白质相互作用网络 272
7.2.2代谢网络 275
7.2.3信号转导网络 277
7.2.4基因表达调控网络 280
7.2.5 4种生物网络的比较 282
7.3生物网络的属性分析 283
7.3.1单个结点的属性 284
7.3.2子网络 286
7.3.3总体属性 289
7.3.4网络比对 295
7.3.5网络的动态分析 298
7.4生物网络的专门分析方法 302
7.4.1蛋白质相互作用的预测和验证 302
7.4.2代谢网络的分析方法 308
7.4.3信号网络的重建 310
7.4.4基因调控网络的构建 312
7.5生物网络研究展望 315
习题 316
参考文献 316
第8章 系统生物学研究 320
8.1系统生物学概述 321
8.1.1系统生物学的定义 321
8.1.2系统生物学的基本思想 322
8.1.3系统生物学的研究内容 324
8.1.4系统生物学的研究方法 324
8.2生物数据的挖掘与整合 325
8.2.1生物数据的挖掘 325
8.2.2不同组学数据的整合 327
8.3生物系统的建模与仿真 334
8.3.1系统生物学建模语言 335
8.3.2生物系统建模过程 338
8.4从虚拟细胞到虚拟人 344
8.4.1虚拟细胞 344
8.4.2虚拟器官 348
8.4.3虚拟人体 349
8.5生物系统的人工合成——合成生物学 351
8.5.1合成生物学简介 351
8.5.2合成生物学研究现状 352
8.5.3合成生物学应用前景 355
8.6基于MATLAB工具箱的生物过程模拟 356
8.6.1研究对象 356
8.6.2建立信号通路模型 357
8.6.3模型仿真与结果演示 359
8.6.4模型参数估计 361
8.6.5仿真结果分析 363
8.7系统生物学研究展望 363
习题 364
参考文献 364
第9章 生物信息学在药物研发中的应用 367
9.1新药研发概述 368
9.2疾病相关的数据库资源 371
9.2.1疾病相关的基因数据库 371
9.2.2候选药靶数据库 372
9.2.3疾病相关的基因芯片数据库 372
9.2.4其他相关数据库 373
9.3用于药靶发现的生物信息学方法 373
9.3.1基因组学方法 374
9.3.2转录组学方法 375
9.3.3蛋白质水平研究方法 379
9.3.4代谢组学方法 383
9.3.5整合多组学数据的系统生物学方法 383
9.4潜在药靶的生物信息学验证 387
9.4.1蛋白质的可药性 388
9.4.2药物的副作用 389
9.5以靶标为基础的药物设计 390
9.5.1先导化合物的筛选和优化 390
9.5.2药物毒性预测和风险评估 396
9.6新药研发展望 397
参考文献 397
索引 401