第一章 概论 1
1.1 生物信息学产生的背景 1
1.2 人类基因组计划 2
1.3 什么是生物信息学 3
1.4 生物信息学的研究目标和内容 5
1.5 生物信息学的发展 9
1.6 生物信息学研究方法的新进展 11
1.7 国内外生物信息学研究现状 12
1.8 生物信息学的主要意义和展望 14
1.9 生物信息学与生物实验的关系 15
主要参考文献 15
第二章 生物学基础 17
2.1 生命起源和分子进化 17
2.1.1 生命起源的三个阶段 17
2.1.2 生命起源的假说 17
2.1.3 生命起源物质组成的争论 18
2.2 生物的分类 20
2.3 核酸 21
2.3.1 核酸的化学组成 21
2.3.2 DNA的一级结构 23
2.3.3 DNA的二级结构 23
2.3.4 DNA的三级结构 25
2.3.5 生物体中的DNA 25
2.3.6 RNA的结构 25
2.3.7 核酸的变性、复性与杂交 27
2.4 蛋白质 28
2.4.1 蛋白质的组成 28
2.4.2 蛋白质的分子结构 29
2.3 蛋白质结构预测和分子设汁 39
2.5 染色体和基因 39
2.5.1 染色体和染色质 39
2.5.2 基因及真核生物基因组 40
2.6 中心法则 46
2.6.1 中心法则的内容 46
2.6.2 DNA的复制 49
2.7 基因工程技术简介 50
2.7.1 概论 50
2.7.2 基因克隆的技术路线 51
2.7.3 基因组文库 58
2.7.4 重组DNA技术在医学生物学中的应用 59
主要参考文献 65
第三章 生物信息数据库及其信息检索 67
3.1 生物信息数据库的类型 67
3.2 序列数据库 67
3.2.1 核酸序列数据库 68
3.2.2 蛋白质序列数据库 83
3.3 结构数据库 85
3.3.1 蛋白质结构数据库 85
3.3.2 数据库结构显示程序 87
3.4 生物数据库的信息检索 88
3.4.1 Retrieve服务器 89
3.4.2 Entrez系统 89
3.4.3 SRS检索工具 91
3.5 向数据库提交数据 93
主要参考文献 95
第四章 序列比对与算法 96
4.1 序列两两比对 96
4.2 多序列比对 108
4.2.1 多序列比对程序CLUSTALW 108
4.2.2 tree_based算法和iterative算法 108
4.2.3 中心算法 109
4.3 序列分析算法 109
4.3.1 动态规划算法 110
4.3.2 隐马尔可夫模型 114
4.3.3 人工神经网络 134
4.3.4 基因表达调控网络 150
4.4 分子进化:系统树发育分析 155
4.4.1 分子钟与中性理论 155
4.4.2 进化树 157
4.4.3 进化树的分析步骤 161
4.4.4 相关软件使用简介 162
主要参考文献 168
第五章 核酸序列分析 170
5.1 DNA序列分析的意义 170
5.2 基因结构 171
5.3 序列翻译与ORF预测 172
5.4 核酸序列分析框架 174
5.5 基因识别的两种途径 175
5.6 数据库搜索 176
5.7 生物信息学软件 177
5.7.1 商业软件包 178
5.7.2 基于WEB的免费软件包 178
5.8 新测定DNA序列的分析实例 183
5.8.1 框架 183
5.8.2 功能性位点(Pattern或Motif)搜索 184
5.8.3 编码区的确定 185
5.8.4 核酸分子的立体结构 191
主要参考文献 193
第六章 蛋白质结构预测和分子设计 194
6.1 蛋白质结构预测 194
6.1.1 预测蛋白质的物理性质 195
6.1.2 从氨基酸组成辨识蛋白质 197
6.1.3 蛋白质二级结构预测 197
6.1.4 其他特殊局部结构预测 204
6.1 5 蛋白质的三维结构预测 208
6.2 蛋白质工程分子设计简介 209
6.2.1 分子设计的基本条件 210
6.2.2 分子设汁的基本方法 211
6.2.3 基于遗传算法的分子设计 212
6.3 蛋白质结构预测和分子设计的研究进展 214
主要参考文献 222
第七章 基因组信息学 224
7.1 概论 224
7.1.1 问题的提出 224
7.1.2 发展历程 225
7.1.3 HGP的意义 231
7.2 参与基因组计划的机构 232
7.2.1 国际机构 232
7.2.2 其他研究机构 233
7.3 图谱 234
7.3.1 遗传图谱 234
7.3.2 物理图谱 236
7.3.3 序列图谱 238
7.3.4 基因图谱 238
7.4 测序 239
7.5 基因组序列信息分析工具 241
7.5.1 Wisconsin软件包 241
7.5.2 ACEDB 242
7.5.3 其他工具 242
7.6 人类基因组信息数据库 242
7.6.1 NCBI Entrez的染色体图谱 242
7.6.2 GDB的染色体图谱 242
7.7 生物信息学在基因组研究中的应用 243
7.7.1 当前主要研究内容 244
7.7.2 生物信息学在基因组研究中的发展趋势 249
7.7.3 生物信息学的发展展望 252
7.8 后基因组计划 252
7.9 基因组信息学的研究进展 258
主要参考文献 260
第八章 蛋白质组信息学 263
8.1 蛋白质组学简介 263
8.1.1 蛋白质组学的概念 263
8.1.2 蛋白质组研究的理论基础 265
8.1.3 蛋白质组研究的技术路线 265
8.2 蛋白质组信息学 268
8.3 蛋白质组分析的内容和方法 270
8.4 蛋白质信息学相关资源 272
8.5 蛋白质组学的应用及前景 274
8.6 蛋白质组学研究中的常见问题 280
8.7 化学蛋白质组学 283
8.7.1 化学蛋白质组学的概念 283
8.7.2 化学蛋白质组学研究内容、相关技术及应用 283
8.7.3 化学蛋白质组学的展望 286
主要参考文献 287
第九章 生物信息学前沿 288
9.1 生物荩芯片技术 288
9.1.1 生物芯片简介 288
9.1.2 与生物芯片相关的技术 299
9.1.3 生物芯片数据分析 303
9.1.4 生物芯片数据分析的展望 311
9.2 药物设计与生物信息学 313
9.2.1 药物基因组学 313
9.2.2 药物蛋白质组学 317
9.2.3 生物信息学、基因组学和蛋白质组学与药物设计 320
9.2.4 计算机辅助药物设计 325
9.2.5 药物设计实例 335
9.3 基因诊断与治疗 340
9.3.1 基因诊断 340
9.3.2 基因治疗 364
9.4 虚拟细胞——人工生命的模型 394
9.4.1 虚拟细胞的构建 395
9.4.2 虚拟细胞的模型 396
9.4.3 虚拟细胞特点 398
9.4.4 虚拟细胞相关的学科领域 398
9.4.5 研究虚拟细胞的意义 399
主要参考文献 401
附录一 生物信息学相关数据库 405
附录二 生物信息学重要软件简介 409
附录三 生物信息学名词解释 428
附录四 习题 435
编著者简介 445