第1章 生物信息学概述 1
1.1背景与定义 1
1.1.1生物学原始数据量的急剧扩增 1
1.1.2名词“bioinformatics”的第一次出现 2
1.1.3定义 3
1.2研究内容 4
1.2.1生物信息的存储与获取 4
1.2.2序列比对 4
1.2.3测序与拼接 5
1.2.4基因预测 5
1.2.5生物进化与系统发育分析 6
1.2.6蛋白质结构预测 6
1.2.7 RNA结构预测 6
1.2.8分子设计及药物设计 7
1.2.9代谢网络分析 7
1.2.10生物芯片 7
1.2.11 DNA计算 8
1.3数据库、软件、科研教育机构 8
1.3.1数据库 8
1.3.2软件 9
1.3.3科研教育机构 9
1.4期刊与著作 12
1.4.1期刊 12
1.4.2著作 13
1.5生物学、计算机技术与数学基础 13
1.5.1生物学 14
1.5.2计算机技术 14
1.5.3数学 15
1.6展望 15
1.6.1研究内容的展望 15
1.6.2应用领域的拓展 16
1.6.3研究者的回报 16
可免费登录的相关网站 17
习题 18
参考文献 18
第2章 生物信息学的生物学基础 20
2.1生物学研究的层次 20
2.1.1宇宙生命的研究 20
2.1.2生物与环境的关系 22
2.1.3生物种类 25
2.1.4生理 29
2.1.5细胞 32
2.1.6生物分子 34
2.1.7生物进化 35
2.2分子生物学基础 37
2.2.1核酸的结构 38
2.2.2蛋白质的结构 42
2.2.3 DNA的复制 45
2.2.4基因的转录 47
2.2.5蛋白质的生物合成 48
2.3人类基因组计划 49
2.3.1目标与意义 50
2.3.2资助 50
2.3.3研究机构 51
2.3.4研究方法 51
2.3.5目前结果 55
可免费登录的相关网站 57
习题 57
参考文献 57
第3章 数据库与网络基础 60
3.1数据库技术基础 60
3.1.1数据库的基本概念 60
3.1.2数据库的体系结构和数据独立性 60
3.1.3关系数据库系统 62
3.1.4生物数据处理常用的数据库系统 63
3.2网络技术简介 64
3.2.1网络基础知识 64
3.2.2 Internet及其应用 65
3.2.3基于Web的数据库系统 68
3.2.4基于网络的搜索引擎 70
可免费登录的相关网站 73
习题 73
参考文献 73
第4章 UNIX操作系统与计算机语言 75
4.1 UNIX操作系统 75
4.1.1 UNIX历史 75
4.1.2 UNIX系统的特点 76
4.1.3 Redhat Linux 9的安装 77
4.1.4 UNIX的基本使用 81
4.1.5大型应用软件 85
4.2计算机语言 85
4.2.1 Perl语言简介 86
4.2.2 Java语言简介 89
可免费登录的相关网站 89
习题 90
参考文献 90
第5章 算法与数学基础 91
5.1算法 91
5.2图论 93
5.2.1图 93
5.2.2寻找最短路 95
5.2.3欧拉图与哈密顿图 98
5.2.4树 100
5.2.5图论在生物信息学中的应用 101
5.3动态规划 102
5.4贝叶斯统计 104
5.4.1经典统计学的几个概念 104
5.4.2经典统计与贝叶斯统计的差异 105
5.4.3贝叶斯定理 105
5.4.4贝叶斯统计在生物信息学中的应用 106
5.5马尔可夫模型 107
5.5.1概念 107
5.5.2转移概率 107
5.5.3算法过程 108
5.5.4马尔可夫模型在生物信息学中的应用 109
5.6隐马尔可夫模型 109
5.6.1概念 109
5.6.2算法过程 110
5.6.3隐马尔可夫模型三个问题的研究 113
5.6.4隐马尔可夫模型在生物信息学中的应用 113
5.7神经网络模型 114
5.7.1神经网络的分类 114
5.7.2神经网络的学习方法 115
5.7.3神经网络模型在生物信息学中的应用 123
5.8遗传算法 123
5.8.1概念 123
5.8.2遗传算法运算过程 124
5.8.3遗传算法在生物信息学中的应用 127
5.9聚类分析 128
5.9.1相似性测度及聚类准则 128
5.9.2聚类算法 128
5.9.3聚类分析在生物信息学中的应用 131
5.10其他应用于生物信息学中的算法 132
5.11生物信息学中算法的发展 132
可免费登录的相关网站 132
习题 132
参考文献 133
第6章 序列比对 134
6.1序列比对的概念 134
6.2序列比对的意义 135
6.3全局比对与局部比对 136
6.3.1全局比对 136
6.3.2局部比对 136
6.4计分方法 137
6.4.1匹配计分 137
6.4.2结构与性质的计分 137
6.4.3可观测变换计分 137
6.4.4空格罚分 150
6.5比对的算法过程 150
6.5.1两个序列比对 150
6.5.2多序列比对 158
6.6比对软件的使用 165
6.6.1用比对软件进行两序列比对 165
6.6.2用比对软件进行多序列比对 168
6.7计算机语言编写程序进行序列比对 169
可免费登录的相关网站 173
习题 173
参考文献 173
第7章 序列拼接 175
7.1霰弹法测序的DNA序列拼接 175
7.1.1霰弹法测序原理 175
7.1.2霰弹法测序拼接的计算模型 176
7.2杂交测序法的DNA序列拼接 178
7.2.1杂交测序法原理 178
7.2.2杂交法测序拼接的计算模型 179
可免费登录的相关网站 180
习题 180
参考文献 181
第8章 生物信息数据库的查询与搜索 182
8.1生物信息数据库 182
8.1.1核酸序列数据库 182
8.1.2蛋白质序列数据库 183
8.1.3结构数据库 184
8.1.4基因组数据库 185
8.1.5蛋白组数据库 185
8.1.6代谢组数据库 185
8.1.7疾病数据库 185
8.1.8药物与分子设计数据库 186
8.1.9分析与记录方式数据库 186
8.2生物信息数据库的字符匹配查询 186
8.2.1查询系统SRS 186
8.2.2查询系统Entrez 193
8.3生物信息数据库的相似性搜索 199
8.3.1 BLAST 199
8.3.2 FASTA 207
可免费登录的相关网站 210
习题 210
参考文献 211
第9章 生物进化与分子系统发育分析 213
9.1生物进化 213
9.1.1进化理论的历史 213
9.1.2进化与自然选择的证据 219
9.1.3分子进化 228
9.1.4生物进化与生物信息学的关系 234
9.2分子系统发育分析 234
9.2.1分子系统发育分析的概念 234
9.2.2构建进化树的方法 235
9.2.3用网上软件构建进化树 266
可免费登录的相关网站 280
习题 280
参考文献 281
第10章 基因预测与引物设计 285
10.1基因特征 285
10.1.1原核生物的基因特征 285
10.1.2真核生物的基因特征 286
10.2基于EST的基因鉴定 288
10.2.1 EST概念 288
10.2.2 EST的获得 288
10.2.3 EST与基因识别 288
10.2.4 EST的其他用途 289
10.2.5 EST数据的不足 289
10.3基因预测的算法 289
10.3.1相似性比较预测 289
10.3.2隐马尔可夫模型 290
10.3.3神经网络方法 290
10.3.4密码学方法 290
10.3.5 Z-曲线法 290
10.3.6其他算法 291
10.4引物设计 291
10.4.1上、下游引物的3′末端与5′末端 291
10.4.2引物分子内不互补 291
10.4.3引物的长度、组分与解链温度 291
10.5网上的基因预测软件 292
可免费登录的相关网站 293
习题 294
参考文献 294
第11章 蛋白质结构及其预测 295
11.1蛋白质的结构及其实验测定方法 295
11.1.1蛋白质的结构概述 295
11.1.2维系蛋白质结构的作用力 295
11.1.3蛋白质结构的显示软件 296
11.1.4蛋白质结构的实验测定方法 297
11.2蛋白质分类 304
11.2.1按序列特征分类 304
11.2.2按在生物体中的位置分类 304
11.2.3按折叠类型分类 304
11.3蛋白质结构预测算法 308
11.3.1特殊序列预测 308
11.3.2蛋白质二级结构的预测 309
11.3.3蛋白质三级结构的预测 314
11.4蛋白质结构预测软件 318
11.4.1蛋白质二级结构预测软件 318
11.4.2蛋白质三级结构预测软件 320
11.5编写计算机程序进行蛋白质二级结构预测 322
可免费登录的相关网站 325
习题 326
参考文献 326
第12章 RNA结构与预测 328
12.1 RNA的发现及其功能研究 328
12.2 RNA的结构特征及其与功能的关系 330
12.2.1 RNA的结构层次 330
12.2.2核糖体RNA的结构 331
12.2.3 tRNA的结构 333
12.2.4 mRNA的结构与功能 336
12.2.5核酶的结构与功能 340
12.2.6形成RNA特定结构的序列特征 341
12.3 RNA二级结构的预测算法 343
12.3.1比较序列分析方法 343
12.3.2动态规划算法 344
12.3.3对RNA结构预测算法的评价 345
12.4网上RNA二级结构分析软件 346
可免费登录的相关网站 347
习题 347
参考文献 347
第13章 生物芯片 349
13.1引言 349
13.2生物芯片的原理 350
13.2.1生物芯片的制备 350
13.2.2待检生物样品制备和标记 355
13.2.3生物分子之间的结合 355
13.2.4检测原理 356
13.3数据分析 356
13.3.1图像分析 356
13.3.2标准化处理(normalization) 357
13.3.3 Ratio分析(ratio analysis) 358
13.3.4聚类分析(clustering analysis) 358
13.3.5基因表达数据库 358
13.4其他生物芯片技术 359
13.4.1微流路芯片 359
13.4.2活体化芯片 359
13.4.3芯片实验室(lab-on-a chip) 359
可免费登录的相关网站 359
习题 359
参考文献 359
第14章 计算机辅助药物设计 361
14.1计算机辅助药物设计的概念 361
14.2药物设计的理论基础 364
14.2.1受体与配体 364
14.2.2理论计算方法 370
14.3结合自由能的计算 375
14.3.1自由能微扰/热力学积分方法 375
14.3.2线性相互作用能方法 376
14.3.3打分函数 377
14.4基于配体的药物设计 377
14.4.1定量构效关系方法 378
14.4.2药效团模型方法 380
14.5基于受体的药物设计 383
14.5.1重新配体设计 384
14.5.2分子对接虚拟筛选 388
14.5.3生物大分子模建和药物设计集成软件包——InsightⅡ 401
14.6药物发现集成平台 404
可免费登录的相关网站 406
习题 407
参考文献 407
第15章 生物分子网络与生物系统仿真 408
15.1生物分子网络 408
15.1.1生物分子网络的特征与研究方法 408
15.1.2代谢网络 410
15.1.3基因调控网络 412
15.1.4蛋白质相互作用网络 414
15.2生物系统仿真 415
15.3系统生物学概况 417
可免费登录的相关网站 418
习题 419
参考文献 419
第16章 DNA计算 420
16.1 DNA计算的生物学基础 420
16.1.1 DNA的组成 420
16.1.2碱基配对 420
16.1.3 DNA分子的制备 421
16.1.4连接、合成DNA与RNA分子的酶类的作用 422
16.1.5切割DNA的酶类的作用 422
16.1.6 DNA序列的测定 423
16.2 Adleman开创DNA计算研究领域的实验 423
16.3 DNA计算的应用 434
16.4问题与展望 435
可免费登录的相关网站 436
习题 436
参考文献 436
附表1 生物信息数据库 437
附表2 中国、美国、英国、加拿大、澳大利亚科研教育机构开设生物信息学专业的情况 490
汉英名词索引 515
英汉名词索引 519