第1章 概论 1
1.1内容组织 2
1.2生物信息学:大图景 2
1.3对学生和教师的建议:练习、发现基因和描述基因组 3
1.4生物信息学软件:两种文化 4
1.5生物信息学和其他信息学学科 7
第2章 序列数据检索 8
2.1存储DNA序列的集成式数据库 9
2.2 DNA、RNA和蛋白质数据库的内容 10
2.3生物信息资源中心:NCBI和EBI 14
2.4信息获取:通过检索号来标记并识别序列 15
2.5通过NCBI基因资源获取信息 17
2.6命令行访问NCBI数据 19
2.7信息获取:基因组浏览器 20
2.8访问序列数据实例:单个基因/蛋白 21
2.9如何访问数据集:区域和特征的大范围查询 23
2.10查阅生物医学文献 25
第3章 双序列比对 27
3.1引言 27
3.2评分矩阵 31
3.3比对算法:全局和局部 37
3.4双序列比对的统计意义 42
3.5展望 44
3.6误区 44
第4章 基本局部比对搜索工具 45
4.1 BLAST搜索步骤 46
4.2 BLAST算法使用局部比对搜索 52
4.3 BLAST搜索的策略 56
4.4用BLAST搜索发现基因:查找基因 59
4.5展望 61
4.6误区 62
第5章 高级数据库搜索 63
5.1特异BLAST网站 64
5.2获得远缘相关蛋白的PSI-BLAST和DELTA-BLAST 65
5.3分布型研究:隐马尔可夫模型 70
5.4类BLAST匹配工具快速搜索基因组DNA 73
5.5把二代测序读段序列匹配到参照基因组上 76
5.6误区 78
第6章 多序列比对 79
6.1简介 79
6.2五种主要的多序列比对方法 81
6.3基准研究:方法、发现和挑战 87
6.4多序列比对数据库 88
6.5基因组区域的多序列比对 91
6.6展望 94
6.7误区 94
第7章 分子系统发育及进化 95
7.1分子水平的进化 95
7.2分子系统发育与进化原理 96
7.3分子系统发育:树的性质 102
7.4树的类型 105
7.5系统发育分析的五个步骤 107
第8章 真核生物染色体 119
8.1真核生物与细菌和古细菌的主要差异 119
8.2真核生物基因组和染色体的主要特征 120
8.3真核生物染色体中的重复DNA 124
8.4真核染色体中的基因 126
8.5真核生物染色体的调控区域 127
8.6真核生物DNA和染色体DNA变异的比较 128
8.7检测染色体改变的技术 130
8.8展望 130
第9章 第二代测序数据分析 132
9.1 DNA测序技术 133
9.2第二代测序技术的基因组DNA数据分析 137
9.3第二代测序的具体应用 155
9.4展望与误区 156
第10章 核糖核酸(RNA)的生物信息学方法 157
10.1非编码RNA 158
10.2信使RNA简介 164
10.3微阵列和RNA的序列:基因表达的全基因组测序 168
10.4 RNA数据分析的解释 171
10.5展望与误区 174
第11章 基于芯片和RNA-Seq技术的基因表达数据分析 175
11.1基因芯片分析方法:基于NCBI的GEO2R工具 177
11.2芯片分析方法2:PARTEK 183
11.3芯片数据分析方法3:用R语言分析GEO数据 183
11.4基因芯片数据分析:描述性统计 186
11.5 RNA-Seq数据分析 190
11.6芯片数据功能注释 194
11.7展望 195
第12章 蛋白分析和蛋白组学 197
12.1蛋白质数据库 197
12.2蛋白质鉴定技术 200
12.3蛋白质的四大方面 204
第13章 蛋白质结构 213
13.1蛋白质结构原理 214
13.2蛋白质数据库 219
13.3蛋白质结构预测 222
13.4固有无序蛋白 225
13.5蛋白质结构和疾病 225
第14章 功能基因组学 227
14.1定义 227
14.2功能基因组学的八种模式生物 228
14.3功能基因组使用正向与反向遗传学 232
14.4功能基因组学与中心法则 234
14.5蛋白质组学方法研究功能基因组学 236
14.6展望 243
14.7误区 244