第1章 序列比对工具BLAST和ClustalX 1
1.1 BLAST搜索程序 1
1.2 本地运行BLAST(Windows系统) 13
1.3 多序列比对(ClustalX) 17
参考文献 24
第2章 真核生物基因结构的预测 25
2.1 基因可读框的识别 25
2.2 CpG岛、转录终止信号和启动子区域的预测 26
2.3 基因密码子偏好性计算:CodonW的使用 31
2.4 采用mRNA序列预测基因:Spidey的使用 33
2.5 ASTD数据库简介 35
参考文献 39
第3章 电子克隆 40
3.1 种子序列的搜索 40
3.2 序列拼接 43
3.3 在水稻数据库中的电子延伸 46
3.4 电子克隆有关事项的讨论 49
参考文献 50
第4章 分子进化遗传分析工具(MEGA 5) 51
4.1 序列数据的获取和比对 51
4.2 进化距离的估计 56
4.3 分子钟假说的检验 58
4.4 系统进化树构建 60
参考文献 70
第5章 蛋白质结构与功能预测 71
5.1 蛋白质信息数据库 72
5.2 蛋白质一级结构分析 76
5.3 蛋白质二级结构预测 85
5.4 蛋白质家族和结构域 94
5.5 蛋白质三级结构预测 105
5.6 蛋白质结构可视化工具 113
参考文献 116
第6章 序列模体的识别和解析 118
6.1 MEME程序包 118
6.2 通过MEME识别DNA或蛋白质序列中模体 119
6.3 通过MAST搜索序列中的已知模体 122
6.4 通过GLAM2识别有空位的模体 123
6.5 通过GLAM2SCAN搜索序列中的已知模体 126
6.6 应用TOMTOM与数据库中的已知模体进行比对 126
6.7 应用GOMO鉴定模体的功能 127
6.8 应用MCAST搜索基因表达调控模块 128
6.9 应用MEME-ChIP发现DNA序列模体 129
6.10 应用SPAMO推测转录因子的结合位点 131
6.11 应用DREME发现短的正则表达模体 131
6.12 应用FIMO寻找数据库已知的模体 132
6.13 应用CentiMo寻找主要的富集模体 133
参考文献 134
第7章 蛋白质谱数据分析 136
7.1 生物质谱技术的基本原理 136
7.2 X!Tandem软件 140
7.3 Mascot软件 146
7.4 Sequest软件 151
7.5 蛋白质组学数据统计分析TPP软件 154
参考文献 162
第8章 基因芯片数据处理和分析 163
8.1 芯片数据的获取和处理 163
8.2 芯片数据聚类分析和差异表达基因筛选 168
8.3 GenMAPP芯片数据的可视化 173
8.4 通过GEO检索和提交芯片数据 177
8.5 应用DAVID工具对芯片数据功能注释和分类 179
参考文献 186
第9章 GO基因本体和KEGG代谢途径分析 187
9.1 Gene Ontology数据库 187
9.2 KEGG数据库 193
参考文献 206
第10章 系统生物学网络结构分析 207
10.1 Cytoscape软件简介 207
10.2 Cytoscape软件安装 208
10.3 Cytoscape基本操作 209
10.4 应用BiNGO插件进行基因注释 216
10.5 应用BioQuali插件进行基因表达分析 218
10.6 应用Agilent Literature Search插件进行文献搜索 221
10.7 链接BOND数据库做网络分析 223
10.8 应用插件Cytoprophet预测潜在蛋白和结构域的相互作用 227
参考文献 232
第11章 Bioperl模块数据分析及其安装 233
11.1 概述 233
11.2 Bioperl重要模块简介和脚本实例 234
11.3 Bioperl安装 253
参考文献 265
第12章 读序列(reads)定位软件Bowtie 266
12.1 Bowtie特性 266
12.2 Burrows-Wheeler(BW)转换程序 266
12.3 不要求精确的比对搜索 267
12.4 回溯过量表达 268
12.5 阶段搜索 269
12.6 Bowtie的输出格式 270
参考文献 272
第13章 UCSC基因组浏览器 273
13.1 基因分类器(Gene sorter)工具 273
13.2 基因组浏览器(Genome Browser) 276
13.3 蛋白质组浏览器(Proteome Browser) 281
13.4 表浏览器(Table Browser) 283
参考文献 284
第14章 SNVs和Indel识别分析方法及工具 285
14.1 Bowtie工具 285
14.2 samtools软件包 287
14.3 识别单核苷酸多态性(SNP) 289
14.4 寻找同义突变和非同义突变 291
14.5 发现读框内插入缺失(in-frame indel) 294
14.6 发现其他类型的突变 295
参考文献 296
第15章 小RNA高通量测序数据分析 297
15.1 数据分析流程 297
15.2 Rfam数据库 300
15.3 miRBase数据库 303
15.4 应用mfold预测RNA二级结构 305
15.5 应用miRAlign搜索miRNA 307
15.6 应用TargetScan预测miRNA的靶基因 308
参考文献 310
第16章 RNA测序(RNA-Seq)分析 311
16.1 TopHat的分析流程 311
16.2 转录组读序列比对 312
16.3 获得基因表达谱及转录物表达谱 314
16.4 差异表达基因鉴定及注释 317
16.5 SNPs/SNVs及InDels鉴定与注释 320
16.6 选择性剪切(alternative splicing)鉴定 321
16.7 TopHat应用实例 322
参考文献 323
第17章 全基因组序列拼接的流程和方法 325
17.1 实例数据的获取 325
17.2 短读序列数据作图到参考基因组 326
17.3 将短读序列数据从头拼接成染色体骨架 328
17.4 大规模染色体骨架拼接 329
17.5 草图和实验物理图谱间的比较 330
参考文献 333
英汉对照词汇 334
英文索引 348
中文索引 354