基 础篇 3
第1章 生物信息学绪论 3
1.1生物信息学概述 3
1.2医学生物信息学的主要研究内容 4
1.3医学生物信息学面临的挑战 5
第2章 生物信息学数据库 6
2.1生物信息学数据库简介 6
2.2基因数据库 6
2.2.1 GenBank-NCBI核酸序列数据库 6
2.2.2 DDBJ数据库 8
2.2.3 EMBL数据库 8
2.2.4 UniGene数据库 8
2.3蛋白质数据库 9
2.3.1 SWISS-PROT蛋白质序列分析数据库 9
2.3.2 PDB蛋白质结构数据库 9
2.3.3 SCOP数据库 11
2.4突变数据库 11
2.5 UCSC基因组浏览数据库 11
2.6 OMIM数据库 12
2.7集成数据库 12
第3章 核酸同源性序列比对的策略和方法 14
3.1数据库中的相似性搜索 14
3.2双序列比对 14
3.3 BLAST搜索实例 15
3.3.1 BLAST简介 15
3.3.2 BLAST的操作步骤 16
3.4分子进化与系统发生树 20
3.4.1分子进化 20
3.4.2系统发生树 20
3.5下一代测序技术简介 22
第4章 人类基因组变异数据库及SNP关联分析 24
4.1 SNP简介 24
4.2 dbSNP数据库简介 25
4.3 SNP关联分析 28
4.3.1 SNP关联分析介绍 28
4.3.2 plink软件批量实现SNP关联分析 29
4.4基因与基因互作分析 32
4.4.1 Logistic回归分析 32
4.4.2多因子降维法 33
4.4.3决策树分析 35
4.4.4 PIA算法构建SNP-SNP互作网络 36
4.4.5基因与环境互作分析 39
4.5基于数量性状的SNP互作分析 45
4.6基于SNP的系统进化树分析 51
4.6.1 TNF-α-308G/A的系统进化树分析 52
4.6.2 EPHX His139/Arg的系统进化树分析 52
4.6.3 TNF-α-308G/A和EPHX His139/Arg联合的系统进化树分析 53
4.7 GWAS数据分析简介及SNAP网络工具 54
4.7.1 GWAS数据分析简介 54
4.7.2 SNAP网络工具 54
4.8 SNP功能分析的生物信息学方法 57
4.8.1 SNP功能分析 57
4.8.2 SNP功能预测分数——SIFT 57
4.8.3 SNP功能预测分数——PolyPhen-2 57
第5章 基因表达数据分析 61
5.1 cDNA芯片平台与数据库 62
5.1.1 cDNA芯片平台介绍 62
5.1.2基因芯片数据预处理 63
5.1.3基因芯片数据处理与分析 66
5.2 RNA-seq测序技术及数据分析 80
5.2.1 RNA-seq测序技术 80
5.2.2基于RNA-seq数据的差异表达基因分析 82
5.2.3 RNA-seq数据的外显子水平差异分析 94
5.2.4 RNA-seq数据的可变剪切分析 103
第6章 基因功能与通路分析技术 109
6.1基因功能富集分析 109
6.1.1 GO简介 109
6.1.2富集分析 109
6.1.3 DAVID网络工具介绍 110
6.2通路数据库介绍 114
6.2.1 KEGG数据库 114
6.2.2其他通路数据库简介 117
6.3疾病风险通路筛选 118
6.4 INVEX软件介绍 120
6.5随机森林-通路分析法挖掘特征基因 126
6.5.1随机森林-通路分析法介绍 126
6.5.2案例分析 126
6.5.3数值实验结果 127
第7章miRNA数据分析 131
7.1 miRNA简介 131
7.2 miRNA-靶基因靶向关系 131
7.3 miRNA数据资源 131
7.3.1 TarBase数据库 131
7.3.2 miRBase数据库 132
7.4 miRNA表达谱数据分析 134
7.5结合SNP和miRNA表达谱探查疾病相关的miRNA 138
7.6结合基因、疾病、通路和miRNA的ChemiRs网络工具简介 142
7.6.1按照miRNA名称进行搜索 142
7.6.2按照基因列表进行搜索 148
第8章DNA甲基化及表观遗传学数据分析 151
8.1 DNA甲基化相关知识介绍 151
8.1.1 CpG岛预测算法 151
8.1.2 DNA甲基化检测方法 152
8.2 DNA甲基化区域识别软件——methyAnalysis软件包应用 152
8.3肿瘤相关的DNA甲基化数据库——MethHC网络工具简介 159
8.3.1浏览高(低)甲基化基因 159
8.3.2肿瘤样本的甲基化水平聚类 161
8.3.3基于基因搜索的DNA甲基化水平分析 161
8.4 DNA拷贝数变异分析 165
8.4.1 DNA拷贝数变异的概念 165
8.4.2 DNA拷贝数变异数据的分析软件——Genovar 166
第9章 生物分子网络 177
9.1生物分子网络介绍 177
9.1.1基因转录调控网络 177
9.1.2蛋白质互作数据 178
9.1.3蛋白质互作网络——STRING数据库介绍 179
9.2网络拓扑性质介绍 183
9.3拓扑性质分析软件介绍——NEXCADE 184
9.4 Cytoscape作图软件介绍 187
9.5 BioNet软件包介绍 197
第10章 药物基因组学 208
10.1药物基因组学的概念 208
10.2药物靶向识别 208
10.3药物靶向交互的网络资源 209
10.4基于剂量-效应关系的药物结合作用识别 211
提 高篇 217
第11章 生物信息学综合数据分析案例 217
11.1案例分析1:应用miRNA-mRNA失调关系优化乳腺癌亚型相关的miRNA 217
11.1.1数据准备 217
11.1.2数据整合分析方法 217
11.1.3数值实验结果 218
11.2案例分析2:多组学数据整合的肿瘤相关性研究 223
11.2.1数据准备 223
11.2.2数据整合分析方法 224
11.2.3数值实验结果 225
第12章 肿瘤亚型的系统化分析 230
12.1数据类型 230
12.2数据的导入和描述性分析 232
12.3结合miRNA和mRNA表达谱对肿瘤样本进行聚类获得肿瘤亚型 234
12.4 3种亚型的差异性检验 235
12.5特征基因选择 235
12.6整合生存数据分析 237
第13章 多组学数据的可视化 239
13.1 TCGA多组学数据的下载 239
13.2多组学数据的可视化 241
参考文献 246