第一章 绪论 1
第一节 基本概念 1
第二节 生物信息学的发展 2
第三节 研究任务 4
第四节 章节安排 5
第二章 序列比对与分子进化 6
第一节 相似性得分系统 6
一、基本概念 6
二、序列的相似性 7
三、序列比对得分矩阵 8
第二节 序列比对方法 14
一、点阵法 14
二、动态规划法 15
三、序列比对工具 17
第三节 数据库搜索 18
一、FASTA 18
二、BLAST 21
第四节 分子系统发生分析 28
一、分子钟学说与中性进化理论 28
二、进化距离 30
三、系统发生树构建方法 33
第五节 系统发生树构建软件使用 36
一、PHYLIP使用 36
二、MEGA使用 38
第三章 密码子与DNA序列信息 42
第一节 遗传密码的稳定性 42
一、四碱基的DNA序列 42
二、遗传密码的简并规则 44
三、氨基酸的不可替代性 49
第二节 DNA的短程关联和长程关联 51
一、DNA序列的短程关联 51
二、DNA序列的谱分析与长程关联 54
三、DNA序列阅读框架的非均匀性 55
第三节 DNA的数学表示 56
一、DNA序列的混沌图示法 56
二、DNA序列的算术描述 57
第四章 基因组信息学 60
第一节 基因预测 62
一、真核基因预测 63
二、原核基因预测 66
三、病毒基因预测 70
四、元基因组的基因预测 72
五、微生物基因组的重新注释 74
第二节 基因组的组成及结构的分析及预测 75
一、真核生物基因组的GC等值区及CpG岛 75
二、细菌的基因组岛及复制起始位点的预测 80
三、密码子使用策略分析 84
第三节 人类疾病相关基因的识别 88
一、人类疾病相关基因的识别 88
二、致病菌毒力基因与耐药基因的识别 89
三、人类重要疾病数据库 91
第四节 非编码RNA的预测 92
第五节 利用GO注释基因功能 94
第五章 蛋白质信息学 98
第一节 蛋白质数据库 98
一、Uniprot蛋白质序列数据库 98
二、PDB蛋白质结构数据库 100
第二节 蛋白质结构预测 102
一、蛋白质结构 102
二、蛋白质二级结构预测 105
三、蛋白质三级结构预测 108
四、蛋白质结构相关预测 113
第三节 蛋白质功能预测 115
一、蛋白质亚细胞定位预测 115
二、酶类型预测 116
三、蛋白质翻译后修饰 118
四、其他蛋白质功能预测问题 119
第六章 基因芯片数据分析 120
第一节 基因芯片平台简介 120
一、基因芯片分类 120
二、常见的基因芯片 121
第二节 数据的预处理 124
一、数据的提取 124
二、数据的过滤 125
三、缺失数据的处理 125
四、数据的对数转换 126
五、数据的标准化 126
第三节 差异表达基因分析 130
一、倍数法 130
二、t检验法 130
三、SAM法 131
四、其他方法 132
第四节 基因芯片数据的聚类分析 132
一、聚类分析中距离(或相似性)的尺度函数 133
二、聚类分析中的聚类算法 134
第五节 基因芯片数据的分类分析 137
一、k近邻分类法 138
二、决策树 138
三、支持向量机 140
四、Fisher线性判别分析 140
五、分类性能评价 141
第六节 基因芯片数据库及常用分析软件 142
一、基因表达数据库(Gene Expression Omnibus,GEO) 142
二、ArrayTools 143
三、SAM 143
四、Cluster和TreeView 143
五、R语言和BioConductor 144
第七章 免疫信息学 145
第一节 免疫信息学源流 145
第二节 免疫信息学资源 147
一、免疫学数据库 147
二、单机软件与网络程序 151
第三节 免疫信息学的应用 151
一、表位预测 151
二、噬菌体展示 156
三、在抗体研究中的应用 160
四、在疫苗研究中的应用 164
五、在移植免疫中的应用 166
六、在变态反应防治中的应用 166