第一章 生物信息学 1
第一节 生物信息学的内容、方法和意义 1
一、什么是生物信息学 1
二、生物信息学探源 2
三、生物信息学的内涵和后基因组时代的主攻方向 3
第二节 有关生物学的背景知识 4
一、细胞简介 5
二、基因概述 9
三、蛋白质解说 13
第三节 互联网上可用的生物信息资源 18
一、生物信息网上资源简介 18
二、基因组数据库 19
三、核酸序列数据库 21
四、蛋白质序列数据库 28
五、蛋白质结构数据库 37
六、二次数据库 43
七、重要网上资源的地址 48
参考文献 49
第二章 智能化算法 50
第一节 什么是智能化算法 50
一、问题的提法 50
二、程式化算法 52
三、智能化算法 54
第二节 本书涉及的智能化算法 55
一、蒙特卡罗方法 55
二、模拟退火算法 56
三、遗传算法 57
四、人工神经网络 58
五、隐马氏模型 60
六、贝叶斯网络与无标度网络 61
第三节 评价智能化算法的一个理论框架 62
一、离散吸收马氏过程 62
二、随机算法的收敛性和复杂性 63
参考文献 70
第三章 序列联配与隐马氏模型 71
第一节 双序列联配 71
一、序列的同源性和相似性 71
二、PAM和BLOSUM计分矩阵 72
三、动态规划算法 75
四、数据库搜索的FASTA和BLAST算法 77
第二节 多序列联配 79
一、多序列联配的概念 79
二、多序列联配常用的ClustalW算法 80
三、多序列联配结果的表示和数据库搜索 81
第三节 隐马氏模型 84
一、马尔可夫链 85
二、隐马氏模型的形式 86
三、隐马氏模型的基本问题与算法 89
第四节 基于剖面隐马氏模型的多序列联配 94
一、作为多序列联配的剖面隐马氏模型 94
二、剖面隐马氏模型主状态数的选取 96
三、现有剖面隐马氏模型软件简介和多序列联配实例 102
参考文献 104
第四章 模体识别与神经网络 105
第一节 模体识别 105
一、模体的生物学意义 105
二、序列模体和结构模体 106
三、模体数据库 108
四、模体发现的方法 109
第二节 智能神经网络 110
一、神经网络简介 110
二、神经网络的结构模型及学习 111
三、多层前馈神经网络与反向传播算法 116
四、反向传播算法的局限性及其改进 119
五、神经网络的两个主要问题 121
六、贝叶斯神经网络 123
第三节 基于神经网络的模体识别 125
一、神经网络在生物分子序列分析中的应用 125
二、生物分子序列分析中的神经网络编码 129
三、基于神经网络的蛋白质二级结构预测 130
参考文献 135
第五章 蛋白质折叠与遗传算法 137
第一节 蛋白质折叠 137
一、蛋白质结构及其预测方法概述 137
二、蛋白质折叠预测的模型 141
三、蛋白质折叠预测的基本方法 143
第二节 蒙特卡罗方法 145
一、基本蒙特卡罗方法 145
二、各种采样方法介绍 147
三、马尔可夫链蒙特卡罗方法 150
第三节 遗传算法 152
一、遗传算法的有关概念 152
二、基本遗传算法 153
三、各种改进的遗传算法 158
四、遗传算法的数学理论 160
第四节 蛋白质折叠预测实例 163
一、蛋白质折叠的HP模型 163
二、基于蒙特卡罗方法的蛋白质折叠预测 165
三、基于遗传算法的蛋白质折叠问题预测 167
四、结果与讨论 168
参考文献 169
第六章 RNA结构预测与模拟退火 171
第一节 RNA的结构与功能 172
一、RNA的组成 172
二、RNA的分类、结构及其功能 174
三、RNA的二级结构与假结 180
第二节 RNA二级结构预测建模 183
一、比较序列分析模型 183
二、最小自由能算法与自由能参数 188
三、组合优化算法的解决方案 192
四、进一步提高预测准确度的若干问题 194
第三节 模拟退火算法 195
一、Metropolis准则 196
二、模拟退火的渐近行为 198
三、冷却进度表的有关问题 200
四、模拟退火算法的改进和变异 202
五、Boltzmann机 203
第四节 RNA二级结构预测实例 205
一、RNA二级结构的编码 205
二、混合遗传算法 206
三、材料与计算结果 207
参考文献 209
第七章 微阵列技术与统计推断 211
第一节 微阵列技术 211
一、微阵列技术简介 211
二、微阵列的数据挖掘 214
三、微阵列技术的应用 219
第二节 聚类方法 221
一、距离与相似系数 222
二、系统聚类法 222
三、K均值算法 224
四、自组织映射算法 225
五、主成分分析 225
六、聚类效果评估 226
第三节 模式识别 227
一、基因选择 227
二、降维处理 229
三、判别分析 232
四、遗失数据处理 237
第四节 微阵列表达数据分析实例 237
一、材料与方法 238
二、计算结果 239
三、讨论 242
四、问题与展望 242
参考文献 243
第八章 基因相互作用与贝叶斯网络 245
第一节 基因的表达调控 245
一、RNA结构调控和剪接编辑调控模型 246
二、启动子调控和操纵子调控模型 247
三、感受器应答调控模型 249
四、功能基因组的基因表达 249
第二节 基因相互关系网络 251
一、基因表达数据采集和表达模式分析 251
二、基因相互关系的一般统计分析框架 257
三、建立基因调控网络的数学模型 259
四、基因网络模型分析 260
五、基因网络的实际应用 262
第三节 基因相互作用的贝叶斯网络模型 266
一、贝叶斯网络 266
二、基于贝叶斯网络的基因相互关系模型及算法实现 273
三、贝叶斯调控网络在疾病研究中的应用和前景 276
参考文献 276
索引 278