绪论 1
一、生物信息学的研究内容 2
二、生物信息分析的技术与方法研究 5
第一章 Internet基础与物生物医学文献检索 8
第一节 Internet基础 8
一、IP地址与域名 8
二、Internet连接 9
三、Internet的基本功能 10
第二节 Internet网上生物医学文献检索 15
一、PubMed 16
二、Gateway 27
三、其他主要免费MEDLINE网站 36
第二章 Internet网上生物信息学资源 42
第一节 生物信息学重要网站 42
一、国家生物技术信息中心(NCBI) 42
二、欧洲分子生物学实验室(EMBL)与欧洲生物信息学研究所(EBI) 44
三、蛋白质分析专家系统(EXPASY) 45
四、结构生物信息学研究会联合实验室(RCSB) 46
五、日本国立遗传学研究所 46
六、其他生物信息学网站 47
第二节 生物分子序列核心数据库 47
一、GenBank核酸序列数据库 47
二、SWISS-PROT/TrEMBL蛋白质序列数据库 52
三、PDB生物大分子结构数据库 60
第三章 序列对比和数据搜索 66
第一节 概述 66
第二节 序列对比和数据搜索 66
第三节 BLAST程序简介 68
一、BLAST搜索主界面 69
二、BLAST程序及其数据库名称和意义 70
三、BLAST搜索格式 71
一、待检核酸序列与整个核酸序列库中的序列进行类比 73
二、核酸序列的两两比较 73
第四节 同源性分析 73
三、蛋白质与蛋白质数据库和蛋白质两两比较 74
四、输出结果的解释 74
第五节 PSI-BLAST程序简介 77
第六节 多序列比较 77
第七节 低复杂度区域 79
第八节 重复元件 79
第四章 多序列比较的实际应用 81
第一节 渐进比较方法 81
一、CLUSTAL W 81
二、MultAlin 84
一、ProfileScan 86
第二节 模体和样式比较 86
二、BLOCKS 90
第五章 利用核酸序列进行预测的方法 94
第一节 简介 95
一、神经网络系统 95
二、密码子偏好 95
第二节 遮蔽重复序列 96
一、CENSOR 96
二、REPEATMASKER WEB SERVER 99
第三节 DNA翻译 99
一、启动子 101
第五节 探测DNA中的功能性位点 101
第四节 数据库搜索 101
二、内含子剪接位点 102
三、终止信号 104
第六节 复合基因分析程序 105
一、Genebuilder 106
二、GENSCAN 109
三、AAS 110
第七节 搜索tRNA基因 113
第六章 利用蛋白质序列进行预测的方法 117
第一节 概述 117
一、AACompIdent 118
第二节 蛋白质辨识 118
二、AACompSim 120
三、PROPSEARCH 120
四、PepMAPPER 122
第三节 序列的物理性质计算 123
一、Compute Pi/MW(ExPAYSy) 123
二、PePtideMass(ExPASy) 123
三、SAPS 124
第四节 二级结构和折叠类型 124
一、NNPREDICT 125
二、PredictProtein 126
三、SOPMA 128
四、各种方法的比较 130
第五节 特殊结构或特征结构 131
一、跨膜区域预测 131
二、信号肽 133
三、卷曲螺旋 135
第六节 三级结构的预测 140
第七章 系统发育分析与分子进化 140
第一节 分子进化钟与中性理论 142
第二节 进化树 142
二、结构进化树 145
一、序列进化树 145
第三节 相关软件介绍 158
第八章 医学生物信息学应用导航 158
第一节 在网上获得更多的序列信息 158
一、在数据库中查询序列信息 158
二、序列的同源性搜索 159
三、蛋白家族相关性搜索 159
一、实验准备阶段 160
第二节 实用生物信息学软件介绍 160
五、从序列到结构 160
四、让Internet为你工作 160
二、实验实施阶段 165
第九章 基因组序列信息分析 199
第一节 物理图谱的类型 200
第二节 大型公用数据库中的基因组图谱 201
一、NCBI Entrez的染色体图谱 201
二、GDB的浏览染色体图谱 201
三、个体来源的基因组图谱 205
四、基因组的基因图谱 205
六、特定人类染色体图谱 215
第三节 鼠类图谱来源 215
五、人类基因组的转录物图 215
第四节 基因组序列分析工具 216
一、Wisconsin软件包(GCG) 216
二、ACEDB 219
三、其他工具 219
第五节 人类和鼠类公共物理图谱数据库的使用 219
一、全基因比较 219
二、SNP的发现 219
第六节 功能基因组相关信息分析 220
一、大规模基因表达谱分析 220
二、基因组水平蛋白质功能综合预测 225
第十章 提交基因序列到数据库 228
第一节 提交到哪里 229
第二节 提交什么内容 229
一、DNA/RNA 229
二、序列的性质 230
三、序列是合成的 230
四、序列有多精确 230
五、生物体 230
六、引用 230
七、编码序列 230
十、仅提交蛋白质序列 231
第三节 如何提交到互联网 231
九、种群、系统发生、变异的研究 231
八、其他特征 231
第四节 如何用Sequin提交 235
一、进入一个新的提交过程 235
二、有效性 235
三、观察序列记录 236
四、先进的注解和编辑功能 236
五、Sequin作为分析平台 237
六、数据模型的重要性 237
七、提交单个的序列 238
八、提交一个比对的序列集 246
九、通过特征传播进行注解 247
十、具有网络连接的Sequin 247
十一、EST/STS/GSS 248
第五节 基因组中心 248
第六节 更新 249
第七节 结论性的评价 249
第十一章 生物信息学与基因芯片 252
第一节 概述 252
一、基因芯片简介 252
二、基因芯片对于生物分子信息检测的作用和意义 257
三、基因芯片研究和应用中所涉及到的生物信息学问题 258
一、基因芯片设计的一般性原则 260
第二节 基因芯片设计 260
二、DNA变异检测型芯片与基因表达型芯片的设计 261
三、cDNA芯片与寡核苷酸芯片的设计 261
四、寡核苷酸探针的优化设计 261
第三节 基因芯片的序列分析 264
一、测定未知序列 264
二、直接检测目标序列 264
三、DNA序列突变检测分析 265
四、SNP分析 265
第四节 基因芯片的基因功能分析 267
一、基因表达分析 267
二、高密度基因表达芯片 267
第五节 基因芯片检测结果的分析 268
一、荧光检测图像处理 268
三、基因表达图谱 268
四、寻找基因功能 268
二、检测结果分析 269
三、检测结果可靠性分析 269
第六节 基因芯片信息的管理和利用 270
一、芯片信息管理 270
二、数据集成和交叉索引 270
三、基于基因芯片的数据发掘可视化 271
四、基因芯片数据的可视化 272
附录A 各种序列分析应用网上资源 275
附录B 分子生物学软件 280