《DNA和蛋白质序列数据分析工具》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:薛庆中等编著
  • 出 版 社:北京:科学出版社
  • 出版年份:2009
  • ISBN:9787030226334
  • 页数:204 页
图书介绍:本书分8章,第1章,阐述序列比较的核心方法,即运用BLAST和ClustalX等工具做序列比对;第2章重点介绍了核苷酸序列分析工具,主要包括:基因预测,编码区结构分析,可变剪切分析,预测基因启动子,基因调控元件预测,密码子的偏好性分析等;第3章,蛋白质氨基酸序列分析从搜索数据库开始,随后对蛋白质基本理化性质、二级结构、结构域和三维空间结构、预测目标蛋白的生物功能等工具进行逐一介绍。第4章,使用TM4软件可实现芯片的数据采集,低质量过滤,标准化处理。GenMAPP软件则有助于挖掘芯片数据在代谢途径中的生物学意义。第5章,简介GeneOntology和KEGG数据库,将分别有助于挖掘基因和蛋白的功能及其代谢途径分析。第6章,介绍分子进化遗传分析工具包,用MEGA4绘制系统发生树,为研究基因进化打好基础。第7章,利用X!Tandem软件鉴定蛋白质的串联质谱数据,再将质谱结果匹配到蛋白质组数据库鉴定出蛋白;借助TPP软件包进行统计学分析,优化检索结果。第8章,介绍Cytoscape系统生物学分析软件,展示蛋白-蛋白相互作用,并实现与基因表达等数据有机整合。书后附有专业词索引。

前言 1

第1章 序列比对工具BLAST和ClustalX的使用 1

1.1 序列比对BLAST 1

1.1.1 网上运行BLAST 1

1.1.2 本地运行BLAST(Windows系统) 9

1.2 多序列比对(ClustalX) 13

1.2.1 ClustalX的使用 14

1.2.2 数据的输入 15

1.2.3 数据的输出 18

主要参考文献 22

第2章 真核生物基因结构的预测分析 23

2.1 基因可读框的识别 23

2.2 CpG岛、转录终止信号和启动子区域的预测分析 24

2.2.1 CpG岛的预测分析 24

2.2.2 转录终止信号的预测分析 26

2.2.3 启动子区域的预测分析 27

2.3 采用mRNA序列预测基因:Spidey的使用 29

2.4 ASTD数据库简介 31

主要参考文献 36

第3章 电子克隆 37

3.1 利用UniGene数据库进行电子延伸 37

3.1.1 目标序列的blastn检索 37

3.1.2 UniGene数据库检索 38

3.1.3 下载UniGeneCluster中所有EST序列 39

3.2 从数据库中获取cDNA全长序列 41

3.3 本地序列拼接 41

3.3.1 CAP3序列拼接程序 42

3.3.2 Velvet序列拼接程序 44

3.4 基因的电子表达谱分析 49

3.5 核酸序列的电子基因定位分析 50

主要参考文献 53

第4章 分子进化遗传分析工具(MEGA4)的使用 54

4.1 序列数据的获取和比对 54

4.1.1 数据库直接检索 54

4.1.2 BLAST比对 55

4.2 遗传距离的估计 58

4.3 分子钟假说的检验 59

4.4 多序列比对结果文件格式转换 60

4.5 系统进化树构建 63

4.5.1 进化树构建方法选择 63

4.5.2 进化树的树形选择 65

4.5.3 进化树的拓扑结构调整 66

4.5.4 进化树树枝形态的优化 68

4.5.5 进化树的保存 70

主要参考文献 71

第5章 蛋白质结构与功能预测 72

5.1 蛋白质一级结构分析 72

5.1.1 蛋白质理化性质分析 72

5.1.2 蛋白质亲疏水性分析 75

5.1.3 跨膜区结构预测 78

5.1.4 卷曲螺旋预测 79

5.2 蛋白质二级结构分析 81

5.2.1 PredictProtein 81

5.2.2 PSIPRED 85

5.3 蛋白质结构域与功能分析 86

5.3.1 Pfarn(protein families database of alignment and HMM) 87

5.3.2 PROSITE 88

5.3.3 BLOCKS 90

5.3.4 SMART 93

5.4 蛋白质三维结构分析 93

5.4.1 同源建模(homology modeling) 93

5.4.2 线串法(threading) 96

5.4.3 从头预测(ab initio prediction) 98

5.4.4 蛋白质三维结构观察 98

主要参考文献 100

第6章 Gene Ontology数据库和KEGG数据库简介 103

6.1 Gene Ontology数据库 103

6.1.1 简介 103

6.1.2 用关键词检索GO数据库 103

6.1.3 用序列检索GO数据库 108

6.2 KEGG数据库 109

6.2.1 简介 109

6.2.2 根据代谢途径名称检索 109

6.2.3 根据基因名称检索 110

6.2.4 根据序列检索 113

主要参考文献 116

第7章 蛋白质组学数据分析 117

7.1 生物质谱技术介绍 117

7.1.1 质谱技术的基本原理 117

7.1.2 X!Tandem软件 121

7.1.3 Mascot软件 125

7.2 蛋白质组学数据统计分析软件 129

7.2.1 TPP简介 129

7.2.2 TPP的安装与配置 130

7.2.3 样本数据准备 131

7.2.4 将RAW文件转换成mzXML文件 132

7.2.5 由html文件生成pepXML文件 135

7.2.6 运行PeptideProphet 139

7.2.7 运行ProteinProphet 143

7.2.8 数据的过滤筛选和将结果保存成Excel文件 147

主要参考文献 149

第8章 基因芯片数据处理和分析 150

8.1 芯片数据的获取和处理 150

8.1.1 芯片数据的格式转换 150

8.1.2 数据基本处理 152

8.2 芯片数据的检索和提交 156

8.2.1 芯片数据的文件格式 158

8.2.2 芯片数据的提交 161

8.3 芯片数据的可视化 162

8.3.1 GenMAPP的概念 162

8.3.2 GenMAPP的安装 163

8.3.3 GenMAPP的使用 163

8.4 芯片数据聚类分析 167

8.4.1 CLUSTER 167

8.42 TreeView 169

主要参考文献 170

第9章 系统生物学网络结构分析 171

9.1 Cytoscape软件简介 171

9.1.1 概况 171

9.1.2 主要功能 171

9.2 软件安装 172

9.3 Cytoscape基本操作 173

9.3.1 信息输入 173

9.3.2 插件安装 178

9.4 应用Cytoscape进行基因注释 178

9.4.1 BiNGO插件的安装 178

9.4.2 使用实例 178

9.5 应用Cytoscape进行细胞定位 181

9.5.1 Cerebral插件的安装 181

9.5.2 使用实例 181

9.6 应用Cytoscape搜索基因相互作用文献 184

9.6.1 Agilent Literature Search插件安装 184

9.6.2 使用实例 184

9.7 应用Cytoscape做网络分析 187

9.7.1 将BOND网络数据库的信息输入Cytoscape 187

9.7.2 网络分析 188

主要参考文献 192

英汉对照词汇 193

索引 201