《DNA和蛋白质序列数据分析工具》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:薛庆中等编著
  • 出 版 社:北京:科学出版社
  • 出版年份:2010
  • ISBN:9787030270528
  • 页数:275 页
图书介绍:本书分8章。第1章阐述序列比较的核心方法,即运用BLAST和ClustalX等工具做序列比对;第2章重点介绍了核苷酸序列分析工具,主要包括基因预测,编码区结构分析,可变剪切分析,预测基因启动子,基因调控元件预测,密码子的偏好性分析等;第3章蛋白质氨基酸序列分析,从搜索数据库开始,对蛋白质基本理化性质、二级结构、结构域和三维空间结构、预测目标蛋白的生物功能等分析工具进行逐一介绍。第4章,使用TM4软件可实现芯片的数据采集,低质量过滤,标准化处理。GenMAPP软件则有助于挖掘芯片数据在代谢途径中的生物学意义。第5章,简介GeneOntology和KEGG数据库,将分别有助于挖掘基因和蛋白的功能及其代谢途径分析。第6章,介绍分子进化遗传分析工具包,用MEGA4绘制系统发生树,为研究基因进化打好基础。第7章,利用X!Tandem软件鉴定蛋白质的串联质谱数据,再将质谱结果匹配到蛋白质组数据库鉴定出蛋白;借助TPP软件包进行统计学分析,优化检索结果。第8章,介绍Cytoscape系统生物学分析软件,展示蛋白-蛋白相互作用,并实现与基因表达等数据有机整合。书后附有专业词索引。

第1章 序列比对工具BLAST和ClustalX的使用 1

1.1 序列比对BLAST 1

1.1.1 Basic BLAST 1

1.1.2 网上blastx比对 4

1.1.3 网上PSI-Blast比对 7

1.1.4 Specialized BLAST 9

1.1.5 网上Blast2比对 10

1.2 本地运行BLAST(Windows系统) 11

1.2.1 BLAST程序下载 11

1.2.2 BLAST程序安装 11

1.2.3 进入DOS命令行提示符状态 13

1.2.4 搜索数据库的格式化 14

1.2.5 BLAST搜索程序运行 14

1.2.6 本地化BLAST搜索结果查看 15

1.3 多序列比对(ClustalX) 15

1.3.1 ClustalX的使用 16

1.3.2 数据的输入 17

1.3.3 数据的输出 20

主要参考文献 22

第2章 真核生物基因结构的预测 23

2.1 基因可读框的识别 23

2.2 CpG岛、转录终止信号和启动子区域的预测 24

2.2.1 CpG岛的预测 24

2.2.2 转录终止信号的预测 26

2.2.3 启动子区域的预测 27

2.3 基因密码子偏好性计算:CodonW的使用 29

2.4 采用mRNA序列预测基因:Spidey的使用 31

2.5 ASTD数据库简介 33

主要参考文献 37

第3章 电子克隆 38

3.1 利用UniGene数据库进行电子延伸 38

3.1.1 目标序列的检索 39

3.1.2 UniGene数据库检索 40

3.2 从数据库中获取cDNA全长序列 43

3.3 本地序列拼接 44

3.3.1 CAP3序列拼接程序 45

3.3.2 Velvet序列拼接程序 47

3.4 基因的电子表达谱分析 52

3.5 核酸序列的电子基因定位分析 54

主要参考文献 57

第4章 分子进化遗传分析工具(MEGA 4)的使用 58

4.1 序列数据的获取和比对 58

4.1.1 数据库直接检索 59

4.1.2 多序列比对 60

4.2 进化距离的估计 62

4.3 分子钟假说的检验 64

4.4 系统进化树构建 66

4.4.1 系统进化树构建方法选择 66

4.4.2 进化树的树形选择 68

4.4.3 进化树的拓扑结构调整 70

4.4.4 进化树树枝形态的优化 71

4.4.5 进化树的保存 73

主要参考文献 74

第5章 蛋白质结构与功能预测 75

5.1 蛋白质一级结构分析 76

5.1.1 ProtParam:蛋白质序列理化参数检索 76

5.1.2 ProtScale:蛋白质亲疏水性分析 78

5.1.3 COILS:卷曲螺旋预测 81

5.2 蛋白质二级结构预测 83

5.2.1 PredictProtein:蛋白质结构预测 83

5.2.2 PSIPRED:不同蛋白质结构预测方法 87

5.3 InterProScan:模式和序列谱研究 88

5.3.1 InterProScan简介 88

5.3.2 PROSITE:蛋白质结构域、家族和功能位点数据库 91

5.3.3 Pfam:蛋白质家族比对和HMM数据库 95

5.3.4 BLOCKS:模块搜索数据库 97

5.3.5 SMART:简单模块构架搜索工具 98

5.3.6 TMHMM:跨膜区结构预测服务器 100

5.4 蛋白质三级结构预测 101

5.4.1 Swiss-Model Workspace:同源建模的网络综合服务器 102

5.4.2 Phyre(successor of 3D-PSSM):线串法预测蛋白质折叠 104

5.4.3 HMMSTR/Rosetta:从头预测蛋白质结构 106

5.4.4 Swiss-PdbViewer:分子建模和可视化工具 106

主要参考文献 109

第6章 序列模体的识别和解析 110

6.1 MEME程序包 110

6.2 通过MEME识别DNA或蛋白质序列组中模体 111

6.3 通过MAST搜索序列中的已知模体 114

6.4 通过GLAM2识别有空位的模体 117

6.5 通过GLAM2SCAN搜索序列中的已知模体 120

6.6 应用TOMTOM与数据库中的已知模体进行搜索比对 122

6.7 应用GOMO鉴定模体的功能 123

主要参考文献 124

第7章 蛋白质谱数据分析 125

7.1 生物质谱技术介绍 125

7.1.1 质谱技术的基本原理 125

7.1.2 X!Tandem软件 129

7.1.3 Mascot软件 135

7.1.4 Sequest软件 139

7.2 蛋白质组学数据统计分析软件 142

7.2.1 TPP简介 142

7.2.2 TPP的安装与配置 143

7.2.3 样本数据准备 144

7.2.4 将RAW文件转换成mzXML文件 145

7.2.5 由out数据文件夹生成pepXML文件 147

7.2.6 运行PeptideProphet 151

7.2.7 PeptideProphet处理后的结果分析 154

7.2.8 运行ProteinProphet 154

7.2.9 数据的过滤筛选和将结果保存成Excel文件 158

主要参考文献 160

第8章 基因芯片数据处理和分析 161

8.1 芯片数据的获取和处理 161

8.1.1 Express Converter 161

8.1.2 MIDAS 163

8.2 芯片数据聚类分析和差异表达基因筛选 168

8.2.1 MeV 168

8.2.2 Cluster 174

8.2.3 TreeView 175

8.3 芯片数据的可视化 176

8.3.1 GenMAPP的概念 176

8.3.2 GenMAPP的安装 177

8.3.3 GenMAPP的使用 177

8.4 芯片数据的检索和提交 182

8.4.1 GEO检索 182

8.4.2 Platform信息 183

8.4.3 Series信息 184

8.4.4 Samples信息 184

8.4.5 芯片数据的提交 185

主要参考文献 186

第9章 应用GO注释基因功能和通过KEGG分析代谢途径 187

9.1 Gene Ontology数据库 187

9.1.1 简介 187

9.1.2 用关键词检索GO数据库 188

9.1.3 用序列检索GO数据库 193

9.2 KEGG数据库 194

9.2.1 简介 194

9.2.2 根据代谢途径名称检索 196

9.2.3 根据基因名称检索 198

9.2.4 根据序列检索 199

9.2.5 利用KAAS工具作批量注释 201

9.2.6 基因芯片数据的代谢途径分析 204

主要参考文献 207

第10章 系统生物学网络结构分析 208

10.1 Cytoscape软件简介 208

10.1.1 概况 208

10.1.2 主要功能 208

10.2 软件安装 209

10.3 Cytoscape基本操作 209

10.3.1 信息输入 209

10.3.2 插件安装 215

10.4 应用Cytoscape进行基因注释 215

10.4.1 BiNGO插件的安装 215

10.4.2 使用实例 215

10.5 应用Cytoscape进行亚细胞定位 218

10.5.1 Cerebral插件的安装 218

10.5.2 使用实例 218

10.6 应用Cytoscape搜索基因相互作用文献 222

10.6.1 Agilent Literature Search插件安装 222

10.6.2 使用实例 222

10.7 应用Cytoscape做网络分析 225

10.7.1 将BOND网络数据库的信息输入Cytoscape 225

10.7.2 网络分析 227

10.8 应用插件Cytoprophet预测潜在蛋白和结构域的相互作用 230

10.8.1 Cytoprophet插件的安装 230

10.8.2 使用实例 230

主要参考文献 234

第11章 使用Bioperl模块作数据分析 235

11.1 概述 235

11.2 Bioperl安装 236

11.2.1 Bioperl的组成 236

11.2.2 Unix/Linux系统下Bioperl的安装步骤 236

11.2.3 Windows系统下Bioperl的安装 236

11.3 Bioperl重要模块简介和脚本实例 236

11.3.1 实现文件格式转换脚本(实例1) 236

11.3.2 实现DNA序列的翻译脚本(实例2) 237

11.3.3 计算序列长度脚本(实例3) 238

11.3.4 GenBank文件解析脚本(实例4) 239

11.3.5 图形化显示序列特征脚本(实例5) 240

11.3.6 从公共数据库获取序列脚本(实例6) 242

11.3.7 应用AlignIO模块实现文件格式转换脚本(实例7) 242

11.3.8 计算比对序列JukesCantor距离脚本(实例8) 243

11.3.9 计算同义替换率(D_s)和非同义替换率(D_n)脚本(实例9) 244

11.3.10 Bioperl调用Clustalw脚本实例(实例10) 244

主要参考文献 245

第12章 Windows环境下Bioperl程序包的安装 246

12.1 Vista下Perl语言环境的安装 246

12.1.1 下载Perl文件 246

12.1.2 Perl安装文件 246

12.2 Bioperl的安装 247

12.2.1 启动Perl Package Manager 247

12.2.2 丰富Bioperl资源库 247

12.2.3 安装Bioperl核心包和工具盒 249

12.3 局域网通过代理服务器用户的安装 250

12.4 在Windows XP系统下安装 252

12.4.1 下载Perl文件 252

12.4.2 安装Bioperl 252

12.4.3 局域网通过代理服务器用户的安装 252

12.5 从CPAN安装Perl文件 252

12.5.1 调试Bioperl程序 252

12.5.2 个别下载Bioperl模块文件 254

12.5.3 个别安装Perl模块Bio∷Graphics 254

12.5.4 调试Bio∷Graphics模块 254

12.6 安装多序列比对程序Clustalw模块 256

12.6.1 下载并安装Clustalw程序 256

12.6.2 设置系统环境变量 258

12.6.3 测试Bioperl与Clustalw之间的接口 259

主要参考文献 261

英汉对照词汇 262