《生物信息学》PDF下载

  • 购买积分:16 如何计算积分?
  • 作  者:樊龙江著
  • 出 版 社:杭州:浙江大学出版社
  • 出版年份:2017
  • ISBN:9787308171472
  • 页数:517 页
图书介绍:本书建议阅读对象为本科、研究生、从事生物学及其相关专业领域(如医学、农学等)科研与开发人员等,可以作为生物信息学专业学生的入门教材和非生物信息学专业学生和科研工作者的基础教材。本书共分为四部分:生物信息学基础(第一篇)、高通量测序数据分析(第二篇)、生物信息学外延与交叉(第三篇)和生物信息学资源与实践(第四篇)。各篇内容:(1)作为生物信息学的基础篇,第一篇包括8章内容,涵盖序列数据产生、分子数据库、序列联配算法、基因预测、系统发生树构建和蛋白质结构预测等。同时也涵盖了生物信息学计算机基础部分,包括操作系统、主要编程语言等。该篇主要目的是使初学者掌握生物信息学的基本概念和主要方法;(2)第二篇为高通量序列数据分析篇,主要针对目前第二和三代测序技术产生的核苷酸序列数据的分析方法,主要涵盖基于高通量测序数据的基因组拼接、基因组变异、转录组、非编码RNA、甲基化和宏基因组等生物信息学分析原理和技术;(3)第三篇为生物信息学外延与交叉篇,分别介绍了与生物信息学紧密相关的四个生物学学科:系统生物学、群体遗传学、数量遗传学和合成生物学;(4)最后一篇生物信息学资源与实践篇,主要罗列了生物信息学主要

绪论 1

第一节 生物信息与生物信息学 1

一、迅速增长的生物信息 1

二、生物信息学的概念 2

第二节 生物信息学简史与展望 5

一、生物信息学发展简史 5

二、生物信息学技术的应用 8

三、生物信息学学科展望 10

第三节 本书的组织与使用 13

第一篇 生物信息学基础 16

第1-1章 生物信息类型及其产生途径 16

第一节 生物信息的类型 16

第二节  DNA测序技术 18

一、第一代测序技术 18

二、第二代测序技术 21

三、第三代测序技术 29

第三节 高通量测序技术的应用 32

一、DNA/RNA相关测序 32

二、蛋白质-DNA/RNA互作测序 34

三、甲基化/宏基因组测序 34

第四节 蛋白质序列及其结构测定 35

一、蛋白质序列与蛋白质互作测定 35

二、蛋白质结构测定 37

第1-2章 分子数据库 38

第一节 分子数据库概述 38

一、分子数据库概念 38

二、数据库记录格式 38

三、数据库冗余、序列递交和检索 41

第二节 核苷酸及其相关数据库 45

一、DNA/RNA序列数据库 45

二、基因组数据库 47

三、非编码RNA数据库 49

第三节 蛋白质及其相关数据库 51

第四节 代谢途径等专业数据库 54

一、代谢途径数据库 54

二、代谢组学数据库和表型数据库 55

第1-3章 两条序列联配算法及序列搜索 57

第一节 序列联配基本概念 57

第二节 计分矩阵 58

一、计分矩阵的一般原理 58

二、氨基酸替换矩阵 60

三、位置特异性计分矩阵(PSSM) 62

第三节 两条序列联配算法 64

一、Needleman-Wunsch算法 64

二、Smith-Waterman算法 67

第四节  BLAST算法及数据库搜索 69

一、BLAST算法 70

二、利用BLAST进行数据库序列搜索 71

三、序列相似性的统计推断 78

第1-4章 多条序列联配算法及功能域分析 81

第一节 多序列联配概念及其算法 81

一、多序列联配概念 81

二、多序列全局联配算法 81

三、多序列局部联配算法 83

第二节 蛋白质序列功能域分析与模型 86

一、功能域概念 86

二、功能域模型 88

第三节 熵与信息量 91

一、不确定性与信息量 91

二、信息熵的应用 92

第1-5章 基因预测与功能注释 94

第一节 基因组序列构成与基因预测 94

一、基因组序列的基本构成 94

二、基因预测及其基本方法 96

三、基因注释流程 99

第二节 从头预测——隐马尔可夫模型(HMM)方法 101

一、马尔可夫和隐马尔可夫模型 101

二、隐马尔可夫模型问题及其算法 103

三、HMM基因预测模型及其应用 104

第三节 贝叶斯统计及其在基因预测方面的应用 107

一、贝叶斯统计与生物信息学 107

二、利用贝叶斯统计进行基因预测 110

第四节 基因功能注释 112

一、利用序列和结构域数据库进行注释 112

二、利用功能分类和代谢途径信息进行注释 114

第五节 基因序列构成分析 114

一、碱基构成与分布 114

二、DNA行走与Z曲线 118

三、同向重复序列分析 119

四、蛋白质序列跨膜等特征分析 123

第1-6章 系统发生树构建 126

第一节 系统发生树与遗传模型 126

一、系统发生树概述 126

二、遗传模型 129

第二节 距离法 131

一、非加权平均连接聚类法(UPGMA法) 132

二、Fitch-Margoliash算法 134

三、邻接法(NJ法) 137

第三节 简约法 139

第四节 似然法 141

一、DNA序列的似然模型 141

二、两条序列系统发生树 142

三、三条及多条序列系统发生树 143

第五节 基因组组分矢量方法 145

一、组分矢量方法(CVTree算法) 145

二、基因组关联“距离”与系统发生树构建 146

第1-7章 蛋白质结构预测与药物设计 148

第一节 蛋白质结构概述 148

一、蛋白质结构及其预测 148

二、蛋白质结构数据库 150

三、蛋白质结构主要预测工具 151

第二节 蛋白质二级结构预测 153

一、蛋白质二级结构预测方法 153

二、结构预测实例 154

第三节 蛋白质三级结构预测 156

一、同源建模法 157

二、折叠识别法 159

第四节 计算机辅助药物设计 160

一、间接药物设计 160

二、直接药物设计 161

第1-8章 生物信息学计算机基础 163

第一节 使用Unix/Linux操作系统 163

一、Unix/Linux操作系统及其结构 163

二、Linux Shell常用命令 165

第二节 掌握一门计算机编程语言 168

一、计算机编程语言 168

二、Python语言 170

三、R语言 183

四、MySQL语言 188

第三节 并行与自动化 195

一、并行式计算 196

二、并行化模型及其实例 197

第四节 其他 202

一、算法 202

二、可视化与画图 204

第二篇 高通量测序数据分析 210

第2-1章 基因组拼接与分析 210

第一节 基因组序列拼接概念 210

一、基因组短序列拼接问题 210

二、基因组从头拼接主要方法 211

三、利用遗传图谱等进行基因组组装 211

第二节 基于图论的拼接算法 213

一、图论 213

二、基于德布鲁因图的拼接算法 215

第三节 第三代测序数据拼接方法 220

第四节 基于字符串(K-mer)的基因组调查与分析 223

一、基因组大小估计 223

二、基因组复杂度估计 224

三、基因组“肖像”及缺失字符串分析 225

第2-2章 基因组变异与分析 228

第一节 基因组变异类型与检测方法 228

一、基因组遗传变异类型 228

二、基因组变异检测方法 228

第二节 基因组重测序及其应用 232

一、基因组重测序应用领域 233

二、基因组重测序数据分析 235

第2-3章 转录组分析 241

第一节 转录组测序与拼接 241

一、转录组及其技术平台 241

二、转录组序列拼接 244

第二节 基因表达分析 245

一、差异表达基因的鉴定 246

二、差异表达基因富集分析 246

第三节 可变剪切和基因融合分析 251

一、基因可变剪切 251

二、融合基因 253

第2-4章 非编码RNA分析 257

第一节 非编码RNA简介 257

一、非编码RNA类型与功能 257

二、非编码RNA进化 259

三、样品采集及其测序方法 266

四、非编码RNA主要数据库 269

第二节 小RNA计算识别与靶基因预测 273

一、miRNA主要特征及计算识别 273

二、siRNA主要特征及计算识别 277

三、miRNA和siRNA靶基因预测 280

第三节 长非编码RNA鉴定与功能分析 282

一、线性lncRNA鉴定 282

二、环化RNA鉴定 283

三、lncRNA功能预测 288

第2-5章 甲基化与组蛋白修饰分析 291

第一节 表观遗传机制概述 291

第二节 甲基化测序与分析 292

一、甲基化测序原理 292

二、生物信息学分析方法 296

第三节 组蛋白修饰测定与分析 298

一、组蛋白样品的制备 298

二、组蛋白修饰分析方法 298

第2-6章 宏基因组分析 301

第一节 宏基因组及其分析方法 301

一、宏基因组概述 301

二、宏基因组学技术的应用 304

第二节  16S rDNA序列分析 305

一、质控与分析流程 306

二、物种多样性分析 309

三、群落结构分析 313

第三节 全基因组序列数据分析 316

一、分析内容与流程 316

二、基因预测及功能注释 321

第2-7章 蛋白质组分析 324

第一节 蛋白质组学概述 324

一、蛋白质组及其分析 324

二、高通量分离和鉴定技术 325

第二节 双向电泳图像与质谱组合分析 332

一、胶图获取与分析 332

二、利用指纹图谱鉴定蛋白质 334

第三节 质谱数据采集与分析 335

一、质谱数据采集策略 335

二、肽段数据库搜索与质量控制 340

第四节 定量蛋白质组分析 345

一、同位素标记定量分析 345

二、非同位素标记定量分析 348

第三篇 生物信息学外延与交叉 352

第3-1章 系统生物学 352

第一节 系统生物学概述 352

一、系统生物学的兴起和基本概念 352

二、研究领域及其与生物信息学的交叉 353

第二节 网络与生物网络 353

一、无标度和阶层网络 353

二、生物网络模块及其算法工具 355

第三节 基因调控网络 356

一、布尔网络模型 357

二、贝叶斯网络模型 360

第3-2章 群体遗传学 363

第一节 群体遗传多态性与结构 363

一、遗传多态性及其估计 363

二、群体结构 366

第二节 正向选择的统计检验 368

一、自然选择与中性检验 368

二、基于种内多态性的检验方法 369

三、基于种内多态和种间分歧度的检验方法 373

第三节 群体进化的溯祖测验 374

一、溯祖理论 374

二、溯祖测验的应用 376

第四节 统计测验相关问题与策略 379

一、复合测验问题 379

二、全基因组检测的优势和假阳性问题 379

三、影响统计测验的因素 381

第3-3章 数量遗传学 383

第一节 数量性状遗传基本概念 383

第二节 连锁分析 387

一、连锁分析原理 387

二、试验群体的连锁分析 387

三、常用连锁分析软件 393

第三节 关联分析 397

一、关联分析基本原理 397

二、常用关联分析软件 402

第3-4章 合成生物学 409

第一节 合成生物学概述 409

一、合成生物学定义和研究内容 409

二、合成生物学引发的争议 411

第二节 基因线路:模块化工程化 412

一、基因线路的基本概念 412

二、几个经典基因线路设计 415

第三节 基因组人工合成与重构 418

一、噬菌体基因组人工合成与重构 418

二、细菌基因组人工合成与重构 420

第四篇 生物信息学资源与实践 424

第4-1章 生物信息学常用代码和关键词 424

第一节 核苷酸和氨基酸代码 424

第二节 遗传密码 426

第三节 核苷酸和蛋白质序列记录特征关键词 426

一、核苷酸序列记录关键词及其说明 426

二、蛋白质序列记录相关的关键词及其说明 430

第4-2章 生物信息学数据库和在线分析工具 433

第一节 重要门户网站与分子数据库 433

一、主要门户网站 433

二、主要分子数据库 433

第二节 主要在线分析工具 436

第三节 主要开源分析软件 438

第4-3章 生物信息学实验 440

实验1 分子序列数据库记录格式与检索 440

实验2 数据库搜索与未知序列功能预测 443

实验3 多序列联配及其功能域预测 445

实验4 蛋白质编码基因预测与功能注释 447

实验5 非编码miRNA二级结构及其靶基因预测 450

实验6 基因组浏览器GBrowser及其应用 453

实验7 系统发生树构建 457

实验8 蛋白质结构预测 460

第4-4章 生物信息学常用英文术语及释义 464

参考文献 499