《生物信息学:从基因组到药物》PDF下载

  • 购买积分:14 如何计算积分?
  • 作  者:(德)T.伦盖威尔主编;郑珩 王非译
  • 出 版 社:化学工业出版社;现代生物技术与医药科技出版中心
  • 出版年份:2006
  • ISBN:750258479X
  • 页数:430 页
图书介绍:本书介绍了生物信息学的基础知识,对生物信息学的研究各环节应用方法,软件和数据资源进行了说明,并论述了生物信息学在新药研究与开发中的应用。

第1篇 基础技术 3

1 生物信息学:基因组到药物的桥梁 3

1.1 疾病的分子基础 3

1.2 疾病治疗的分子途径 7

1.3 寻找蛋白质靶点 8

1.3.1 基因组学与蛋白质组学 10

1.3.2 基因/蛋白质所能提供的信息 10

1.4 药物开发 11

1.5 生物信息学的概貌 12

1.5.1 生物信息学的内在属性 14

1.6 生物信息学的扩展属性 16

1.6.1 基本贡献:分子生物学数据库和基因组比较 16

1.6.2 应用之一:基因和蛋白质表达数据 17

1.6.3 应用之二:药物筛选 18

1.6.4 应用之三:遗传变异 18

参考文献 19

2.1 引言 20

2 序列分析 20

2.2 序列分析 21

2.2.1 二级结构预测 22

2.3 双重序列比对 24

2.3.1 点阵作图法 24

2.3.2 序列比对 25

2.4 数据库检索Ⅰ:单一序列的启发式算法 28

2.5 比对与相似性搜索的统计 31

2.6 多重序列比对 33

2.7 多重比对和数据库搜索 35

2.8 蛋白质家族和蛋白质结构域 36

2.9 结论 37

参考文献 37

3 真核基因的结构、性质以及计算识别 42

3.1 真核基因的结构特点 42

3.2 哺乳类动物基因组中拼接位点的分类 44

3.3 识别功能信号的方法 47

3.3.1 搜寻保守序列的非随机的相似性 47

3.3.2 位点特异性识别器 49

3.3.4 基于框架特异性的蛋白编码区识别方法 51

3.3.3 内容特异性测定方法 51

3.3.5 精确性量度 52

3.3.6 线性辨识分析的应用 52

3.3.7 供体受体拼接位点的预测 53

3.3.8 人类DNA中启动子序列的识别 56

3.3.9 poly(A)位点的预测 58

3.4 基因识别方法 61

3.5 用于多基因预测的差异分析概率法 61

3.5.1 使用HMM的多基因预测方法 62

3.5.2 基于模式的多基因预测方法 64

3.5.3 基因识别程序的准确性 67

3.5.4 利用蛋白质或EST相似性信息来改进基因预测 69

3.6 基因组测序计划所产生序列的注释 70

3.7 InfoGene:已知基因和预测基因的数据库 72

3.8 预测的基因功能分析和确证 74

3.9 基因发现与功能位点预测的常用网址 76

致谢 76

参考文献 77

4.2 调控区域的主要功能 82

4.1 真核基因组中调控区域的主要特征 82

4 分析基因组中的调控区域 82

4.2.1 转录因子结合位点(TF-位点) 83

4.2.2 序列特征 83

4.2.3 结构元件 83

4.2.4 调控区域的组织原则 83

4.2.5 用于分析和检查调控区域的生物信息学模型 87

4.3 元件检测的方法 88

4.3.1 转录因子结合位点的检测 88

4.3.3 其他元件的检测 89

4.3.2 结构元件的检测 89

4.4 调控区域的分析 90

4.4.1 训练集的选择 90

4.4.2 统计学和生物学显著性 90

4.4.3 上下文依赖性 91

4.5 调控区域的检测方法 91

4.5.1 调控区域的类型 92

4.5.2 调控序列的识别方法 93

4.6 大的基因组序列分析 97

4.6.2 长的上下文序列 98

4.6.1 灵敏度与特异性的平衡 98

4.6.3 比较基因组学的特征 99

4.6.4 基于高通量方法的数据集分析 99

4.7 结论 99

参考文献 100

5 生物学和医学中的同源模建 103

5.1 引言 103

5.1.1 同源模建的概念 103

5.1.2 同源蛋白是如何产生的? 104

5.1.3 同源模建的目的 105

5.1.4 基因组计划的影响 106

5.2 数据输入 107

5.3 方法 109

5.3.1 在不同层次的复杂性上模建 109

5.3.2 环模建 110

5.3.3 侧链模建 119

5.3.4 完整模建的方法 127

5.4.1 靶蛋白的范围 129

5.4 结果 129

5.4.2 举例:淀粉状前体蛋白β-分泌酶 130

5.5 优势和局限性 134

5.6 检验 135

5.6.1 侧链预测的精度 135

5.6.2 CASP会议 136

5.6.3 蛋白质健康度 137

5.8.1 骨架构象 139

5.8 附录 139

5.7 可获得性 139

5.8.2 侧链构象分析 145

致谢 149

参考文献 149

6 蛋白质结构预测 163

6.1 概述 164

6.1.1 术语的定义 166

6.1.2 本章所涉及的内容 167

6.2.3 其他输入数据 169

6.2.2 输出数据 169

6.2 数据 169

6.2.1 输入数据 169

6.2.4 结构比较和分类 170

6.2.5 评分函数和(经验)能量势 172

6.3 方法 175

6.3.1 二级结构预测 175

6.3.2 基于知识的三维结构预测 177

6.4.1 远缘同源检测 189

6.4.2 结构基因组学 189

6.4 结果 189

6.4.3 为结构基因组学选择靶标 194

6.4.4 基因组注释 196

6.4.5 序列到结构到功能的范式(Paradigrn) 196

6.5 预测的验证 197

6.5.1 基准集(Benchmark set)测试 197

6.5.2 盲法预测实验(CASP) 199

6.6 结论:优势和局限性 201

6.6.1 线串法 201

6.6.3 局限性 202

6.6.2 优势 202

6.7 获取方式 203

致谢 203

参考文献 204

7 药物设计中的蛋白质-配体对接 216

7.1 引言 216

7.1.1 对接的分类 217

7.1.2 基于结构的药物设计的应用 218

7.2.1 刚性结构对接 219

7.2 蛋白质-配体对接的方法 219

7.2.2 柔性配体对接算法 223

7.2.3 模拟对接 228

7.2.4 组合库的对接 231

7.2.5 蛋白质-配体复合物计分 232

7.3 验证与应用 234

7.3.1 X射线结构的再造 234

7.3.2 盲法预测验证 235

7.3.3 筛选小分子数据库 235

7.4.1 输入数据的准备 237

7.3.4 组合库的对接 237

7.4 实际中的分子对接 237

7.4.2 分析对接结果 238

7.4.3 选择正确的对接工具 238

7.5 总结 239

7.6 可获取的软件 240

致谢 240

参考文献 240

8 蛋白质-蛋白质和蛋白质-DNA对接的模建 248

8.1 引言 248

8.1.1 蛋白质-蛋白质和蛋白质-DNA对接的必要性 248

8.1.2 计算方法概述 248

8.1.3 本章的范围 250

8.2 蛋白复合物的结构研究 250

8.3 蛋白质-蛋白质对接的方法 251

8.3.1 用傅里叶相关理论来进行刚性结构对接 251

8.3.2 用残基对势为对接复合物再排序 256

8.3.4 复合物的精细化和附加筛选 258

8.3.3 距离限制的使用 258

8.3.5 对接的实现 260

8.4 蛋白质-蛋白质对接的结果 261

8.5 蛋白质-DNA复合物的模建 264

8.5.1 方法 264

8.5.2 结果 265

8.6 蛋白质-蛋白质对接方案 267

8.6.1 对接模拟结果的评估 267

8.6.3 其他刚性对接方法 268

8.6.2 傅里叶关联法 268

8.6.4 柔性蛋白质-蛋白质对接 270

8.6.5 用刚性处理法对假定的对接复合物重排名 270

8.6.6 在假定的对接复合物重排名过程中引入柔性 271

8.7 蛋白质-蛋白质对接的盲法实验 271

8.8 蛋白质对接的能量方面 273

8.9 结论 274

致谢 275

参考文献 275

9.1 引言 281

9 分子生物学资源的集成与获取 281

第2篇 应用 281

9.2 分子生物学资源 282

9.2.1 数据库 282

9.2.2 应用程序 286

9.2.3 全球范围的数据库与应用程序 286

9.3 SRS概述 287

9.3.1 元定义层 288

9.3.2 SRS核心 288

9.3.3 包封程序 288

9.3.4 客户端程序 288

9.4 集成分子生物学资源 289

9.4.1 SRS标记服务器 289

9.4.2 分子生物学资源的元定义 290

9.4.3 索引数据库 291

9.4.4 查询与链接数据库 291

9.4.5 浏览器和对象加载器 291

9.5 SRS数据仓库 292

9.4.6 应用程序——分析数据 292

9.6 访问集成数据 293

9.6.1 网页界面 293

9.6.2 应用程序的界面(API) 295

9.6.3 其他界面 296

9.7 其他方法 296

9.8 总结 297

参考文献 297

10.1 引言 298

10 基因组测序计划的生物信息学支持 298

10.2 方法 302

10.2.1 相似读序对的快速鉴定 303

10.2.2 低质末端区的去除 305

10.2.3 重叠区的计算和评估 306

10.2.4 叠连群的构建 306

10.2.5 一致序列的构建 308

10.3 示例 308

10.4 其他拼装程序 313

致谢 315

参考文献 315

10.5 结论 315

11 序列差异性分析 317

11.1 引言 317

11.2 序列差异性 317

11.3 连锁分析 318

11.4 关联分析 320

11.5 为什么由遗传分析转移到单核苷酸多态性? 321

11.6 SNP的发现 321

11.7 基因型定型技术 323

11.8 在人类基因组中SNP是频繁出现的并且其组织结构很复杂 325

11.9 混合池策略(Pooling Strategies) 327

11.10 结论 327

参考文献 328

12 蛋白质组分析 332

12.1 引言和原理 332

12.2 蛋白质分离 336

12.2.1 实验方面:一种实验操作技术——二维电泳技术的介绍 336

12.2.2 应用二维电泳技术作为诊断学和疾病描述的工具 337

12.3 二维电泳图谱的计算机分析 339

12.3.1 二维电泳分析软件 341

12.4 分离后蛋白质的验证和性质测定 347

12.4.1 引言 347

12.4.2 工具 349

12.5 蛋白质组数据库 352

12.5.1 引言 352

12.5.2 蛋白质序列数据库 352

12.5.3 核酸序列数据库 356

12.5.5 二维电泳数据库 357

12.5.4 蛋白质家族、结构域及功能位点的数据库:InterPro 357

12.5.6 翻译后修饰数据库 358

12.5.7 结论 359

12.6 蛋白质组分析中的自动化 359

12.6.1 引言 359

12.6.2 应用肽质量指纹技术的机器化蛋白质鉴定 360

12.6.3 分子扫描 362

12.6.4 其他技术 364

12.7 结论 365

参考文献 366

13 基因组和蛋白质组中靶标的搜寻 369

13.1 引言 369

13.2 大规模基因表达研究和药物靶点鉴定的实验设计 369

13.3 药物靶点发现中的计算分析 372

13.3.1 Shannon熵 372

13.3.2 聚类 374

13.3.3 分析方法联合应用于实验药物的开发 377

13.3.5 未来展望:遗传网络的逆向工程 378

13.3.4 如何选择这些方法 378

13.3.6 基因组和蛋白质组 380

13.4 结论 380

参考文献 380

14 数据库的筛选 382

14.1 引言 382

14.2 计算机虚拟筛选的方法 384

14.2.1 基于配体相似性的虚拟筛选 384

14.2.2 基于结构的虚拟筛选 387

14.4.1 库生成 389

14.4 第一个测试方案:快速相似性筛选算法的应用 389

14.3 虚拟筛选应用 389

14.4.2 计算细节 391

14.4.3 筛选结果的讨论 391

14.5 第二个测试方案:对接作为一种虚拟筛选工具 397

14.5.1 库生成 398

14.5.2 对接程序 398

14.5.3 对接结果讨论 398

14.6 总结和展望 402

参考文献 403

致谢 403

15 未来方向 407

15.1 基因组学和生物信息学的进展将如何改变我们对生物学和医学的观点? 407

15.2 生物信息学将面临的主要挑战是什么? 409

15.2.1 新的实验数据 409

15.2.2 新的分析方法 411

15.2.3 生物学上的整合观点 413

15.3 生物信息学的展望和内在局限性 416

参考文献 417

附录 生物信息学中算法术语词表 419