《生物信息学基础教程》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:张洛欣,马斌编著
  • 出 版 社:北京:高等教育出版社
  • 出版年份:2015
  • ISBN:9787040418255
  • 页数:195 页
图书介绍:本书根据两位作者多年的教学与科研经验创作而成,兼顾学科基础和研究前沿。全书着重于生物信息学的基础理论和主要软件,覆盖该学科几乎所有的主要方面:双序列的比较、快速比对和序列数据库的查询方法、多序列比较、DNA序列中的信号元素、分子进化树分析、基因组重组、基因表达数据分析、RNA结构比对和预测、蛋白质学中的质谱分析、蛋白质结构预测等。书中配有大量习题,其难易程度用星号标注,其中的个别未解决问题特别注明,可以作为研究生的研究课题。本书不仅适合作为高年级本科生和研究生开设生物信息学或计算生物学的教材,也可供希望了解生物信息理论和工具的生命科学、数学和计算机等方向的科研人员均阅读参考。

第一章 生物序列比对 1

1.1 DNA、RNA和蛋白质 1

1.1.1 DNA分子 2

1.1.2 蛋白质分子 3

1.1.3 RNA分子 3

1.1.4 从基因到蛋白质的信息传递 4

1.2 比对:序列比较的模型 4

1.3 比对图 5

1.3.1 定义 6

1.3.2 双序列之间比对的总数目 7

1.4 比对的记分法则 8

1.5 全序列比对:动态规划算法 9

1.5.1 基本算法 9

1.5.2 使用仿射空位罚分的算法 12

1.5.3 全序列比对的C语言程序 14

1.6 局部比对:Smith-Waterman算法 17

1.6.1 Smith-Waterman算法 18

1.6.2 局部比对的C语言程序 20

1.7 最优占用空间的比对算法 21

1.8 比对蛋白质序列所使用的打分矩阵 24

1.8.1 打分的统计基础 24

1.8.2 BLOSUM矩阵系列 25

参考文献 30

练习题 30

第二章 快速比对方法 33

2.1 同源序列查询和数据库搜索 33

2.2 序列中的字分布 35

2.2.1 DNA序列的随机模型Ⅰ:一致独立分布 36

2.2.2 DNA序列的随机模型Ⅱ:马尔可夫链 38

2.3 字匹配的散列表方法 41

2.4 点阵法 43

2.5 FASTA程序 45

2.6 BLAST程序 49

2.6.1 基本算法:连续核的概念 49

2.6.2 E值的计算公式 50

2.6.3 BLAST程序系列 52

2.7 散核方法 54

2.7.1 散核模型 54

2.7.2 散核的优化 58

2.7.3 基于散核的相似性查找的程序实现 60

2.7.4 多散核 61

2.7.5 其他有关散核的研究 62

参考文献 63

练习题 64

第三章 多序列比对 66

3.1 为什么需要比对多个生物序列? 66

3.2 模体、谱、共识序列 67

3.3 Logo:一个序列保守区域的可视化方法 69

3.4 多序列比对的SP分数 70

3.5 多序列比对的复杂性 72

3.5.1 动态规划算法 72

3.5.2 NP-难解性 73

3.6 渐进式比对 77

3.6.1 渐进式的基本策略 77

3.6.2 Feng-Doolittle比对算法 78

3.7 近似算法 80

3.7.1 序列编辑距离 80

3.7.2 星型比对算法 81

3.8 多序列比对实用程序 84

3.8.1 ClustalW 84

3.8.2 MUSCLE 89

3.8.3 其他多序列比对程序 90

3.9 基因组的比对 91

参考文献 93

练习题 93

第四章 隐马尔可夫模型及基因序列的识别 96

4.1 隐马尔可夫模型 96

4.1.1 隐马尔可夫模型的定义 96

4.1.2 隐马尔可夫模型的基本问题 97

4.2 基本算法 99

4.2.1 前向算法和后向算法 99

4.2.2 Viterbi算法 102

4.2.3 建模算法 103

4.3 蛋白质簇的隐马尔可夫链模型 106

4.3.1 谱HMM 106

4.3.2 从多序列比对到谱HMM 107

4.3.3 从谱HMM到多序列比对 108

4.3.4 Pfam数据库 109

4.4 GENSCAN:预测人基因组中的全基因结构程序 110

4.4.1 真核生物基因的结构 110

4.4.2 半HMM 111

4.4.3 基因的Burge-Karlin模型 112

4.4.4 自动识别人基因组中的基因序列 115

参考文献 116

练习题 117

第五章 分子进化树分析 118

5.1 达尔文的进化树 118

5.2 进化树的数学性质 120

5.2.1 基本概念 120

5.2.2 进化树的个数 121

5.2.3 常见的无根进化树变换 124

5.2.4 进化树之间的距离 126

5.2.5 二叉树和多叉树 127

5.3 构建分子进化树Ⅰ:Parsimony方法 128

5.3.1 Fitch算法 130

5.3.2 寻找简约进化树 131

5.4 构建分子进化树Ⅱ:基于距离的方法 132

5.4.1 加权进化树和距离矩阵 132

5.4.2 计算序列间的距离 133

5.4.3 Neighbor-Joining算法 135

5.4.4 UPGMA算法 139

5.5 构建分子进化树Ⅲ:最大似然法和贝叶斯方法 141

5.5.1 最大似然法 141

5.5.2 贝叶斯方法 142

5.6 构建分子进化树的两个实际问题 143

5.6.1 一致性和长分支相吸现象 143

5.6.2 Bootstrap分析 145

5.7 祖先状态的推断 146

5.7.1 问题的定义 146

5.7.2 Sankoff算法 146

5.7.3 最大似然法 147

5.7.4 推断方法的准确率 148

5.8 基因树和物种树的融合 150

5.8.1 基因簇和基因树 150

5.8.2 基因树和物种树的融合的定义 151

5.8.3 推断基因复制事件 153

参考文献 155

练习题 155

第六章 计算蛋白质组学 159

6.1 基础知识 159

6.1.1 氨基酸和肽的质量 159

6.1.2 质谱仪和质谱 160

6.1.3 同位素峰、误差和噪音 162

6.1.4 连续质谱 164

6.1.5 复杂蛋白样本的处理 165

6.1.6 肽鉴定的基本方式 167

6.2 肽从头测序 168

6.2.1 打分函数 168

6.2.2 PEAKS算法 169

6.2.3 谱图算法 176

6.3 搜库及其统计学验证 178

6.3.1 打分函数 178

6.3.2 对结果的质控 180

6.4 翻译后修饰 182

6.5 其他研究课题 183

6.5.1 定量分析 183

6.5.2 糖鉴定 184

6.5.3 新型肽鉴定方法 184

6.5.4 其他分子的鉴定 184

参考文献 184

练习题 186

索引 187

英汉术语对照 192