《生物信息学 机器学习方法》PDF下载

  • 购买积分:14 如何计算积分?
  • 作  者:(法)皮埃尔·巴尔迪(Pierre Baldi),(丹)索恩·布鲁纳克(Soren Brunak)著;张东晖等译
  • 出 版 社:北京:中信出版社
  • 出版年份:2003
  • ISBN:780073708X
  • 页数:405 页
图书介绍:本书针对信息生物学领域最重要的数据处理问题,介绍机器学习方法这种海量数据处理的理想技术。

第1章 概述 1

1.1数字化符号序列中的生物学数据 1

1.2基因组——多样性、规模和结构 6

1.3蛋白质和蛋白质组 14

1.4生物序列的信息量 22

1.5生物分子功能和结构预测 38

第2章 机器学习的基础:概率理论体系 41

2.1简介:贝叶斯建模 41

2.2考克斯—杰恩斯公理 43

2.3贝叶斯推断和归纳 46

2.4模型结构:图模型及其他技巧 52

2.5小结 55

第3章 概率建模和推断:应用举例 57

3.1最简单的序列模型 57

3.2统计力学 62

第4章 机器学习算法 69

4.1绪论 69

4.2动态规划 70

4.3梯度下降法 70

4.4EM/GEM算法 71

4.5马尔可夫链—蒙特卡罗方法 74

4.6模拟退火算法 78

4.7进化和遗传算法 80

4.8学习算法的相关技术细节 80

第5章 神经网络:理论 85

5.1概述 85

5.2通用函数逼近特性 90

5.3先验分布和似然度 91

5.4反向传播学习算法 96

第6章 神经网络:应用 99

6.1序列编码和输出表示 100

6.2序列相关性与神经网络 104

6.3蛋白质二级结构预测 105

6.4信号肽及其剪切位点的预测 115

6.5 DNA/RNA序列分析的相关应用 118

6.6预测的性能评价 123

6.7不同的性能评价标准 136

第7章 隐马氏模型(HMM):理论 145

7.1简介 145

7.2先验信息和初始化 149

7.3似然度及基本算法 151

7.4学习算法 155

7.5 HMM的应用:一般性的问题 162

第8章 隐马氏模型(HMM):应用 165

8.1在蛋白质方面的应用 165

8.2在DNA和RNA方面的应用 182

8.3 HMM的优势和局限性 195

第9章 生物信息学中的概率图模型 197

9.1生物信息学中的图模型概述 197

9.2马尔可夫模型与DNA的对称性 201

9.3马尔可夫模型和基因发现程序 205

9.4混合模型和图模型的神经网络参数化 210

9.5单模型情形 211

9.6用于蛋白质二级结构预测的双向反馈神经网络 223

第10章 进化的概率模型:系统进化树 233

10.1进化的概率模型简介 233

10.2替换概率和进化速率 235

10.3进化速率 236

10.4数据似然度 237

10.5进化树的优化和学习算法 240

10.6吝啬法 241

10.7扩展 242

第11章 随机文法和语言学 245

11.1形式文法的介绍 245

11.2形式文法和乔姆斯基层次 245

11.3文法在生物序列中的应用 250

11.4先验信息和初始化 254

11.5似然度 255

11.6学习算法 256

11.7 SCFG的应用 258

11.8实验 259

11.9展望 262

第12章 微阵列和基因表达 263

12.1微阵列数据简介 263

12.2阵列数据的概率模型 265

12.3聚类 276

12.4基因调控 281

第13章 互联网资源和公共数据库 283

13.1迅速积累的资源 283

13.2关于数据库和工具的综合目录 284

13.3分子生物学数据库综合目录 285

13.4序列与结构数据库 287

13.5序列相似性搜索 292

13.6比对 294

13.7有代表性的预测服务器 295

13.8分子生物学软件链接 300

13.9网上的博士课程 302

13.10生物信息学协会 302

13.11 HMM/NN仿真软件 302

附录A 统计学 305

A.1决策理论和损失函数 305

A.2二次损失函数 306

A.3偏差/方差均衡 307

A.4估计器的组合 308

A.5误差带 309

A.6充分统计量 309

A.7指数族 310

A.8其他有用分布 310

A.9变分法 311

附录B 信息论、熵和相对熵 313

B.1熵 313

B.2相对熵 315

B.3互信息 315

B.4 Jensen不等式 316

B.5最大熵 317

B.6最小相对熵 318

附录C 概率图模型 319

C.1符号和预备知识 319

C.2无向情形:马尔可夫随机域 320

C.3有向情形:贝叶斯网络 322

附录D HMM的相关技术:标定、周期构架、状态函数和Dirichlet混合模型 329

D.1标定 329

D.2周期构架 331

D.3状态函数:可弯曲性 333

D.4 Dirichlet混合模型 335

附录E 高斯过程、核方法及支持向量机 339

E.1高斯过程模型 339

E.2核方法和支持向量机 341

E.3高斯过程和SVM的定理 346

附录F 公式和缩写符号 349

参考文献 357

基本词汇英汉对照表 391