《机器学习技术与实战 医学大数据深度应用》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:(加)洪松林编著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2018
  • ISBN:9787111595991
  • 页数:334 页
图书介绍:本书作者曾在北美多家智能专业公司任高级架构师,有20年数据挖掘、机器学习方面的设计、开发、管理经验。他结合自己多年的行业经历,总结了自己在机器学习方面的知识和实际工程中的经验,提供了大量一线资料。本书不仅介绍了机器学习中的常用算法,而且给出了具体实施环境和经验总结。重点介绍了相关算法,包括:相关因子算法、聚类算法、分类算法、回归与测试算法等。不仅列举了详细示例,还介绍了算法在工程实践中的具体应用,特别是总结了自己独特的一些算法,例如矢量相关的因子选择算法、秩和相关因子选择算法、密度分布聚类算法、概率特征模型算法等。重点剖析了医药学领域的应用。

第1章 机器学习基础 1

1.1认识机器学习 1

1.1.1机器学习概念 1

1.1.2机器学习与生活 4

1.1.3机器学习与知识 6

1.2机器学习应用基础 6

1.2.1事物与维度 7

1.2.2分布与关系 9

1.2.3描绘与预测 12

1.2.4现象与知识 13

1.2.5规律与因果 13

1.3机器学习应用系统 14

1.3.1数据层 14

1.3.2算法层 18

1.3.3应用层 23

1.3.4经验积累与应用 26

1.4无限三维嵌套空间假说 26

1.4.1一维空间 26

1.4.2二维空间 26

1.4.3三维空间 27

1.4.4突破三维空间 27

1.4.5五维空间 28

1.4.6六维空间 29

1.5分数维度空间 30

1.5.1分数维度 30

1.5.2自相似性 31

1.5.3无限迭代 32

1.6不确定论 33

1.7本章小结 34

第2章 数据探索 35

2.1数据关系探索 36

2.1.1业务发现 36

2.1.2关系发现 38

2.1.3数据质量探索 38

2.1.4数据整合 42

2.2数据特征探索 43

2.2.1数据的统计学特征 43

2.2.2统计学特征应用 50

2.2.3变量相关性探索 53

2.3数据选择 56

2.3.1适当的数据规模 57

2.3.2数据的代表性 57

2.3.3数据的选取 59

2.4数据处理 61

2.4.1数据标准化 62

2.4.2数据离散化 63

2.5本章小结 64

第3章 机器学习技术 65

3.1聚类分析 65

3.1.1划分聚类(K均值) 66

3.1.2层次聚类(组平均) 70

3.1.3密度聚类 75

3.2特性选择 76

3.2.1特性选择概念 76

3.2.2线性相关 80

3.2.3相关因子SRCF 82

3.3特征抽取 91

3.3.1主成分分析 91

3.3.2因子分析 93

3.3.3非负矩阵因子分解 94

3.4关联规则 95

3.4.1关联规则概念 95

3.4.2 Apriori算法 96

3.4.3 FP树频集 97

3.4.4提升(Lift) 97

3.5分类和预测 98

3.5.1支持向量机 98

3.5.2 Logistic回归 102

3.5.3朴素贝叶斯分类 106

3.5.4决策树 112

3.5.5人工神经网络 116

3.5.6分类与聚类的关系 119

3.6时间序列 120

3.6.1灰色系统预测模型 120

3.6.2 ARIMA模型预测 126

3.7深度学习 127

3.7.1图像深度学习:卷积神经网络 127

3.7.2自然语言深度学习:循环神经网络 141

3.8本章小结 145

第4章 机器学习应用案例 146

4.1特性选择的应用 146

4.1.1数据整合 146

4.1.2数据描绘 147

4.1.3数据标准化 148

4.1.4特性选择探索 148

4.2分类模型的应用——算法比较 154

4.2.1数据整合 154

4.2.2数据描绘 155

4.2.3数据标准化 156

4.2.4特性选择探索 156

4.2.5分类模型 160

4.3算法的综合应用——肿瘤标志物的研究 161

4.3.1样本选取 161

4.3.2癌胚抗原临床特征主题分析 165

4.3.3癌胚抗原临床特征规则分析 169

4.3.4癌胚抗原临床特征规则的比较分析 173

4.3.5癌胚抗原相关因子分析 174

4.3.6不同等级癌胚抗原组差异分析 177

4.4本章小结 180

第5章 机器学习应用系统开发 181

5.1 IMRS的设计思路 181

5.1.1 IMRS核心功能设计 182

5.1.2 IMRS主要功能 184

5.1.3 IMRS的模块设计和应用实现 185

5.1.4 IMRS的评估方法 194

5.2机器学习应用系统:IMRS技术设计 199

5.2.1对数据源的分析 200

5.2.2 IMRS的总体设计 203

5.3 IMRS异常侦测模型的开发 210

5.3.1异常侦测模型的功能展示 211

5.3.2技术开发要点 214

5.4 IMRS特征抽取模型的开发 221

5.4.1特征抽取模型的功能展示 221

5.4.2技术开发要点 221

5.5 IMRS的算法开发 232

5.5.1相关因子算法SRCF的实现 232

5.5.2朴素贝叶斯分类算法的实现 237

5.6本章小结 241

第6章 机器学习系统应用(一):结构数据挖掘 242

6.1分布探索 243

6.1.1两维度聚类模型应用 243

6.1.2高维度聚类模型应用 248

6.2关系探索 249

6.2.1关联规则的应用 249

6.2.2特性选择的应用 252

6.3特征探索 257

6.3.1不稳定心绞痛的特征总结 258

6.3.2动脉硬化性心脏病的临床特征 262

6.4异常探索 264

6.4.1生理指标的异常侦测 264

6.4.2异常侦测模型的比较 267

6.5推测探索 268

6.6应用系统的高级应用 269

6.6.1异常侦测的高级用法 270

6.6.2关联规则的高级应用 274

6.7本章小结 278

第7章 机器学习系统应用(二):非结构数据挖掘 280

7.1文本挖掘技术 280

7.1.1文本分词算法 280

7.1.2文本相似性算法 283

7.1.3文本聚类算法 287

7.1.4文本分类算法 290

7.2文本数据挖掘在医学上的应用 293

7.2.1医学自然文本挖掘的应用 293

7.2.2医学自然文本挖掘的方法 294

7.2.3医学自然文本挖掘的相关技术 295

7.2.4医学自然文本挖掘系统的实现 295

7.3文本分词的实现 296

7.3.1专业语料库与分词算法的结合 297

7.3.2专业分词库的自完善 297

7.4文本智能搜索 298

7.4.1文本相似性搜索 298

7.4.2文本相关性搜索 299

7.5文本聚类与分类的应用 299

7.5.1文本聚类应用 300

7.5.2文本分类应用 302

7.6文本主题提取应用 303

7.7本章小结 305

第8章 基于机器学习的人工智能应用 306

8.1基于大数据和机器学习的人工智能 306

8.1.1广义大数据 306

8.1.2人工智能 307

8.1.3基于大数据的人工智能应用 308

8.1.4基于小数据的人工智能应用 311

8.2人工智能的应用:智能医学诊断系统 314

8.2.1智能诊断推理机 314

8.2.2临床智能诊断的实现 319

8.2.3临床智能诊断的应用 321

8.2.4临床智能诊断的验证:基于群体特征的个案临床评估 323

8.3混沌人工智能 325

8.3.1混沌理论 325

8.3.2人类大脑的混沌性 327

8.3.3大脑混沌性的应用 328

8.3.4人工智能大脑展望 332

8.4本章小结 333