当前位置:首页 > 工业技术
Java机器学习
Java机器学习

Java机器学习PDF电子书下载

工业技术

  • 电子书积分:12 积分如何计算积分?
  • 作 者:(美)乌黛·卡马特,(美)克里希纳·肖佩拉著;陈瑶,陈峰,刘江一等译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2018
  • ISBN:9787111609193
  • 页数:324 页
图书介绍:本书涵盖了机器学习中的经典技术,如分类、聚类、降维、离群值检测、半监督学习和主动学习。同时介绍了近期高深的主题,包括流数据学习、深度学习以及大数据学习的挑战。每一章指定一个主题,包括通过案例研究,介绍最前沿的基于Java的工具和软件,以及完整的知识发现周期:数据采集、实验设计、建模、结果及评估。每一章都是独立的,提供了很大的使用灵活性。附带的网站提供了源码和数据。对于学生和数据分析从业员来说,这确实很难得,大家可以直接用刚学到的方法进行实验,或者通过将这些方法应用到真实环境中,加深对它们的理解。
《Java机器学习》目录
标签:机器 学习

第1章 机器学习回顾 1

1.1 机器学习历史和定义 2

1.2 哪些不属于机器学习 3

1.3 机器学习概念和术语 4

1.4 机器学习类型及其子类 6

1.5 用于机器学习的数据集 8

1.6 机器学习的应用 10

1.7 机器学习中的实际问题 10

1.8 机器学习角色与过程 11

1.8.1 角色 12

1.8.2 过程 12

1.9 机器学习工具和数据集 14

1.10 小结 16

第2章 监督学习在现实世界中的实践方法 18

2.1 正式描述和符号 19

2.1.1 数据质量分析 20

2.1.2 描述性数据分析 20

2.1.3 可视化分析 20

2.2 数据转换与预处理 21

2.2.1 特征构造 22

2.2.2 处理缺失值 22

2.2.3 离群值 23

2.2.4 离散化 24

2.2.5 数据采样 24

2.2.6 训练集、验证集和测试集 26

2.3 特征关联分析与降维 28

2.3.1 特征搜索技术 29

2.3.2 特征评估技术 29

2.4 模型建立 32

2.4.1 线性模型 32

2.4.2 非线性模型 35

2.4.3 集成学习和元学习器 40

2.5 模型评价、评估和比较 42

2.5.1 模型评价 42

2.5.2 模型评估指标 43

2.5.3 模型比较 45

2.6 Horse Colic分类案例研究 47

2.6.1 业务问题 48

2.6.2 机器学习映射 48

2.6.3 数据分析 48

2.6.4 监督学习实验 49

2.6.5 结果、观察和分析 58

2.7 小结 60

2.8 参考文献 61

第3章 无监督机器学习技术 63

3.1 与监督学习共同存在的问题 63

3.2 无监督学习的特定问题 64

3.3 特征分析和降维 64

3.3.1 符号 64

3.3.2 线性方法 64

3.3.3 非线性方法 67

3.4 聚类 70

3.4.1 聚类算法 70

3.4.2 谱聚类 75

3.4.3 仿射传播 75

3.4.4 聚类的验证和评估 77

3.5 离群值或异常值检测 79

3.5.1 离群值算法 79

3.5.2 离群值评估技术 85

3.6 实际案例研究 86

3.6.1 工具和软件 86

3.6.2 业务问题 86

3.6.3 机器学习映射 86

3.6.4 数据收集 87

3.6.5 数据质量分析 87

3.6.6 数据采样和转换 88

3.6.7 特征分析和降维 88

3.6.8 聚类模型、结果和评估 91

3.6.9 离群值模型、结果和评估 94

3.7 小结 95

3.8 参考文献 95

第4章 半监督学习和主动学习 98

4.1 半监督学习 99

4.1.1 表示、符号和假设条件 99

4.1.2 半监督学习技术 101

4.1.3 半监督学习的案例研究 106

4.2 主动学习 111

4.2.1 表示和符号 112

4.2.2 主动学习场景 112

4.2.3 主动学习方法 112

4.2.4 不确定性采样 112

4.2.5 版本空间采样 113

4.2.6 数据分布采样 115

4.3 主动学习中的案例研究 116

4.3.1 工具和软件 116

4.3.2 业务问题 116

4.3.3 机器学习映射 116

4.3.4 数据采集 117

4.3.5 数据采样和转换 117

4.3.6 特征分析和降维 117

4.3.7 模型、结果和评估 117

4.3.8 主动学习结果分析 121

4.4 小结 121

4.5 参考文献 122

第5章 实时流机器学习 123

5.1 假设条件和数学符号 124

5.2 基本的流处理和计算技术 124

5.2.1 流计算 124

5.2.2 滑动窗口 125

5.2.3 采样 126

5.3 概念漂移和漂移探测 127

5.3.1 数据管理 128

5.3.2 局部内存 128

5.4 增量监督学习 130

5.4.1 建模技术 130

5.4.2 在线环境的验证、评估和比较 136

5.5 使用聚类的增量无监督学习 138

5.6 使用离群值检测的无监督学习 148

5.6.1 基于分区的聚类离群值检测 148

5.6.2 基于距离的聚类离群值检测 149

5.7 流学习案例研究 151

5.7.1 工具和软件 152

5.7.2 业务问题 152

5.7.3 机器学习映射 152

5.7.4 数据采集 153

5.7.5 数据采样和转换 154

5.7.6 模型、结果和评估 155

5.7.7 流学习结果分析 158

5.8 小结 160

5.9 参考文献 160

第6章 概率图建模 163

6.1 回顾概率 163

6.2 图的概念 166

6.2.1 图的结构和属性 166

6.2.2 子图和团 167

6.2.3 路、迹和环 167

6.3 贝叶斯网络 168

6.3.1 表示 169

6.3.2 推断 171

6.3.3 学习 180

6.4 马尔可夫网络和条件随机场 186

6.4.1 表示 187

6.4.2 推断 188

6.4.3 学习 189

6.4.4 条件随机场 189

6.5 特殊网络 190

6.5.1 树增强型网络 190

6.5.2 马尔可夫链 190

6.6 工具和使用 193

6.6.1 OpenMarkov 193

6.6.2 Weka贝叶斯网络图形界面 194

6.7 案例研究 194

6.7.1 业务问题 196

6.7.2 机器学习映射 196

6.7.3 数据采样和转换 196

6.7.4 特征分析 196

6.7.5 模型、结果和评估 197

6.7.6 结果分析 200

6.8 小结 201

6.9 参考文献 201

第7章 深度学习 203

7.1 多层前馈神经网络 203

7.1.1 输入、神经元、激活函数和数学符号 203

7.1.2 多层神经网络 204

7.2 神经网络的局限 209

7.3 深度学习 210

7.4 案例研究 231

7.4.1 工具和软件 232

7.4.2 业务问题 232

7.4.3 机器学习映射 233

7.4.4 数据采样和转换 233

7.4.5 特征分析 233

7.4.6 模型、结果和评估 233

7.5 小结 242

7.6 参考文献 243

第8章 文本挖掘和自然语言处理 245

8.1 NLP及其子领域和任务 246

8.1.1 文本分类 247

8.1.2 词性标注 247

8.1.3 文本聚类 247

8.1.4 信息抽取和命名实体识别 247

8.1.5 情感分析和观点挖掘 247

8.1.6 指代消解 248

8.1.7 词义消歧 248

8.1.8 机器翻译 248

8.1.9 语义推理及推断 249

8.1.10 文本摘要 249

8.1.11 自动问答 249

8.2 挖掘非结构化数据的问题 249

8.3 文本处理和转换 250

8.3.1 文档收集与标准化 250

8.3.2 词元化 251

8.3.3 停止词移除 251

8.3.4 词干提取或词形还原 251

8.3.5 局部/全局字典或词汇表 252

8.3.6 特征抽取/生成 253

8.3.7 特征表示和相似度 255

8.3.8 特征选择和降维 258

8.4 文本挖掘主题 259

8.4.1 文本分类 260

8.4.2 主题建模 260

8.4.3 文本聚类 263

8.4.4 命名实体识别 267

8.4.5 深度学习与NLP 270

8.5 工具和使用 272

8.5.1 Mallet 272

8.5.2 用Mallet进行主题建模 273

8.5.3 业务问题 274

8.5.4 机器学习映射 274

8.5.5 数据采集 274

8.5.6 数据采样和转换 275

8.5.7 特征分析和降维 276

8.5.8 模型、结果和评估 276

8.5.9 文本处理结果分析 277

8.6 小结 278

8.7 参考文献 278

第9章 大数据机器学习:最终领域 281

9.1 大数据的特点 283

9.2 大数据机器学习 283

9.3 批量大数据机器学习 290

9.4 案例研究 294

9.4.1 业务问题 296

9.4.2 机器学习映射 296

9.4.3 数据采集 296

9.4.4 数据采样和转换 296

9.4.5 使用Spark MLlib作为大数据机器学习平台 298

9.5 实时大数据机器学习 305

9.6 机器学习的未来 310

9.7 小结 310

9.8 参考文献 311

附录A线性代数 313

附录B概率论 317

相关图书
作者其它书籍
返回顶部