《Mahout算法解析与案例实战》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:樊哲著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2014
  • ISBN:9787111467977
  • 页数:272 页
图书介绍:本书共分为基础篇、实战篇、高级篇三篇,基础篇从Mahout的概念、作用、安装和配置讲起,系统讲解了Mahout现有各种算法的基本功能和操作,通过本章读者可以针对一个问题方便的找到对应的解决算法,达到对Mahout的基本使用的目的;实战篇主要结合2个Mahout的应用案例,详细分析了其整个框架构思和实现过程,使用户了解应用Mahout的开发过程;高级篇讲解了Mahout的经典应用和最佳实践,并通过源代码来分析各个模块的实现原理。本书的内容将针对对Mahout感兴趣的开发者和用户,不仅系统全面,实战性非常强,而且还不乏深度,是一本难得的Mahout著作。

第一部分 基础篇 2

第1章 Mahout简介 2

1.1 Mahout应用背景 2

1.2 Mahout算法库 3

1.2.1聚类算法 4

1.2.2分类算法 5

1.2.3协同过滤算法 6

1.2.4频繁项集挖掘算法 7

1.3 Mahout应用 7

1.4本章小结 8

第2章 Mahout安装配置 9

2.1 Mahout安装前的准备 9

2.1.1安装JDK 10

2.1.2安装Hadoop 12

2.2两种安装方式 20

2.2.1使用Maven安装 20

2.2.2下载发布版安装 22

2.3测试安装 22

2.4本章小结 24

第二部分 算法篇 26

第3章 聚类算法 26

3.1 Canopy算法 26

3.1.1 Canopy算法简介 26

3.1.2 Mahout中Canopy算法实现原理 28

3.1.3 Mahout的Canopy算法实战 29

3.1.4 Canopy算法小结 37

3.2 K-Means算法 37

3.2.1 K-Means算法简介 37

3.2.2 Mahout中K-Means算法实现原理 38

3.2.3 Mahout的K-Means算法实战 39

3.2.4 K-Means算法小结 46

3.3 Mean Shift算法 46

3.3.1 Mean Shift算法简介 46

3.3.2 Mahout中Mean Shift 算法实现原理 46

3.3.3 Mahout的Mean Shift 算法实战 48

3.3.4 Mean Shift算法小结 51

3.4本章小结 51

第4章 分类算法 52

4.1 Bayesian算法 53

4.1.1 Bayesian算法简介 53

4.1.2 Mahout中Bayesian算法实现原理 55

4.1.3 Mahout的Bayesian算法实战 59

4.1.4拓展 70

4.1.5 Bayesian算法小结 70

4.2 Random Forests算法 70

4.2.1 Random Forests算法简介 70

4.2.2 Mahout中Random Forests算法实现原理 72

4.2.3 Mahout的Random Forests算法实战 77

4.2.4拓展 81

4.2.5 Random Forests算法小结 82

4.3本章小结 83

第5章 协同过滤算法 84

5.1 Distributed Item-Based Collaborative Filtering算法 85

5.1.1 Distributed Item-Based Collaborative Filtering算法简介 85

5.1.2 Mahout中Distributed ItemBased Collaborative Filtering算法实现原理 86

5.1.3 Mahout的Distributed Item Based Collaborative Filtering算法实战 90

5.1.4拓展 93

5.1.5 Distributed ItemBased Collabo-rative Filtering算法小结 94

5.2 Collaborative Filtering withALSWR算法 94

5.2.1 Collaborative Filtering with ALSWR算法简介 94

5.2.2 Mahout中Collaborative Filtering with ALS-WR算法实现原理 98

5.2.3 Mahout的Collaborative Filtering with ALS-WR算法实战 99

5.2.4拓展 107

5.2.5 Collaborative Filtering with ALS WR算法小结 107

5.3本章小结 107

第6章 模式挖掘算法 108

6.1 FP树关联规则算法 109

6.1.1 FP树关联规则算法简介 109

6.1.2 Mahout中Parallel Frequent Pattern Mining算法实现原理 113

6.1.3 Mahout的Parallel Frequent Pattern Mining算法实战 120

6.1.4拓展 125

6.2本章小结 126

第7章 Mahout中的其他算法 127

7.1 Dimension Reduction算法 128

7.1.1 Dimension Reduction算法简介 128

7.1.2 Mahout中Dimension Reduction算法实现原理 129

7.1.3 Mahout的Dimension Reduction算法实战 133

7.1.4拓展 139

7.2本章小结 142

第三部分 实战篇 144

第8章 Friend Find系统 144

8.1系统功能 145

8.1.1系统管理员 145

8.1.2普通用户 146

8.1.3总体功能 146

8.2数据库设计 147

8.2.1原始用户数据表 148

8.2.2注册用户数据表 149

8.2.3系统管理员表 149

8.2.4聚类中心表 149

8.3系统技术框架 150

8.4系统流程 152

8.4.1登录 152

8.4.2注册 153

8.4.3上传数据 154

8.4.4调用K-Means算法 155

8.4.5查看用户分组 157

8.4.6查看分组情况 158

8.4.7查看分组成员 159

8.5系统实现 159

8.5.1登录 159

8.5.2注册 161

8.5.3上传数据 162

8.5.4调用K-Means算法 163

8.5.5查看用户分组 167

8.5.6查看分组情况 167

8.5.7查看分组成员 168

8.6本章小结 170

第9章 Wine Identification系统 171

9.1系统功能 172

9.1.1用户管理模块 173

9.1.2随机森林模型建立模块 173

9.1.3随机森林模型预测模块 173

9.2系统框架 173

9.3数据库设计 180

9.3.1用户表 180

9.3.2系统常量表 181

9.4系统流程 181

9.4.1登录 182

9.4.2注销 182

9.4.3权限修改 182

9.4.4密码修改 183

9.4.5用户列表 183

9.4.6数据上传 184

9.4.7随机森林模型建立 185

9.4.8随机森林模型评估 186

9.4.9随机森林模型预测 187

9.5系统实现 188

9.5.1登录 188

9.5.2注销 188

9.5.3权限修改 189

9.5.4密码修改 190

9.5.5用户列表 191

9.5.6数据上传 193

9.5.7随机森林模型建立 194

9.5.8随机森林模型评估 194

9.5.9随机森林模型预测 195

9.6本章小结 196

第10章 Dating Recommender系统 197

10.1系统功能 198

10.1.1系统管理员功能 198

10.1.2普通用户功能 199

10.1.3功能总述 199

10.2系统框架 200

10.3数据库设计 203

10.3.1系统管理员表 203

10.3.2原始用户推荐信息表 204

10.3.3基础数据top 10表 204

10.4系统流程 204

10.4.1登录 205

10.4.2上传数据 205

10.4.3推荐分析 206

10.4.4单用户推荐 210

10.4.5新用户推荐 211

10.5算法设计 214

10.5.1协同过滤算法接口设计 214

10.5.2 top10算法设计 215

10.5.3新用户推荐算法设计 221

10.6系统实现 228

10.6.1登录 228

10.6.2上传数据 229

10.6.3推荐分析 230

10.6.4单用户推荐 232

10.6.5新用户推荐 234

10.7本章小结 235

第11章 博客推荐系统 237

11.1系统功能 238

11.1.1用户管理 238

11.1.2建立知识库 239

11.1.3博客管理 239

11.2系统框架 240

11.3数据库设计 246

11.3.1用户信息表 246

11.3.2知识库信息表 247

11.3.3系统常量表 248

11.4系统流程 248

11.4.1登录 248

11.4.2注册 248

11.4.3密码修改 249

11.4.4订阅博客查看 249

11.4.5博客订阅与退订 249

11.4.6博客推荐 250

11.4.7上传数据 252

11.4.8调用FP树关联规则算法 253

11.5算法设计 260

11.6系统实现 262

11.6.1登录 262

11.6.2注册 263

11.6.3密码修改 264

11.6.4订阅博客查看 265

11.6.5运行FP云算法 266

11.6.6博客订阅与退订 267

11.6.7博客推荐 268

11.7本章小结 270