第一部分 基础篇 2
第1章 Mahout简介 2
1.1 Mahout应用背景 2
1.2 Mahout算法库 3
1.2.1聚类算法 4
1.2.2分类算法 5
1.2.3协同过滤算法 6
1.2.4频繁项集挖掘算法 7
1.3 Mahout应用 7
1.4本章小结 8
第2章 Mahout安装配置 9
2.1 Mahout安装前的准备 9
2.1.1安装JDK 10
2.1.2安装Hadoop 12
2.2两种安装方式 20
2.2.1使用Maven安装 20
2.2.2下载发布版安装 22
2.3测试安装 22
2.4本章小结 24
第二部分 算法篇 26
第3章 聚类算法 26
3.1 Canopy算法 26
3.1.1 Canopy算法简介 26
3.1.2 Mahout中Canopy算法实现原理 28
3.1.3 Mahout的Canopy算法实战 29
3.1.4 Canopy算法小结 37
3.2 K-Means算法 37
3.2.1 K-Means算法简介 37
3.2.2 Mahout中K-Means算法实现原理 38
3.2.3 Mahout的K-Means算法实战 39
3.2.4 K-Means算法小结 46
3.3 Mean Shift算法 46
3.3.1 Mean Shift算法简介 46
3.3.2 Mahout中Mean Shift 算法实现原理 46
3.3.3 Mahout的Mean Shift 算法实战 48
3.3.4 Mean Shift算法小结 51
3.4本章小结 51
第4章 分类算法 52
4.1 Bayesian算法 53
4.1.1 Bayesian算法简介 53
4.1.2 Mahout中Bayesian算法实现原理 55
4.1.3 Mahout的Bayesian算法实战 59
4.1.4拓展 70
4.1.5 Bayesian算法小结 70
4.2 Random Forests算法 70
4.2.1 Random Forests算法简介 70
4.2.2 Mahout中Random Forests算法实现原理 72
4.2.3 Mahout的Random Forests算法实战 77
4.2.4拓展 81
4.2.5 Random Forests算法小结 82
4.3本章小结 83
第5章 协同过滤算法 84
5.1 Distributed Item-Based Collaborative Filtering算法 85
5.1.1 Distributed Item-Based Collaborative Filtering算法简介 85
5.1.2 Mahout中Distributed ItemBased Collaborative Filtering算法实现原理 86
5.1.3 Mahout的Distributed Item Based Collaborative Filtering算法实战 90
5.1.4拓展 93
5.1.5 Distributed ItemBased Collabo-rative Filtering算法小结 94
5.2 Collaborative Filtering withALSWR算法 94
5.2.1 Collaborative Filtering with ALSWR算法简介 94
5.2.2 Mahout中Collaborative Filtering with ALS-WR算法实现原理 98
5.2.3 Mahout的Collaborative Filtering with ALS-WR算法实战 99
5.2.4拓展 107
5.2.5 Collaborative Filtering with ALS WR算法小结 107
5.3本章小结 107
第6章 模式挖掘算法 108
6.1 FP树关联规则算法 109
6.1.1 FP树关联规则算法简介 109
6.1.2 Mahout中Parallel Frequent Pattern Mining算法实现原理 113
6.1.3 Mahout的Parallel Frequent Pattern Mining算法实战 120
6.1.4拓展 125
6.2本章小结 126
第7章 Mahout中的其他算法 127
7.1 Dimension Reduction算法 128
7.1.1 Dimension Reduction算法简介 128
7.1.2 Mahout中Dimension Reduction算法实现原理 129
7.1.3 Mahout的Dimension Reduction算法实战 133
7.1.4拓展 139
7.2本章小结 142
第三部分 实战篇 144
第8章 Friend Find系统 144
8.1系统功能 145
8.1.1系统管理员 145
8.1.2普通用户 146
8.1.3总体功能 146
8.2数据库设计 147
8.2.1原始用户数据表 148
8.2.2注册用户数据表 149
8.2.3系统管理员表 149
8.2.4聚类中心表 149
8.3系统技术框架 150
8.4系统流程 152
8.4.1登录 152
8.4.2注册 153
8.4.3上传数据 154
8.4.4调用K-Means算法 155
8.4.5查看用户分组 157
8.4.6查看分组情况 158
8.4.7查看分组成员 159
8.5系统实现 159
8.5.1登录 159
8.5.2注册 161
8.5.3上传数据 162
8.5.4调用K-Means算法 163
8.5.5查看用户分组 167
8.5.6查看分组情况 167
8.5.7查看分组成员 168
8.6本章小结 170
第9章 Wine Identification系统 171
9.1系统功能 172
9.1.1用户管理模块 173
9.1.2随机森林模型建立模块 173
9.1.3随机森林模型预测模块 173
9.2系统框架 173
9.3数据库设计 180
9.3.1用户表 180
9.3.2系统常量表 181
9.4系统流程 181
9.4.1登录 182
9.4.2注销 182
9.4.3权限修改 182
9.4.4密码修改 183
9.4.5用户列表 183
9.4.6数据上传 184
9.4.7随机森林模型建立 185
9.4.8随机森林模型评估 186
9.4.9随机森林模型预测 187
9.5系统实现 188
9.5.1登录 188
9.5.2注销 188
9.5.3权限修改 189
9.5.4密码修改 190
9.5.5用户列表 191
9.5.6数据上传 193
9.5.7随机森林模型建立 194
9.5.8随机森林模型评估 194
9.5.9随机森林模型预测 195
9.6本章小结 196
第10章 Dating Recommender系统 197
10.1系统功能 198
10.1.1系统管理员功能 198
10.1.2普通用户功能 199
10.1.3功能总述 199
10.2系统框架 200
10.3数据库设计 203
10.3.1系统管理员表 203
10.3.2原始用户推荐信息表 204
10.3.3基础数据top 10表 204
10.4系统流程 204
10.4.1登录 205
10.4.2上传数据 205
10.4.3推荐分析 206
10.4.4单用户推荐 210
10.4.5新用户推荐 211
10.5算法设计 214
10.5.1协同过滤算法接口设计 214
10.5.2 top10算法设计 215
10.5.3新用户推荐算法设计 221
10.6系统实现 228
10.6.1登录 228
10.6.2上传数据 229
10.6.3推荐分析 230
10.6.4单用户推荐 232
10.6.5新用户推荐 234
10.7本章小结 235
第11章 博客推荐系统 237
11.1系统功能 238
11.1.1用户管理 238
11.1.2建立知识库 239
11.1.3博客管理 239
11.2系统框架 240
11.3数据库设计 246
11.3.1用户信息表 246
11.3.2知识库信息表 247
11.3.3系统常量表 248
11.4系统流程 248
11.4.1登录 248
11.4.2注册 248
11.4.3密码修改 249
11.4.4订阅博客查看 249
11.4.5博客订阅与退订 249
11.4.6博客推荐 250
11.4.7上传数据 252
11.4.8调用FP树关联规则算法 253
11.5算法设计 260
11.6系统实现 262
11.6.1登录 262
11.6.2注册 263
11.6.3密码修改 264
11.6.4订阅博客查看 265
11.6.5运行FP云算法 266
11.6.6博客订阅与退订 267
11.6.7博客推荐 268
11.7本章小结 270