Hadoop大数据分析与挖掘实战PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:张良均等著
- 出 版 社:北京:机械工业出版社
- 出版年份:2016
- ISBN:9787111522652
- 页数:290 页
基础篇 2
第1章 数据挖掘基础 2
1.1 某知名连锁餐饮企业的困惑 2
1.2 从餐饮服务到数据挖掘 3
1.3 数据挖掘的基本任务 4
1.4 数据挖掘建模过程 4
1.4.1 定义挖掘目标 4
1.4.2 数据取样 5
1.4.3 数据探索 6
1.4.4 数据预处理 12
1.4.5 挖掘建模 14
1.4.6 模型评价 14
1.5 餐饮服务中的大数据应用 15
1.6 小结 15
第2章 Hadoop基础 16
2.1 概述 16
2.1.1 Hadoop简介 16
2.1.2 Hadoop生态系统 17
2.2 安装与配置 19
2.3 Hadoop原理 26
2.3.1 Hadoop HDFS原理 26
2.3.2 Hadoop MapReduce原理 27
2.3.3 Hadoop YARN原理 28
2.4 动手实践 30
2.5 小结 33
第3章 Hadoop生态系统:Hive 34
3.1 概述 34
3.1.1 Hive简介 34
3.1.2 Hive安装与配置 35
3.2 Hive原理 38
3.2.1 Hive架构 38
3.2.2 Hive的数据模型 40
3.3 动手实践 41
3.4 小结 45
第4章 Hadoop生态系统:HBase 46
4.1 概述 46
4.1.1 HBase简介 46
4.1.2 HBase安装与配置 47
4.2 HBase原理 50
4.2.1 HBase架构 50
4.2.2 HBase与RDBMS 51
4.2.3 HBase访问接口 52
4.2.4 HBase数据模型 53
4.3 动手实践 54
4.4 小结 61
第5章 大数据挖掘建模平台 62
5.1 常用的大数据平台 62
5.2 TipDM-HB大数据挖掘建模平台 63
5.2.1 TipDM-HB大数据挖掘建模平台的功能 63
5.2.2 TipDM-HB大数据挖掘建模平台操作流程及实例 65
5.2.3 TipDM-HB大数据挖掘建模平台的特点 67
5.3 小结 68
第6章 挖掘建模 69
6.1 分类与预测 69
6.1.1 实现过程 69
6.1.2 常用的分类与预测算法 70
6.1.3 决策树 71
6.1.4 Mahout中Random Forests算法的实现原理 75
6.1.5 动手实践 79
6.2 聚类分析 83
6.2.1 常用聚类分析算法 83
6.2.2 K-Means聚类算法 84
6.2.3 Mahout中K-Means算法的实现原理 88
6.2.4 动手实践 90
6.3 关联规则 93
6.3.1 常用的关联规则算法 93
6.3.2 FP-Growth关联规则算法 94
6.3.3 Mahout中Parallel Frequent Pattern Mining算法的实现原理 98
6.3.4 动手实践 100
6.4 协同过滤 102
6.4.1 常用的协同过滤算法 102
6.4.2 基于项目的协同过滤算法简介 102
6.4.3 Mahout中Itembased Collaborative Filtering算法的实现原理 103
6.4.4 动手实践 106
6.5 小结 109
实战篇 112
第7章 法律咨询数据分析与服务推荐 112
7.1 背景与挖掘目标 112
7.2 分析方法与过程 114
7.2.1 数据抽取 120
7.2.2 数据探索分析 120
7.2.3 数据预处理 125
7.2.4 模型构建 130
7.3 上机实验 139
7.4 拓展思考 140
7.5 小结 145
第8章 电商产品评论数据情感分析 146
8.1 背景与挖掘目标 146
8.2 分析方法与过程 146
8.2.1 评论数据采集 147
8.2.2 评论预处理 150
8.2.3 文本评论分词 155
8.2.4 构建模型 155
8.3 上机实验 167
8.4 拓展思考 168
8.5 小结 169
第9章 航空公司客户价值分析 170
9.1 背景与挖掘目标 170
9.2 分析方法与过程 171
9.2.1 数据抽取 174
9.2.2 数据探索分析 174
9.2.3 数据预处理 175
9.2.4 模型构建 177
9.3 上机实验 182
9.4 拓展思考 183
9.5 小结 183
第10章 基站定位数据商圈分析 184
10.1 背景与挖掘目标 184
10.2 分析方法与过程 186
10.2.1 数据抽取 186
10.2.2 数据探索分析 187
10.2.3 数据预处理 188
10.2.4 构建模型 191
10.3 上机实验 194
10.4 拓展思考 195
10.5 小结 195
第11章 互联网电影智能推荐 196
11.1 背景与挖掘目标 196
11.2 分析方法与过程 197
11.2.1 数据抽取 199
11.2.2 构建模型 199
11.3 上机实验 201
11.4 拓展思考 202
11.5 小结 203
第12章 家电故障备件储备预测分析 204
12.1 背景与挖掘目标 204
12.2 分析方法与过程 206
12.2.1 数据探索分析 207
12.2.2 数据预处理 209
12.2.3 构建模型 212
12.3 上机实验 216
12.4 拓展思考 217
12.5 小结 217
第13章 市供水混凝投药量控制分析 218
13.1 背景与挖掘目标 218
13.2 分析方法与过程 220
13.2.1 数据抽取 221
13.2.2 数据探索分析 221
13.2.3 数据预处理 223
13.2.4 构建模型 227
13.3 上机实验 237
13.4 拓展思考 238
13.5 小结 239
第14章 基于图像处理的车辆压双黄线检测 240
14.1 背景与挖掘目标 240
14.2 分析方法与过程 241
14.2.1 数据抽取 242
14.2.2 数据探索分析 242
14.2.3 数据预处理 242
14.2.4 构建模型 249
14.3 上机实验 250
14.4 拓展思考 250
14.5 小结 251
高级篇 254
第15章 基于Mahout的大数据挖掘开发 254
15.1 概述 254
15.2 环境配置 255
15.3 基于Mahout算法接口的二次开发 258
15.3.1 Mahout算法实例 258
15.3.2 Mahout算法接口的二次开发示例 259
15.4 小结 271
第16章 基于TipDM-HB的数据挖掘二次开发 272
16.1 概述 272
16.1.1 TipDM-HB大数据挖掘建模平台服务接口 272
16.1.2 Apache CXF简介 276
16.2 TipDM-HB大数据挖掘建模平台服务开发实例 277
16.2.1 环境配置 277
16.2.2 开发实例 280
16.3 小结 288
参考资料 289
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《分析化学》陈怀侠主编 2019
- 《Maya 2018完全实战技术手册》来阳编著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《白雪公主分面包 分数》(韩)车宝金文 2016
- 《Python3从入门到实战》董洪伟 2019
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《近代中国分省人文地理影像采集与研究 甘肃》《近代中国分省人文地理影像采集与研究》编写组 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019