项目一 走进大数据 1
任务1概述大数据的内涵 2
任务2关注大数据的影响 6
任务3认识常见的大数据计算模式 11
任务4厘清大数据处理的基本流程 14
任务5大数据应用大显神通 15
任务6大数据的发展及面临的挑战 18
【同步训练】 22
项目二 Ubuntu及服务安装配置 23
任务1安装Ubuntu Server 24
任务2搭建FTP系统 33
任务3搭建MySQL数据库系统 37
任务4安装Ubuntu Desktop 41
【同步训练】 47
项目三 Hadoop集群部署 48
任务1构建集群系统 49
任务2 SSH证书登录 54
任务3 Hadoop部署与使用 56
【同步训练】 76
项目四 MapReduce编程 77
任务1搭建MapReduce开发平台 78
任务2编写单词计数程序 82
任务3编写气象数据分析程序 96
【同步训练】 111
项目五 HBase数据库部署与应用 112
任务1 HBase部署 113
任务2 HBase Shell 125
任务3 HBase编程 136
任务4 MapReduce与HBase集成 144
【同步训练】 154
项目六 Hive数据仓库安装与应用 155
任务1安装Hive 155
任务2 Hive CLI 168
任务3 Hive编程 182
任务4 Hive与HBase集成 186
【同步训练】 187
项目七 Pig数据分析 188
任务1 Pig安装及使用 188
任务2 Pig高级编程 200
【同步训练】 209
项目八 Sqoop数据迁移 210
任务1 Sqoop安装及MySQL与HDFS数据迁移 210
任务2 MySQL与Hive/HBase数据转移 216
【同步训练】 218
项目九 Spark部署及数据分析 219
任务1 Spark部署 220
任务2 Spark数据分析 229
任务3 Spark编程 241
【同步训练】 252
项目十 大数据综合实例编程 253
任务1 MapReduce大数据处理 254
任务2 Mahout的K-Means计算 266
任务3决策树和随机森林的分类预测 272
任务4频繁项集计算与关联分析 287
【同步训练】 297
参考文献 298