第1章 大数据回顾 1
大数据是什么 1
数据量 2
数据速度 2
数据类型 3
大数据技术的演进 3
过去 3
现在 4
未来 5
大数据愿景 5
存储 6
NoSQL 6
NoSQL数据库类型 7
资源管理 7
数据治理 8
批量计算 8
实时计算 8
数据整合工具 9
机器学习 9
商务智能和可视化 9
大数据相关的职业 10
Hadoop架构 11
HDFS集群 12
MapReduce V1 14
MapReduce V2——YARN 15
Hadoop生态圈简介 18
驯服大数据 18
Hadoop——英雄 19
HDFS——Hadoop分布式系统 19
Hadoop版本 23
发行版——本地部署 25
发行版——云端 27
总结 28
第2章 金融服务中的大数据 29
各个行业的大数据使用情况 29
卫生保健 30
人类科学 30
电信 31
在线零售商 31
为什么金融部门需要大数据 31
金融部门的大数据应用案例 34
HDFS上的数据归档 34
监管 35
欺诈检测 35
交易数据 36
风险管理 36
客户行为预测 36
情感分析——非结构化 36
其他应用案例 37
金融大数据的演进过程 37
应该如何学习金融大数据 41
把你的数据上传到HDFS上 41
从HDFS上查询数据 42
在Hadoop上的SQL 43
实时 44
数据治理和运营 44
ETL工具 45
数据分析和商业智能 45
金融大数据的实现 46
关键挑战 46
克服挑战 47
总结 50
第3章 在云端使用Hadoop 51
大数据云的故事 51
原因 52
时机 53
收获 54
项目细节——在云中进行风险模拟 54
解决方案 55
现实世界 55
目标世界 57
数据转换 60
数据分析 62
总结 63
第4章 使用Hadoop进行数据迁移 65
项目细节——归档你的交易数据 65
解决方案 67
项目第一阶段——分裂交易数据到数据仓库和Hadoop 68
项目第二阶段——完成数据从关系型数据仓库到Hadoop的迁移 77
总结 83
第5章 入门 85
项目详细信息——风险和监管报告 86
解决方案 87
现实世界 87
目标世界 88
数据收集 89
数据转换 97
数据分析 112
总结 116
第6章 变得有经验 117
实时大数据 117
项目细节——识别欺诈交易 119
解决方案 120
现实世界 120
目标世界 120
马尔科夫链模型执行——批处理模式 121
数据收集 126
数据转换 128
总结 132
第7章 深入扩展Hadoop的企业级应用 133
扩展开来——实际上的水平 134
更多的大数据使用案例 135
使用案例——再谈欺诈问题 136
解决方案 136
使用案例——用户投诉 137
解决方案 137
使用案例——算法交易 137
解决方案 138
使用案例——外汇交易 138
解决方案 138
使用案例——基于社交媒体的交易数据 139
解决方案 139
使用案例——非大数据 140
解决方案 140
数据湖 140
Lambda架构 143
大数据管理 144
Apache Falcon概览 146
安全性 147
总结 149
第8章 Hadoop的快速增长 151
Hadoop发行版的升级周期 151
最佳实践和标准 154
环境 154
与BI和ETL工具的集成 155
提示 155
新的趋势 157
总结 158