第1章 什么是大数据 1
1.1 数据、大数据及数据挖掘 1
1.2 大数据与统计学 5
1.3 机器学习与人工智能 6
1.4 相关领域应用 8
1.5 本章小结 12
1.6 习题 12
第2章 Python基础知识 13
2.1 Python概述 13
2.2 Python数据类型 17
2.3 判断与循环 43
2.4 函数与模块 55
2.5 文件的读/写 69
2.6 异常与警告 73
2.7 本章小结 79
2.8 习题 79
第3章 数据分析与可视化 81
3.1 Python数据分析包 81
3.2 数据准备 83
3.3 数据处理 95
3.4 数据分析 121
3.5 数据可视化 131
3.6 本章小结 142
3.7 习题 142
第4章 数据挖掘 145
4.1 数据挖掘绪论 145
4.2 数据存储 153
4.3 数据挖掘技术 161
4.4 数据挖掘应用 173
4.5 本章小结 181
4.6 习题 182
第5章 机器学习 183
5.1 机器学习概述 183
5.2 回归分析 185
5.3 分类算法 190
5.4 聚类算法 197
5.5 深度学习 201
5.6 机器学习的应用 204
5.7 本章小结 205
5.8 习题 205
第6章 大数据处理 206
6.1 Hadoop概述 206
6.2 Hadoop生态系统 208
6.3 Hadoop集群的安装与配置 211
6.4 HDFS简介 219
6.5 MapReduce编程模型 226
6.6 资源管理调度框架 232
6.7 Spark 238
6.8 本章小结 252
6.9 习题 253
参考文献 254