1概述 1
1.1 何为数据工程师 1
1.2 数据分析的流程 3
1.3 数据分析的工具 11
1.4 大数据的思与辨 14
2关于Python 17
2.1 为什么是Python 17
2.2 常用基础库 19
2.2.1 Numpy 19
2.2.2 Pandas 26
2.2.3 Scipy 37
2.2.4 Matplotlib 38
3基础分析 43
3.1 场景分析与建模策略 43
3.1.1 统计量 43
3.1.2 概率分布 48
3.2 实例讲解 55
3.2.1 谁的成绩更优秀 55
3.2.2 应该库存多少水果 57
4数据挖掘 60
4.1 场景分析与建模策略 60
4.1.1 分类 61
4.1.2 聚类 76
4.1.3 回归 86
4.1.4 关联规则 90
4.2 数据挖掘的重要概念 93
4.2.1 数据预处理 93
4.2.2 评估与验证 97
4.2.3 Bagging与Adaboost 99
4.2.4 梯度下降与牛顿法 102
4.3 实例讲解 105
4.3.1 信用卡欺诈监测 105
4.3.2 员工离职预判 110
5深度学习 114
5.1 场景分析与建模策略 115
5.1.1 感知机 115
5.1.2 自编码器 119
5.1.3 限制玻尔兹曼机 123
5.1.4 深度信念神经网络 127
5.1.5 卷积神经网络 129
5.2 人工智能应用概况 137
5.2.1 深度学习的历史 137
5.2.2 人工智能的杰作 140
5.3 实例讲解 146
5.3.1 学习识别手写数字 146
5.3.2 让机器认识一只猫 151
6大数据分析 160
6.1 常用组件介绍 160
6.1.1 数据传输 160
6.1.2 数据存储 165
6.1.3 数据计算 174
6.1.4 数据展示 180
6.2 大数据处理架构 188
6.2.1 Lambda架构 189
6.2.2 Kappa架构 192
6.2.3 ELK架构 193
6.3 项目设计 194
参考文献 202