第1章 数据科学家的工作 1
1.1 什么是数据科学家 2
1.2 3种类型的数据科学家 5
1.3 数据科学家的现状 8
第2章 商业数据分析流程 9
2.1 数据分析的5个流程 10
2.2 现状和预期 12
2.3 发现问题 13
2.4 数据的收集和加工 19
2.5 数据分析 24
2.6 解决对策 27
2.7 小结 29
[分析基础]篇 35
第3章 案例1—柱状图为什么销售额会减少 35
3.1 现状和预期 36
3.2 发现问题 38
3.3 数据的收集和加工 39
3.4 数据分析 46
3.5 解决对策 49
3.6 小结 50
3.7 详细的R代码 51
第4章 案例2—交叉列表统计什么样的顾客会选择离开 61
4.1 现状和预期 62
4.2 发现问题 64
4.3 数据的收集和加工 65
4.4 数据分析 69
4.5 解决对策 73
4.6 小结 75
4.7 详细的R代码 76
第5章 案例3—A/B测试哪种广告的效果更好 83
5.1 现状和预期 84
5.2 发现问题 86
5.3 数据的收集和加工 88
5.4 数据分析 96
5.5 解决对策 98
5.6 小结 99
5.7 详细的R代码 100
第6章 案例4—多元回归分析如何通过各种广告的组合获得更多的用户 105
6.1 现状和预期 106
6.2 发现问题 108
6.3 数据的收集 112
6.4 数据分析 114
6.5 解决对策 117
6.6 小结 119
6.7 详细的R代码 120
[分析应用]篇 125
第7章 案例5—逻辑回归分析根据过去的行为能否预测当下 125
7 1 期望增加游戏的智能手机用户量 126
7.2 是用户账号迁转设定失败导致的问题吗 128
7.3 在数据不包含正解的情况下收集数据 131
7.4 验证是否能够建立模型 144
7.5 解决对策 148
7.6 小结 149
7.7 详细的R代码 150
第8章 案例6—聚类应该选择什么样的目标用户群 163
8.1 希望了解用户的特点 164
8.2 基于行为模式的用户分类 165
8.3 把主成分作为自变量来使用 168
8.4 进行聚类 176
8.5 解决对策 180
8.6 小结 181
8.7 详细的R代码 182
第9章 案例7—决策树分析具有哪些行为的用户会是长期用户 193
9.1 希望减少用户开始游戏后不久就离开的情况 194
9.2 了解“乐趣”的结构 195
9.3 把类作为自变量 198
9.4 进行决策树分析 210
9.5 解决对策 213
9.6 小结 215
9.7 详细的R代码 216
第10章 案例8—机器学习如何让组队游戏充满乐趣 233
10.1 使组队作战的乐趣最大化 234
10.2 利用数据分析为服务增加附加价值 236
10.3 在数据中排除星期的影响 238
10.4 构建预测模型 241
10.5 解决对策 248
10.6 小结 249
10.7 详细的R代码 250