第一篇 基础篇 2
第1章 什么是游戏数据分析 2
1.1为什么要对游戏进行分析 2
1.2游戏数据分析的流程 3
1.3数据分析师的能力要求 4
1.3.1数据处理能力 5
1.3.2数据挖掘能力 6
1.3.3数据应用能力 8
1.4小结 8
第2章 必备R语言基础 9
2.1开发环境准备和快速入门 9
2.1.1 R语言简介 9
2.1.2 R的安装 10
2.1.3其他辅助工具 10
2.1.4 R快速入门 12
2.2数据对象 19
2.2.1向量 20
2.2.2矩阵与数组 24
2.2.3列表和数据框 27
2.3数据导入 30
2.3.1利用RStudio导入 30
2.3.2文本文件的导入 32
2.3.3 Excel文件的导入 33
2.3.4数据库文件的导入 34
2.3.5网络数据的爬取 38
2.4小结 42
第3章 R语言绘图重要技术 43
3.1常用图形参数 43
3.1.1颜色元素 43
3.1.2文字元素 46
3.1.3点元素 46
3.1.4线元素 48
3.2低级绘图函数 48
3.2.1标题 48
3.2.2坐标轴 50
3.2.3图例 52
3.2.4网格线 52
3.2.5点 54
3.2.6文字 54
3.2.7线 55
3.3高级绘图函数 57
3.3.1散点图 58
3.3.2气泡图 59
3.3.3线图 60
3.3.4柱状图 62
3.3.5饼图 62
3.3.6直方图和密度图 63
3.3.7 Q-Q图 65
3.3.8箱线图 66
3.3.9茎叶图 66
3.3.10点图 67
3.3.11马赛克图 67
3.4小结 69
第4章 高级绘图工具 70
4.1 lattice包绘图工具 70
4.1.1绘图特色 70
4.1.2基本图形 77
4.2 ggplot2包绘图工具 93
4.2.1从qplot开始 93
4.2.2 ggplot作图 96
4.2.3 ggthemes主题包 101
4.3交互式绘图工具 103
4.3.1 rCharts包 104
4.3.2 recharts包 108
4.3.3 rbokeh包 118
4.3.4 plotly包 119
4.3.5 googleVis包 122
4.3.6其他基于htmlwidgets包开发的交互包 124
4.4小结 132
第二篇 实战篇 134
第5章 游戏数据预处理 134
5.1数据抽样 134
5.1.1数据抽样的必要性 134
5.1.2类失衡处理方法:SMOTE 135
5.1.3数据随机抽样:sample函数 138
5.1.4数据等比抽样:createData-Partition函数 139
5.1.5用于交叉验证的样本抽样 142
5.2数据清洗 143
5.2.1缺失值判断及处理 144
5.2.2异常值判断处理 152
5.3数据转换 158
5.3.1产生衍生变量 158
5.3.2数据分箱 159
5.3.3数据标准化转换 160
5.4数据哑变量处理 162
5.5小结 165
第6章 游戏数据分析的常用方法 166
6.1游戏数据可视化 166
6.1.1单指标数据可视化 166
6.1.2双指标数据可视化 167
6.1.3三指标数据可视化 167
6.2游戏数据趋势分析 169
6.2.1同比、环比 169
6.2.2趋势线拟合 170
6.2.3时间序列数据预测 171
6.3游戏数据相关分析 179
6.3.1相关分析基本原理 179
6.3.2相关关系可视化 181
6.3.3活跃时间段相关分析 184
6.4游戏数据中的降维技术 186
6.4.1主成分及因子分析基本原理 186
6.4.2对应分析基本原理 188
6.4.3玩家偏好分析 188
6.5小结 191
第7章 漏斗模型与路径分析 192
7.1漏斗模型与路径分析的主要区别和联系 192
7.2漏斗模型 193
7.2.1漏斗模型的主要应用场景 193
7.2.2分析案例:新手教程漏斗模型 194
7.3路径分析 197
7.3.1路径分析的主要应用场景 197
7.3.2路径分析的主要算法 198
7.3.3分析案例:游戏点击事件路径分析 202
7.4小结 208
第8章 留存分析 209
8.1指标概述 209
8.1.1用户留存 209
8.1.2流失分析 211
8.2留存率的分析及预测 212
8.2.1留存率曲线 213
8.2.2留存率预测曲线 213
8.2.3优化预测曲线 216
8.3用户流失预测 218
8.3.1分类及模型评估 220
8.3.2活跃用户流失预测 233
8.4小结 238
第9章 用户分析 239
9.1用户分类 239
9.1.1新老用户 240
9.1.2活跃用户 241
9.1.3用户习惯 243
9.2 LTV 244
9.2.1 LTV的定义 244
9.2.2 LTV的预测 244
9.3用户物品购买关联分析 247
9.3.1常用关联规则算法 248
9.3.2 R中的实现 250
9.3.3案例:对用户购买物品进行关联分析 251
9.4基于用户物品购买智能推荐 259
9.4.1智能推荐模型构建及评估 259
9.4.2案例:对用户物品购买进行智能推荐 262
9.5社会网络分析 264
9.5.1网络图的基本概念 264
9.5.2网络图的R语言实现 266
9.5.3 R与Gephi的结合 270
9.5.4案例:分析用户物品购买分类 275
9.6小结 279
第10章 渠道分析 280
10.1渠道分析的意义 280
10.2建立渠道数据监控体系 282
10.2.1构建数据分析指标 283
10.2.2建立渠道数据监控体系 287
10.3渠道用户质量评级 293
10.3.1渠道用户质量评级的背景和目的 293
10.3.2渠道用户质量打分模型 293
10.3.3分析案例:渠道用户质量打分 294
10.4小结 298
第11章 收入分析 299
11.1宏观收入分析 299
11.2游戏经济与用户关系分析 302
11.2.1背景及数据 302
11.2.2数据探索分析 303
11.2.3模型构建 308
11.3 RFM模型研究 310
11.3.1 RFM模型研究背景及原理 310
11.3.2案例:付费用户RFM模型研究 312
11.3.3 RFM模型的不足及改进 314
11.4小结 316
第三篇 提高篇 318
第12章 Rattle:可视化数据挖掘工具 318
12.1 Rattle简介及安装 318
12.1.1 Rattle简介 318
12.1.2 Rattle安装 319
12.2功能预览 319
12.3数据导入 320
12.3.1导入CSV数据 321
12.3.2导入ARFF数据 325
12.3.3导入ODBC数据 326
12.3.4 R Dataset——导入其他数据源 328
12.3.5导入RData File数据集 330
12.3.6导入Library数据 332
12.4数据探索 333
12.4.1数据总体概况 333
12.4.2数据分布探索 335
12.4.3相关性 338
12.4.4主成分 341
12.4.5交互图 343
12.5数据建模 348
12.5.1聚类分析 348
12.5.2关联规则 352
12.5.3决策树 354
12.5.4随机森林 356
12.6模型评估 360
12.6.1混淆矩阵 360
12.6.2风险图 360
12.6.3 ROC曲线及相关曲线 361
12.6.4模型得分数据集 361
12.7小结 364
第13章 快速搭建游戏数据分析平台 365
13.1 shiny快速入门 365
13.2 shinydashboard包 375
13.3案例一:搭建数据可视化原型 379
13.4案例二:用户细分及付费预测平台 388
13.5案例三:渠道用户打分平台 395
13.6小结 402