第1章 互联网+统计学+R语言 1
1.1互联网中的统计学 1
1.1.1“互联网+”的发展 1
1.1.2统计学的发展 2
1.1.3大数据时代的统计学 2
1.2 R语言——互联网与统计学的桥梁 3
1.3本书结构 5
第2章R语言基础 7
2.1安装R语言 7
2.1.1获取和安装R语言 7
2.1.2安装RStudio 9
2.1.3 R包 10
2.1.4帮助 12
2.2 R语言基本对象 12
2.2.1数据类型 12
2.2.2向量 12
2.2.3矩阵和数组 19
2.2.4列表 27
2.2.5数据框 29
2.2.6因子 32
2.2.7数据类型的辨别和转换 39
2.2.8数据类型和对象关系 39
2.3工作空间和查看对象 40
2.3.1工作空间和工作目录 40
2.3.2遍历、创建、删除文件夹 41
2.3.3查看对象的方法 42
2.4数据导入和导出 43
2.4.1数据导入 43
2.4.2数据导出 49
2.5操作符和函数 51
2.5.1操作符 51
2.5.2函数 54
2.6数据集操作 59
2.6.1变量操作 60
2.6.2数据集操作 63
2.6.3数据集连接 67
2.6.4数据汇总 68
2.7控制流 71
2.7.1重复和循环 71
2.7.2条件执行 73
2.7.3 next和break 74
2.8自定义函数 75
第3章 互联网运营指标的建立 77
3.1项目背景、目标及方案 78
3.1.1项目背景 78
3.1.2项目目标 78
3.1.3项目方案 78
3.2项目技术理论简介 78
3.2.1骨灰级流量指标 78
3.2.2登录和激活 80
2.2.3访问深度和吸引力 81
3.2.4订单指标 85
3.2.5网站或APP性能指标 86
3.2.6转化率 87
3.2.7层次分析法 87
3.3项目实践 92
3.3.1搭建运营指标系统 92
3.3.2制作对比型指标及趋势线 97
3.3.3创建用户价值和活跃度指标 101
第4章 指标监控系统 111
4.1项目背景、目标及方案 111
4.1.1项目背景 111
4.1.2项目目标 111
4.1.3项目方案 112
4.2项目技术理论简介 112
4.2.1时间序列基本统计量 112
4.2.2数据观测与描述性统计 113
4.2.3随机性 115
4.2.4周期性 115
4.2.5节假日模式识别 115
4.2.6建模数据集的建立 118
4.2.7指标监控方法(不含节假日) 125
4.2.8节假日指标监控方法 134
4.2.9 R语言实例代码 135
4.3项目实践 141
4.3.1数据概览 142
4.3.2节假日模式识别 145
4.3.3模型数据集的建立 155
4.3.4指标监控(非节假日) 160
4.3.5节假日指标监控 176
4.3.6总结 181
第5章 用数据驱动业务——AB测试 182
5.1项目背景、目标和方案 182
5.1.1项目背景 182
5.1.2项目目标 183
5.1.3项目方案 183
5.2项目技术理论简介 183
5.2.1自动化分流策略 183
5.2.2整体评估指标 185
5.2.3概率论预备知识 186
5.2.4假设检验 191
5.2.5三个问题 197
5.3项目实践 197
第6章 变量筛选技术 204
6.1项目背景、目标和方案 204
6.1.1项目背景 204
6.1.2项目目标 205
6.1.3项目方案 205
6.2项目技术理论简介 205
6.2.1变量相关性 206
6.2.2变量筛选 209
6.2.3变量降维 215
6.2.4 R语言实例代码 225
6.3项目实践 237
6.3.1变量筛选 238
6.3.2变量降维 243
第7章 构建用户画像系统 247
7.1项目背景、目标和方案 247
7.1.1项目背景 247
7.1.2项目目标 248
7.1.3项目方案 248
7.2项目技术理论简介 248
7.2.1用户画像的基本概念 248
7.2.2用户画像应用领域 249
7.2.3用户画像分类 250
7.2.4用户画像构建 250
7.2.5用户画像标签的数值处理方法 254
7.3项目实践 256
第8章 从数据中寻找优质用户 261
8.1项目背景、目标和方案 261
8.1.1项目背景 261
8.1.2项目目标 262
8.1.3项目方案 262
8.2项目技术理论简介 262
8.2.1逻辑回归的基本概念 262
8.2.2建模流程 266
8.2.3模型开发阶段 269
8.2.4模型验证阶段 279
8.2.5模型测试阶段 285
8.2.6商业应用流程 288
8.2.7 R语言实例代码 288
8.3项目实践 295
8.3.1数据探索 295
8.3.2数据处理 297
8.3.3建立模型 302
8.3.4模型验证 304
8.3.5总结 308
第9章 文本挖掘——点评数据展示策略 309
9.1项目背景、目标和方案 310
9.1.1项目背景 310
9.1.2项目目标 311
9.1.3项目方案 311
9.2项目技术理论简介 312
9.2.1评论文本质量量化指标模型 312
9.2.2用户相似度模型 313
9.2.3情感性分析 316
9.2.4 R语言实例代码 321
9.3项目实践 326
9.3.1若干自定义函数 326
9.3.2文本质量量化指标模型 329
9.3.3用户相似度模型 334
9.3.4情感性分析 335
9.3.5总结 340