第一部分 R语言基础知识 2
第1章 欢迎使用R 2
1.1 R是什么 2
1.2 为什么用R 2
1.3 为什么不用R 3
1.4 什么时候用R 4
1.5 如何使用本书 4
1.6 关键点 6
第2章 R综述 7
2.1 开始 7
2.2 R用途快速指南 8
2.3 R命令基础 11
2.4 基础对象 12
2.5 数据框 21
2.6 载入和存储数据 24
2.7 编写函数 27
2.8 清理 30
2.9 知识拓展 30
2.10 关键点 31
第二部分 数据分析基础知识 34
第3章 数据描述 34
3.1 模拟数据 34
3.2 关于变量的函数 38
3.3 概括数据框 41
3.4 单变量可视化 45
3.5 知识拓展 54
3.6 关键点 55
第4章 连续变量之间的关系 56
4.1 零售数据 56
4.2 用散点图探索变量间关系 60
4.3 把多张图合并为一张图 65
4.4 散点图矩阵 67
4.5 相关系数 70
4.6 探索问卷调查回复间的相关性 76
4.7 知识拓展 78
4.8 关键点 78
第5章 组比较:表格和可视化 80
5.1 模拟客户分组数据 80
5.2 各组对应的描述统计量 87
5.3 知识拓展 96
5.4 关键点 97
第6章 组比较:统计检验 98
6.1 用于比较的数据 98
6.2 频数检验:chisq.test() 98
6.3 观测比例检验:binom.test() 101
6.4 组均值检验:t.test() 103
6.5 多组均值检验:ANOVA 104
6.6 初识贝叶斯ANOVA 109
6.7 知识拓展 113
6.8 关键点 114
第7章 识别结果变量的驱动因子:线性模型 115
7.1 游乐场数据 115
7.2 用1m()函数拟合线性模型 117
7.3 拟合多元线性模型 125
7.4 因子自变量 129
7.5 交互效应 131
7.6 避免过度拟合 134
7.7 建议的线性模型拟合过程 134
7.8 贝叶斯线性模型:MCMCregress() 135
7.9 知识拓展 136
7.10 关键点 137
第三部分 高级营销应用 140
第8章 降低数据复杂度 140
8.1 消费者品牌评分数据 140
8.2 主成分分析和感知图 144
8.3 探索性因子分析 151
8.4 高维标度化简介 157
8.5 知识扩展 160
8.6 关键点 160
第9章 线性模型相关的其他话题 162
9.1 处理高度相关的变量 162
9.2 二项结果变量的线性模型:逻辑回归 166
9.3 分层线性模型 175
9.4 贝叶斯分层线性模型 182
9.5 频率学派和贝叶斯学派HLM模型的简单比较 187
9.6 知识拓展 190
9.7 关键点 191
第10章 验证性因子分析和结构方程模型 193
10.1 结构模型的出发点 193
10.2 量级评估:CFA 195
10.3 更一般的模型:结构方程模型 204
10.4 PLS模型 209
10.5 知识拓展 215
10.6 关键点 216
第11章 客户分组:聚类和判别 217
11.1 客户分组的思想 217
11.2 客户分组数据 219
11.3 聚类 219
11.4 判别分析 234
11.5 预测:识别潜在客户 242
11.6 知识拓展 244
11.7 关键点 245
第12章 关联法则:购物篮分析 247
12.1 基础关联法则 247
12.2 零售交易数据:购物篮 249
12.3 搜寻并且可视化关联法则 252
12.4 非交易数据中的规则:再次探索客户分组 259
12.5 知识拓展 263
12.6 关键点 263
第13章 选择模型 264
13.1 基于选择的联合问卷调查分析 264
13.2 模拟选择数据 266
13.3 拟合选择模型 269
13.4 在选择模型中加入消费者个体差异 278
13.5 分层贝叶斯选择模型 281
13.6 基于选择的联合问卷调查设计 287
13.7 知识拓展 289
13.8 关键点 289
结论 291
附录A R版本和相关软件 292
附录B 纵向扩展 298
附录C 使用的包 306
附录D 在线资源和数据文件 310
参考文献 312