第一章 数海淘金的由来 1
第二章 建立数据仓库 4
一、数据库结构分析 4
(一)系统结构分析 4
(二)数据库结构分析 4
(三)表结构分析 5
(四)数据结构调整 5
二、数据质量检测与纠错 6
(一)数据缺失 6
(二)数据不匹配 7
(三)数据异常 7
(四)退货数据 7
三、数据处理过程 8
(一)数据清理执行包 8
(二)建立数据仓库执行包 8
四、讨论 10
第三章 购物篮构成与商品组合 12
一、购物篮分析的提出 12
二、小样本数据分析示例 12
(一)购物篮数据来源 12
(二)购物篮分析方法 13
三、其他商品的大样本购物篮分析 23
(一)茶饮料 23
(二)巧克力 24
(三)果汁饮料 25
(四)卫生巾 27
(五)袜子的购物篮相关性分析 28
(六)牙膏 33
(七)饮料的组合商品 34
第四章 口味偏好、价格偏好和规格偏好 35
一、口味偏好 35
(一)调味品 35
(二)饼干 37
(三)饮料 40
(四)茶饮料 42
(五)乐事120g薯片的口味分析 43
(六)香皂香味分析 43
二、价格偏好 44
(一)洗发水 44
(二)酸奶 47
(三)茶饮料 48
(四)袜子 49
(五)饮用水 50
(六)膨化食品和碳酸饮料 51
三、包装规格(容量)偏好 52
(一)洗发水 52
(二)果汁饮料 52
(三)饮用水 53
(四)卫生巾 55
(五)膨化食品 57
四、功能偏好和小类偏好 58
(一)洗发水 58
(二)袜子 58
(三)食用油种类购买比例 60
第五章 价格弹性和促销效果分析 62
一、价格弹性函数测算与定价模型 62
(一)符号说明 62
(二)简单优化模型 62
(三)“自价格弹性”需求曲线 64
(四)实际问题求解 65
二、促销效果分析 66
(一)促销的概念 66
(二)研究方法 66
第六章 商品销售的季节性和销售预测 82
一、案例一 82
(一)分析步骤 82
(二)销售量的时间序列分析 82
(三)销售额的时间序列分析 87
二、案例二 91
(一)季节性分析 91
(二)预测各主要品牌的销售趋势 95
三、案例三 97
四、季节变化对纸制品销售的影响 100
五、一天内不同时间段的顾客量 101
第七章 品牌偏好和品牌销售额分布规律 102
一、牙膏的品牌分布分析 102
(一)品牌市场占有率 102
(二)牙膏购买偏好分析 106
二、饼干的品牌分布分析 108
(一)市场占有率 109
(二)品牌的更新情况 113
(三)各品牌的销售策略 117
三、纸制品品牌分布分析 118
(一)品牌纸制品的销售变化 119
(二)真真纸制品销售量数据深入分析 122
四、商品品牌销售额分布的幂次定律 122
(一)幂次定律含义 123
(二)研究过程 124
(三)结论 132
第八章 关联规则的不定向计算及结果分析 133
一、关联规则概念 133
(一)基本概念 133
(二)关联规则挖掘问题分解 133
(三)常规算法介绍 134
(四)算法性能比较及选择 135
(五)Apriori算法详述 135
二、数据处理过程 136
(一)指标解释 136
(二)数据预处理 137
(三)在SQL语句上运用Apriori算法 137
三、计算结果分析 140
第九章 展望未来 142
附录 143
一、处理原始数据库的部分SQL语句 143
二、建立数据仓库的数据包代码 145
三、查询分析洗发水数据的部分SQL代码 168
参考文献 171
关键词索引 173