第1章 概述 1
1.1 商务智能简介 1
1.1.1 商务智能概念 1
1.1.2 商务智能的发展 3
1.1.3 从数据处理的角度看商务智能的组成 6
1.2 为什么需要商务智能 7
1.3 商务智能工具 8
第2章 数据仓库 12
2.1 数据仓库概述 12
2.1.1 数据仓库的概念及特点 12
2.1.2 数据库与数据仓库的区别 14
2.1.3 数据仓库的技术支持 16
2.2 数据仓库的设计 16
2.3 数据仓库的构建实例——以Foodmart 2000.mdb数据集为例 24
第3章 数据预处理 38
3.1 为什么需要预处理数据 38
3.2 数据清理 40
3.2.1 空缺值处理 40
3.2.2 异常值检测 41
3.2.3 重复记录检测 42
3.3 数据集成 43
3.4 数据变换 44
3.5 数据归约 47
第4章 联机分析处理 50
4.1 OLAP的概念与特点 50
4.1.1 OLAP的概念 50
4.1.2 OLAP的特点 51
4.1.3 OLTP和OLAP的对比 52
4.2 OLAP的一些基本概念 53
4.3 OLAP的分类 55
4.4 OLAP的基本操作 57
4.5 OLAP——以Foodmart 2000.mdb数据集中库存数据表等相关数据为例 61
第5章 分类 68
5.1 分类的概念 68
5.2 决策树分类 69
5.2.1 基本概念 69
5.2.2 决策树的生成过程 69
5.2.3 决策树停止的条件 74
5.2.4 决策树的修剪 77
5.2.5 决策树的评估 80
5.3 贝叶斯分类 83
5.4 人工神经网络分类 85
5.4.1 人工神经网络概述 85
5.4.2 神经元的数学模型 86
5.4.3 人工神经网络模型 87
5.4.4 神经网络拓扑结构的确定 89
5.5 分类过程中面临的问题——不均衡数据集 90
5.6 其他分类方法 91
5.6.1 k-最近邻居法 92
5.6.2 粗糙集分类法 94
5.7 Microsoft分类挖掘模型的操作过程——以基于决策树的客户分类为例 97
第6章 关联规则 111
6.1 关联规则简介 112
6.2 关联规则的分类 113
6.3 由事务数据库挖掘单维关联规则 115
6.3.1 Aprior算法 115
6.3.2 频繁模式增长 118
6.4 关联规则的推广 122
6.4.1 多层关联规则 122
6.4.2 多维关联规则 124
6.5 时序关联规则 125
6.6 商品关联关系分析——以Foodmart 2000.mdb数据集中1997年销售数据为例 128
第7章 聚类 144
7.1 简介 144
7.2 聚类分析算法 146
7.2.1 K-均值簇算法 146
7.2.2 EM算法 148
7.3 聚类分析的应用 152
7.4 聚类分析的操作过程——基于客户价值的聚类分析 153
第8章 商务智能在管理中的应用 163
8.1 基于决策树的职员职位影响因素研究 163
8.2 基于聚类方法的广告效应差异分析 172
8.3 基于贝叶斯方法和决策树方法的顾客分类效果比较研究 179
8.4 基于聚类方法的顾客特征分析 186