第1篇 理论篇 3
第1章 绪论 3
1.1 数据挖掘的基础概念 3
1.1.1 数据 3
1.1.2 知识 5
1.1.3 信息 5
1.1.4 数据挖掘的定义 10
1.2 数据挖掘与数据库的关系 11
1.2.1 数据库简介 11
1.2.2 数据挖掘与数据库 13
1.3 数据挖掘的过程 14
1.4 数据挖掘的体系结构 16
1.5 数据挖掘在商务智能中的位置 17
1.6 数据挖掘常见技术 18
1.7 数据挖掘标准的发展 20
1.7.1 预测模型标记语言PMML 20
1.7.2 公共仓库元模型CWM 22
1.7.3 跨行业数据挖掘标准流程CRISP-DM 24
1.8 习题 27
第2章 数据仓库与OLAP分析 28
2.1 数据仓库 28
2.1.1 数据仓库与数据挖掘的关系 29
2.1.2 数据仓库的数据模型 31
2.1.3 元数据 35
2.2 ETL过程 38
2.2.1 数据抽取 39
2.2.2 数据转换 40
2.2.3 数据加载 41
2.3 联机分析处理OLAP 41
2.3.1 OLAP概念 41
2.3.2 OLAP的操作 44
2.3.3 OLAP多维数据分析 45
2.4 习题 47
第3章 关联分析 48
3.1 关联概述 48
3.2 关联规则的定义 49
3.3 关联分析的过程 50
3.4 关联分析的基本算法 51
3.5 关联规则的分类 56
3.6 关联分析的发展 56
3.7 习题 57
第4章 分类分析 58
4.1 分类概述 58
4.2 基于决策树的分类 58
4.2.1 决策树的概念 58
4.2.2 决策树的基本算法 59
4.2.3 决策树修剪 66
4.2.4 决策树的改进 67
4.3 分类分析的其他技术 70
4.3.1 支持向量机 70
4.3.2 贝叶斯网络 73
4.4 习题 77
第5章 聚类分析 78
5.1 聚类概述 78
5.2 相似性度量 79
5.2.1 明氏(Minkowski)距离 80
5.2.2 兰氏(Canberra)距离 81
5.2.3 马氏(Mahalanobis)距离 81
5.3 层次聚类法 83
5.3.1 最短距离法 83
5.3.2 最长距离法 84
5.3.3 二元变量度量 85
5.4 K-均值聚类算法 86
5.5 习题 88
第6章 数据挖掘的仿生技术 89
6.1 人工神经网络 89
6.1.1 人脑神经元与神经元模型 90
6.1.2 人工神经网络模型 90
6.1.3 BP网络的基本原理 91
6.2 遗传算法 92
6.3 蚁群算法 94
6.4 习题 95
第7章 数据挖掘的集合论技术 96
7.1 粗糙集理论 96
7.1.1 信息系统 96
7.1.2 粗糙集 98
7.1.3 属性约简 99
7.2 模糊集理论 99
7.2.1 3次数学危机与模糊数学的诞生 99
7.2.2 模糊集合论的基础知识 101
7.2.3 λ截集和支集 103
7.2.4 怎样度量模糊性 104
7.2.5 模糊数学应用 106
7.3 习题 112
第2篇 实践篇 115
第8章 数据挖掘工具 115
8.1 SPSS工具 115
8.2 WEKA工具 116
8.2.1 WEKA的背景 116
8.2.2 WEKA的功能 117
8.2.3 WEKA的使用 118
8.3 IBM Data Miner工具 120
8.4 MS SQL Server 2008数据分析引擎 121
8.5 ETL工具Data Stage 124
8.5.1 Datastage过程理论 124
8.5.2 Datastage的并行机制 126
8.6 习题 127
第9章 关联分析在客户关系管理的应用 128
9.1 客户关系管理基本理论 128
9.1.1 客户关系管理定义 128
9.1.2 CRM中的客户类型 129
9.1.3 CRM系统体系理论 130
9.1.4 数据挖掘在客户关系管理中的应用 131
9.2 实例研究背景——Foodmart简介及DB分析 134
9.3 购物数据的预处理 138
9.4 数据集成与转换 139
9.5 建立Foodmart公司购物篮分析模型 141
9.6 WEKA软件挖掘过程 141
9.7 结果分析 146
9.8 习题 148
第10章 分类分析和聚类分析在客户关系管理的综合应用 149
10.1 Foodmart DB客户数据分析 149
10.2 决策树分类算法数据准备 150
10.2.1 数据的预处理 150
10.2.2 数据集成与转换 150
10.3 零售业客户决策树分类模型的建立 151
10.3.1 聚类分析 151
10.3.2 决策树分析 154
10.3.3 挖掘模型及流程 155
10.4 结果分析 158
10.5 习题 160
第11章 机场场区商务智能系统解决方案 162
11.1 OMC-DMS需求分析 162
11.2 方案设计思路 163
11.2.1 OMC商务智能的理念 163
11.2.2 OMC数据挖掘系统 164
11.3 OMC数据挖掘系统的部署 168
11.4 应用数据挖掘的OMC-DMS决策支持示例 169
11.5 OMC-DMS的职位需求 171
11.6 习题 171
参考文献 173
后记 176