第1章 数据挖掘概述 1
1.1 数据仓库和数据挖掘定义与解释 1
1.1.1 数据仓库的定义与解释 1
1.1.2 数据挖掘的定义与解释 1
1.2 数据仓库系统的相关技术 3
1.2.1 数据仓库系统相关技术之间的关系 3
1.2.2 数据仓库系统模式 7
1.3 数据仓库系统中多维数据组织的形式化定义与描述 9
1.4 数据挖掘方法与研究体系 16
1.4.1 数据挖掘系统的发展与结构 16
1.4.2 数据挖掘的相关技术与工具 17
1.4.3 数据挖掘应用及发展 24
1.5 商务智能系统定义与构成 26
1.6 小结 28
思考题 28
第2章 数据采集、集成与预处理技术 29
2.1 数据采集的对象 29
2.2 数据集成技术与方法 32
2.2.1 3G与MIS的集成模式 33
2.2.2 异构数据集成的设计与实现 35
2.3 数据预处理技术与方法 36
2.3.1 数据清理的方法 36
2.3.2 数据融合的方法 37
2.3.3 数据变换的方法 38
2.3.4 数据归约的方法 39
2.4 基于样本数据划分的通用数据挖掘模型系统 40
2.5 中间件技术 41
2.5.1 中间件技术的定义与作用 41
2.5.2 中间件技术在数据仓库系统中数据采集的应用 45
2.6 小结 57
思考题 57
第3章 多维数据分析与组织 58
3.1 多维数据分析概述 58
3.1.1 联机分析处理的定义和特点 58
3.1.2 联机分析处理的评价准则 59
3.1.3 多维数据分析的主要概念 60
3.2 多维数据模型与结构 61
3.2.1 多维数据的概念模型 61
3.2.2 多维数据的逻辑模型 63
3.2.3 多维数据的物理模型 65
3.3 多维数据分析应用与工具 68
3.3.1 多维数据分析的基本操作 68
3.3.2 多维数据分析的工具及特点 69
3.4 从联机分析处理到联机分析挖掘 71
3.4.1 联机分析挖掘形成原因 71
3.4.2 联机分析挖掘概念及特征 71
3.5 小结 73
思考题 73
第4章 预测模型研究与应用 74
4.1 预测模型的基础理论 74
4.1.1 预测方法的分类 74
4.1.2 预测方法的一般步骤 74
4.2 回归分析预测模型 75
4.2.1 一元线性回归预测模型 75
4.2.2 多元线性回归预测模型 79
4.2.3 非线性回归预测模型 85
4.3 趋势外推预测模型 88
4.3.1 佩尔预测模型 88
4.3.2 龚珀兹预测模型 91
4.3.3 林德诺预测模型 94
4.4 时间序列预测模型 97
4.4.1 移动平均预测模型 97
4.4.2 指数平滑预测模型 98
4.4.3 季节指数预测模型 104
4.5 基于神经网络的预测模型 107
4.6 马尔可夫预测模型 118
4.7 小结 121
思考题 121
第5章 关联规则模型及应用 123
5.1 关联规则的基础理论 123
5.1.1 关联规则的定义与解释 123
5.1.2 关联规则在知识管理过程中的作用 123
5.2 Apriori关联规则算法 125
5.2.1 关联规则算法的相关概念 125
5.2.2 关联规则算法的流程 126
5.2.3 基于Apriori算法的关联规则算例 127
5.3 改进的Apriori关联规则方法 128
5.3.1 动态存储空间的构建 128
5.3.2 快速产生强项集的算法流程 129
5.3.3 改进算法的时间复杂性分析 130
5.4 Apriori关联规则方法的实例 131
5.5 小结 138
思考题 138
第6章 聚类分析方法与应用 139
6.1 聚类分析的基础理论 139
6.1.1 聚类分析的定义 139
6.1.2 对聚类算法性能的要求 139
6.2 聚类分析的方法 140
6.2.1 基于划分的聚类方法 140
6.2.2 基于层次的聚类方法 141
6.2.3 基于密度的聚类方法 142
6.2.4 基于网格的聚类方法 143
6.2.5 基于模型的聚类方法 143
6.3 应用聚类分析方法 145
6.3.1 r-means聚类方法 145
6.3.2 r-medoids聚类方法 146
6.3.3 AGNES聚类方法 149
6.3.4 DIANA聚类方法 150
6.3.5 DBSCAN聚类方法 152
6.4 小结 154
思考题 154
第7章 粗糙集方法与应用 155
7.1 粗糙集理论背景介绍 155
7.1.1 粗糙集的含义 155
7.1.2 粗糙集的应用及与其他领域的结合 155
7.2 粗糙集基本理论 158
7.2.1 知识与不可分辨关系 158
7.2.2 不精确范畴、近似与粗糙集 159
7.2.3 粗糙集的精度和粗糙度 160
7.2.4 粗糙集的粗等价和粗包含 161
7.3 基于粗糙集的属性约简 161
7.3.1 知识的约简和核 162
7.3.2 知识的依赖性度量和属性的重要度 164
7.4 基于粗糙集的决策知识表示 165
7.4.1 基于粗糙集的决策知识表示方法 165
7.4.2 粗糙集在规则提取中的应用算例 167
7.5 小结 168
思考题 168
第8章 遗传算法与应用 169
8.1 遗传算法基础理论 169
8.1.1 遗传算法概述 169
8.1.2 遗传算法特点 170
8.2 遗传算法的应用领域和研究方向 170
8.2.1 遗传算法的应用领域 170
8.2.2 遗传算法的研究方向 173
8.3 遗传算法的基础知识 174
8.3.1 遗传算法的相关概念 174
8.3.2 遗传算法的编码规则 174
8.3.3 遗传算法的主要算子 176
8.3.4 遗传算法的适应度函数 180
8.4 遗传算法计算过程和应用 181
8.4.1 遗传算法计算过程 181
8.4.2 遗传算法参数选择 181
8.4.3 遗传算法实例应用 182
8.5 小结 186
思考题 186
第9章 基于模糊理论的模型与应用 187
9.1 层次分析法 187
9.1.1 层次分析法的计算步骤 187
9.1.2 层次分析法应用实例 190
9.2 模糊层次分析法 192
9.2.1 模糊层次分析法的步骤 193
9.2.2 模糊层次分析法应用实例 193
9.3 模糊综合评判法 196
9.3.1 模糊综合评判法的原理与步骤 196
9.3.2 模糊综合评判法应用实例 199
9.4 模糊聚类分析方法 201
9.4.1 模糊聚类方法介绍 201
9.4.2 模糊聚类算法应用 202
9.5 小结 203
思考题 203
第10章 灰色系统理论与方法 204
10.1 灰色系统的基础理论 204
10.1.1 灰色系统理论介绍 204
10.1.2 灰色系统的特点 205
10.1.3 灰色系统建模与适用范围 205
10.2 灰色预测模型 207
10.2.1 建立灰色预测模型 208
10.2.2 灰色预测模型实例 209
10.3 灰色聚类分析 211
10.3.1 基于灰色关联度的聚类分析 212
10.3.2 基于灰色白化权函数的聚类方法 216
10.4 灰色综合评价法 220
10.4.1 多层次灰色综合评价方法计算步骤 220
10.4.2 多层次灰色综合评价方法应用案例 222
10.5 小结 226
思考题 226
第11章 基于数据挖掘的知识推理 227
11.1 知识推理的分类 227
11.1.1 非单调推理 227
11.1.2 非确定性推理 227
11.1.3 基于规则的推理 232
11.1.4 基于案例的推理 233
11.2 基于数据挖掘方法的知识推理 234
11.2.1 基于决策树的知识推理 234
11.2.2 基于关联规则的知识推理 239
11.2.3 基于粗糙集的知识推理 239
11.3 小结 240
思考题 240
参考文献 241