第1章 绪论 1
1.1引言 1
1.2数据仓库 2
1.2.1从数据库到数据仓库 4
1.2.2数据仓库的基本概念 6
1.2.3数据仓库的体系结构 7
1.3数据挖掘 8
1.3.1 KDD与数据挖掘 9
1.3.2数据库与数据挖掘发展历程 11
1.3.3数据挖掘的特征与对象 12
1.3.4数据挖掘相关领域 17
1.4数据仓库与数据挖掘的关系 18
1.5应用前景与发展趋势 18
本章小结 19
习题1 20
第2章 联机分析处理 21
2.1引言 21
2.2 OLAP的定义 21
2.3 OLAP的相关概念 22
2.4 OLAP与OLTP的关系和比较 23
2.5 OLAP准则 25
2.6多维数据分析方法 25
2.7关系数据的组织 27
2.8多维数据的存储方式 30
2.9 OLAP体系结构 32
2.10 OLAP的展现方式 34
2.11 OLAP工具的评价指标 35
2.12 OLAP的局限性 36
本章小结 37
习题2 37
第3章 数据仓库的设计与开发 39
3.1引言 39
3.2数据仓库的数据模型概述 39
3.3数据仓库的分析与设计 41
3.3.1需求分析 41
3.3.2概念模型设计 41
3.3.3逻辑模型设计 42
3.3.4物理模型设计 46
3.3.5数据仓库的索引技术 47
3.4数据仓库的开发 49
3.4.1风险因素 49
3.4.2数据仓库系统的生命周期 49
3.4.3建立数据仓库系统的思维模式 52
3.4.4数据仓库数据库的设计步骤 53
3.4.5数据质量与数据清洗 53
3.4.6数据粒度与维度建模 54
3.4.7选择数据仓库工具 55
3.4.8提高数据仓库性能 55
3.4.9数据仓库的安全性 56
3.5主要的数据仓库产品 57
本章小结 58
习题3 58
第4章 关联规则 60
4.1引言 60
4.2关联规则模型 61
4.3 Apriori算法 62
4.3.1发现频繁项集 62
4.3.2生成关联规则 67
4.4频繁模式增长算法 76
4.4.1建树方法 77
4.4.2用FP树挖掘频繁模式 78
4.5关联规则模型扩展 80
4.5.1多级关联规则 81
4.5.2多维关联规则 83
本章小结 86
习题4 86
第5章 粗糙集 88
5.1引言 88
5.2近似空间 89
5.2.1近似空间与不可分辨关系 89
5.2.2知识与知识库 90
5.3近似与粗糙集 91
5.3.1基本概念 91
5.3.2基本性质 93
5.4描述粗糙集的特征的方法 95
5.4.1近似精度 95
5.4.2拓扑特征 96
5.5信息系统 97
5.5.1信息系统的定义 97
5.5.2约简和核 99
5.5.3分辨矩阵与分辨函数 100
5.5.4信息系统约简 101
5.6决策表 103
5.6.1相对约简与知识依赖性 103
5.6.2决策表及其约简 105
5.6.3近似约简算法 110
5.6.4决策规则 111
本章小结 112
习题5 113
第6章 决策树 115
6.1引言 115
6.2构建决策树的理论问题 116
6.2.1为当前结点选择属性 117
6.2.2过拟合问题 120
6.3 ID3算法 123
6.3.1生成决策树的算法 123
6.3.2生成规则和决策 127
6.4决策树的剪枝 129
6.4.1预剪枝 129
6.4.2后剪枝 130
6.5 C4.5算法 133
本章小结 135
习题6 136
第7章 聚类分析 137
7.1引言 137
7.2聚类分析简介 137
7.2.1聚类分析 137
7.2.2聚类分析应用领域与算法特征 137
7.3数据类型、距离和相似系数 140
7.3.1数据类型 140
7.3.2距离和相似系数 141
7.4聚类方法与聚类分类 145
7.4.1聚类方法 145
7.4.2聚类方法的分类 146
7.5划分方法 147
7.5.1 k-均值算法 148
7.5.2 k-中心点算法 149
7.5.3关于参数K 151
7.5.4 EM聚类 152
7.6层次方法 156
7.6.1层次聚类中的距离度量 156
7.6.2分裂方法 157
7.6.3凝聚方法 157
7.7基于密度的方法 158
7.7.1 DBSCAN算法 158
7.7.2矢量感应聚类算法 160
7.8聚类评估 163
7.8.1假设检验 164
7.8.2聚类评估中的假设检验 166
7.8.3相对准则 169
本章小结 169
习题7 169
第8章 兴趣度量 171
8.1引言 171
8.2用于关联规则和分类规则的度量 173
8.2.1客观度量 174
8.2.2主观度量 181
8.2.3语义度量 184
8.3用于总结的度量 186
8.4分类器的兴趣度 189
本章小结 192
习题8 192
第9章 应用案例 194
9.1数据仓库应用案例 194
9.1.1案例一:网络购物数据仓库 194
9.1.2案例二:社会保障卡数据仓库 197
9.1.3案例三:医院信息系统数据仓库 202
9.2数据挖掘应用案例 207
9.2.1案例一:零售商系统货篮数据挖掘 207
9.2.2案例二:通信用户满意度指数评测 212
9.2.3案例三:城市环境质量评价 217
本章小结 220
参考文献 221