第1章 概论 1
1.1决策支持技术与数据库的发展 2
1.1.1决策支持技术的发展 2
1.1.2数据库技术的发展 4
1.2数据仓库概述 7
1.2.1数据仓库概念的提出 8
1.2.2数据仓库的定义 10
1.2.3数据仓库的特征 11
1.2.4数据仓库的应用和发展 13
1.3 数据挖掘概述 18
1.3.1数据挖掘的定义 19
1.3.2数据挖掘与数据仓库的关系 21
1.3.3数据挖掘的应用和发展 22
本章小结 27
习题 27
第2章 数据仓库的技术与开发 29
2.1数据仓库的体系结构 30
2.1.1 用户眼中的数据仓库结构 30
2.1.2数据仓库系统的体系结构 31
2.1.3数据集市 35
2.2元数据 36
2.2.1元数据的定义 36
2.2.3元数据分类 37
2.2.2元数据的主要作用 37
2.3数据仓库的数据模型 39
2.3.1概念模型 39
2.3.2逻辑模型 43
2.3.3物理模型 45
2.4粒度和分割 46
2.4.1粒度的确定 46
2.4.2粒度划分实例 47
2.4.3数据分割 49
2.5数据仓库和开发流程 50
2.6.1统一的维 52
2.6.2统一的事实 52
2.6总线型结构的数据仓库 52
2.6.3数据仓库总线 53
本章小结 54
习题 54
第3章 数据仓库管理技术 55
3.1数据仓库管理的基本内容 56
3.2休眠数据管理 57
3.2.1休眠数据的定义与理解 58
3.2.2休眠数据的处理 60
3.3元数据的管理 62
3.3.1传统的元数据管理方法 63
3.3.2企业级中心知识库的管理方法 63
3.4.1脏数据的来源和清理 65
3.4数据清理 65
3.4.2过期数据的清理 67
本章小结 67
习题 68
第4章 联机分析处理 69
4.1概述 70
4.1.1 OLAP的定义 70
4.1.2 OLAP的基本概念 72
4.1.3 OLAP的基本分析操作 75
4.1.4 OLAP和OLTP的比较 78
4.2 多维OLAP和关系OLAP 79
4.2.1数据存储 79
4.2.2 MOLAP和ROLAP的特征 83
4.2.3星型模式 84
4.3 OLAP的新发展——OLAM 86
4.3.1OLAM应该具有的功能特征 87
4.3.2OLAM的主要发展方向 87
4.3.3基于 Web的OLAM须解决的问题 88
本章小结 88
习题 88
第5章 SQLServer数据仓库的应用与开发 89
5.1概述 90
5.2连接数据源 92
5.3.2建立数据源 94
5.3建多维数据集 94
5.3.1建立数据库 94
5.3.3建立多维数据集 96
5.3.4编辑多维数据集 107
5.3.5设计存储和处理多维数据集 108
5.4浏览多维数据集数据 109
5.5创建、使用数据挖掘模型 112
本章小结 126
习题 126
第6章 数据挖掘与知识发现 127
6.1知识发现与数据挖掘的概念 128
6.1.1数据挖掘的任务 131
6.1.2数据挖掘的分类 133
6.1.3数据挖掘的对象 137
6.1.4数据挖掘与专家系统的区别 139
6.2数据挖掘方法与技术 140
6.2.1归纳学习方法 141
6.2.2仿生物技术 142
6.2.3公式发现 144
6.2.4统计分析方法 145
6.2.5模糊数学方法 147
6.2.6可视化技术 148
6.3数据挖掘的知识表示 148
6.3.2决策树 149
6.3.1规则 149
6.3.3知识基(浓缩数据) 150
6.3.4网络权值 151
6.3.5公式 151
本章小结 152
习题 152
第7章 统计类数据挖掘技术 153
7.1基本概念 154
7.1.7统计学 154
7.1.2统计类数据挖掘技术 155
7.2最简单的统计类挖掘技术 155
7.3回归分析数据挖掘技术 156
7.2.1聚集函数与度量 156
7.2.2柱状图 156
7.3.1线性回归数据挖掘技术 157
7.3.2非线性回归数据挖掘技术 159
7.4聚类分析与最近邻挖掘技术 163
7.4.1聚类的概念 163
7.4.2最近邻技术 164
7.4.3聚类分析与最近邻技术的运用 165
7.4.4聚类分析应用示例 172
7.5统计分析工具及其使用——SPSS 174
7.5.1统计分析工具 174
7.5.2统计分析工具应用 178
7.5.3 SPSS及其应用 182
本章小结 185
习题 186
第8章 知识类数据挖掘技术 187
8.1知识发现系统的结构 188
8.2关联规则的数据挖掘技术 190
8.2.1关联规则描述 191
8.2.2关联规则的定义 192
8.2.3关联规则的种类 192
8.2.4关联规则挖掘算法——频繁集方法 193
8.2.5关联规则应用举例 195
8.3神经网络的数据挖掘技术 197
8.3.1人工神经元及其互连结构 198
8.3.2神经网络模型 202
8.3.3神经网络的应用 208
8.4遗传算法的数据挖掘技术 209
8.4.1遗传算法概述 210
8.4.2遗传算子 212
8.4.3遗传算法的应用 217
8.5粗糙集的数据挖掘技术 219
8.5.1粗糙集概念 220
8.5.2粗糙集分类规则发现模式 223
8.5.3粗糙集的应用 224
8.6.1知识发现工具的系统结构 225
8.6知识发现工具简介 225
8.6.2知识发现工具运用中的问题 227
8.6.3知识发现的作用 230
8.6.4知识类数据挖掘工具简介 230
本章小结 232
习题 233
第9章 21世纪的数据挖掘技术 235
9.1文本挖掘技术 236
9.1.1文本挖掘的概述 236
9.1.2信息检索系统 237
9.1.3文本挖掘 239
9.2.1 Web的特点 241
9.2 Web数据挖掘技术 241
9.2.2 Web结构挖掘 242
9.2.3 Web内容挖掘 243
9.2.4 Web日志挖掘 244
9.3可视化数据挖掘技术 245
9.3.1数据可视化技术 245
9.3.2可视化数据挖掘技术的应用 246
9.4基于GIS的空间数据挖掘技术 247
9.4.1地理信息系统 247
9.4.2空间数据挖掘 249
9.5分布式数据挖掘技术 251
9.5.1概述 251
9.5.2适合水平式数据划分的分布式挖掘方法 252
9.5.3适合垂直式数据划分的分布式挖掘方法 253
9.6数据挖掘的其他主题 254
9.6.1视频和音频数据挖掘 254
9.6.2科学和统计数据挖掘 255
9.6.3数据挖掘的理论基础 256
9.6.4数据挖掘和智能查询应答 257
本章小结 259
习题 259
第10章 数据仓库与数据挖掘的综合应用 261
10.1数据仓库在信息管理中的实际应用 262
10.1.1应用数据仓库弥补ERP的不足 264
10.1.2 建立良好的客户关系——数据仓库实现分析型CRM 266
10.1.3数据仓库提高供应链管理的效率 267
10.1.4用数据仓库支持企业决策 269
10.1.5数据仓库促使企业重构业务过程 271
10.2金融业中的数据挖掘 272
10.2.1数据挖掘在银行领域的应用 273
10.2.2数据挖掘在证券领域的应用 275
10.2.3数据挖掘在保险领域的应用 279
10.3零售业中的数据挖掘 280
10.4电信业中的数据挖掘 283
本章小结 288
习题 288
参考文献 289