第1章数据仓库与数据挖掘概述 1
1.1数据仓库概念 1
1.1.1 数据仓库的兴起 1
1.1.2 数据仓库的特点 2
1.1.3数据集市 3
1.2知识发现和数据挖掘概念 4
1.2.1 知识发现和数据挖掘的定义 4
1.2.2 数据挖掘任务 5
1.2.3 数据挖掘分类 7
1.2.4 数据挖掘对象 8
1.2.5 数据挖掘的知识表示 10
1.3 数据挖掘方法和技术 13
1.3.1 归纳学习方法 13
1.3.2 仿生物技术 14
1.3.3 公式发现 15
1.3.4 统计分析方法 15
1.3.5 模糊数学方法 16
1.3.6 可视化技术 16
1.4数据仓库和数据挖掘的发展 16
1.4.1 数据仓库和数据挖掘的结合 16
1.4.2 新决策支持系统和综合决策支持系统 18
1.4.3 商业智能和知识管理 19
习题1 20
第2章数据仓库系统 22
2.1数据仓库组织结构 22
2.1.1 数据仓库结构 22
2.1.2 数据仓库系统结构 23
2.1.3 数据仓库的运行结构 24
2.1.4数据集市结构 25
2.2数据仓库存储的数据模型 26
2.2.1 星型模型 27
2.2.2 雪花模型 28
2.2.3 星网模型 28
2.3元数据 28
2.3.1 元数据概念 28
2.3.2 关于数据源的元数据 29
2.3.3 关于数据模型的元数据 30
2.3.4 关于数据仓库映射的元数据 30
2.3.5 关于数据仓库使用的元数据 32
习题2 32
第3章数据仓库的数据获取与管理 33
3.1数据仓库的数据获取 33
3.1.1 数据质量 33
3.1.2 数据变换 34
3.1.3 数据清理 35
3.1.4 数据集成 35
3.1.5 聚集和概括 36
3.1.6装载数据 37
3.2数据管理 37
3.2.1数据管理概述 37
3.2.2脏数据的产生和清理 39
3.2.3 休眠数据 39
3.2.4元数据管理 40
3.3系统管理 41
3.3.1 服务水平 42
3.3.2 性能监控 43
3.3.3存储器管理 46
3.3.4 网络管理 47
3.3.5 安全管理 47
习题3 48
第4章数据仓库的设计、开发与应用 50
4.1数据仓库设计 50
4.1.1 “数据驱动”的系统设计方法 50
4.1.2概念模型设计 51
4.1.3逻辑模型设计 52
4.1.4 物理模型设计 54
4.2多维表设计 55
4.2.1 主题与多维表 55
4.2.2 多维表设计步骤 55
4.2.3 多维表设计示例 56
4.3数据仓库的查询与索引技术 58
4.3.1数据仓库查询 58
4.3.2位索引技术 59
4.3.3 标识技术 61
4.3.4 广义索引 63
4.4数据仓库开发 64
4.4.1 数据仓库规划 64
4.4.2定义体系结构 64
4.4.3数据仓库设计 65
4.4.4 源系统分析与数据变换设计 66
4.4.5建立数据仓库 67
4.4.6用户访问方法的设计和开发 67
4.5数据仓库发展阶段与应用实例 68
4.5.1 数据仓库的5个发展阶段 68
4.5.2 数据仓库的应用实例 71
习题4 77
第5章联机分析处理 78
5.1 OLAP概念 78
5.1.1 OLAP的定义 78
5.1.2 OLAP准则 79
5.1.3 OLAP的基本概念 82
5.1.4 OLAP与OLTP的关系与比较 83
5.2 OLAP的数据组织 84
5.2.1 关系数据组织ROLAP 85
5.2.2 多维数据组织MOLAP 85
5.2.3 两种数据组织的比较 85
5.3 OLAP的多维数据分析 86
5.3.1 基本功能 86
5.3.2广OLAP功能 88
5.3.3 OLAP实例 89
5.4 OLAP的体系结构 90
5.4.1 OLAP的多层结构 90
5.4.2 OLAP的Web结构 91
5.5 OLAP 工具及评价 94
5.5.1 Oracle OLAP 工具 94
5.5.2 OLAP工具评价指标 98
习题5 100
第6章文本数据挖掘与Web挖掘 101
6.1文本数据挖掘概述 101
6.1.1 文本挖掘出现 101
6.1.2 文本挖掘的基本概念 101
6.1.3 文本挖掘与信息检索 102
6.2文本特征表示与提取 103
6.2.1 文本特征的表示 103
6.2.2文本的特征提取 104
6.3文本挖掘 105
6.3.1 文本分类 105
6.3.2关联分析 106
6.3.3文档聚类 106
6.4 Web挖掘 107
6.4.1Web信息的特点 107
6.4.2 Web挖掘分类 108
6.4.3 Web结构的挖掘 109
6.4.4 Web使用记录的挖掘 110
习题6 112
第7章决策树方法 113
7.1决策树方法综述 113
7.1.1 决策树概念 113
7.1.2信息论原理 113
7.2 ID3方法 117
7.2.1 ID3基本思想 117
7.2.2 ID3算法 118
7.2.3 实例计算 119
7.2.4对ID3的讨论 120
7.3 C4.5方法 121
7.3.1构造决策树 121
7.3.2连续属性的处理 122
7.3.3决策树剪枝 123
7.3.4 从决策树抽取规则 123
7.4 IBLE方法 125
7.4.1 IBLE算法 125
7.4.2简例和实例 129
习题7 135
第8章粗糙集方法与关联规则挖掘 137
8.1粗糙集理论 137
8.1.1粗糙集概念 137
8.1.2 最小属性集 138
8.2粗糙集的规则获取与应用 139
8.2.1 获取规则 139
8.2.2 应用实例 140
8.3关联规则挖掘算法 143
8.3.1 关联规则的挖掘原理 143
8.3.2 关联规则的种类 145
8.3.3 关联规则价值的衡量方法 146
8.4关联规则挖掘算法 147
8.4.1 Apriori算法 147
8.4.2 示例 149
8.5基于FP-tree的关联规则挖掘算法 150
8.5.1算法描述 150
8.5.2 示例说明 151
习题8 151
第9章公式发现 153
9.1机器发现概述 153
9.2 BACON系统 154
9.2.1 BACON系统简介 154
9.2.2 BACON系统的应用 155
9.3 FDD公式发现算法 156
9.3.1 FDD.1 156
9.3.2 FDD.2 163
9.3.3 FDD.3 167
习题9 172
第10章神经网络与遗传算法 173
10.1神经网络的概念及几何意义 173
10.1.1 神经网络概念 173
10.1.2 神经网络的几何意义 174
10.2反向传播模型(BP) 176
10.2.1 BP网络结构 176
10.2.2 BP网络学习公式推导 177
10.2.3实例分析 180
10.3 超曲面神经网络 183
10.3.1 超曲面神经网络概念 183
10.3.2超圆神经元模型CC 183
10.4遗传算法原理 190
10.4.1 遗传算法处理流程 191
10.4.2 遗传算子 192
10.4.3遗传算法的特点 196
10.5基于遗传的分类学习系统 197
10.5.1概述 197
10.5.2 遗传分类学习系统GCLS的基本原理 197
10.5.3 遗传分类器学习系统GCLS的应用 201
习题10 202
第11章基于案例推理 204
11.1基于案例推理(CBR)的概念与原理 204
11.1.1 CBR概念 204
11.1.2 CBR的一般过程 204
11.2案例表示和案例库 206
11.2.1案例表示 206
11.2.2案例库 208
11.3案例检索与相似匹配 209
11.3.1案例检索 209
11.3.2 案例相似匹配 210
11.4专家系统原理与CBR的比较 211
11.4.1 专家系统(ES)原理 211
11.4.2 ES与CBR的比较 213
11.4.3 ES与CBR的结合 213
11.5医疗事故辅助鉴定与管理系统实例 214
11.5.1 系统综述 214
11.5.2 医疗事故鉴定专家系统 215
11.5.3 基于案例推理(CBR)的医疗事故鉴定 216
习题11 217
第12章决策支持系统与商业智能 218
12.1传统决策支持系统 218
12.1.1 传统决策支持系统概念 218
12.1.2传统决策支持系统的进展 219
12.1.3传统决策支持系统的关键技术和开发的困难 220
12.2基于数据仓库、联机分析处理和数据挖掘的新决策支持系统 221
12.2.1新决策支持系统 221
12.2.2新决策支持系统实例 222
12.3综合决策支持系统 224
12.3.1 传统决策支持系统与新决策支持系统的比较 224
12.3.2 综合决策支持系统结构和原理 225
12.4商业智能和知识管理 227
12.4.1商业智能 227
12.4.2知识管理 235
12.4.3 商业智能是知识管理的基础 244
12.5小结 247
习题12 248
参考文献 249