第一篇数据仓库 3
第1章数据仓库基础 3
1.1引言 3
1.1.1演变过程 3
1.1.2定义 5
1.2体系结构 6
1.2.1两层的体系结构 6
1.2.2三层的体系结构 8
1.3组成 9
1.4元数据 14
1.4.1定义和分类 14
1.4.2标准化 15
1.4.3CWM 16
1.4.4UML、MOF和XMI与CWM的关系 20
1.5数据粒度 22
1.6数据模型 23
1.7ETL 23
1.7.1主要流程 24
1.7.2数据抽取 24
1.7.3数据转换 26
1.7.4数据加载 27
第2章数据仓库设计和实现 29
2.1数据仓库设计 29
2.1.1设计方法 31
2.1.2体系结构设计 32
2.1.3数据模型设计 34
2.2ETL设计 52
2.3数据仓库实现 58
第3章数据仓库实例 62
3.1实例一 62
3.1.1选择主题 62
3.1.2逻辑模型设计 63
3.1.3物理模型设计 70
3.1.4ETL设计 71
3.2实例二 75
3.2.1总体结构设计 75
3.2.2概念模型设计 77
3.2.3逻辑模型设计 77
3.2.4物理模型设计 84
3.2.5数据清洗设计 86
3.2.6ETL设计 86
第4章OLAP和OLAM 93
4.1OLAP 93
4.2OLAM 97
4.2.1体系结构 98
4.2.2特点 99
4.2.3基于Web的OLAM 100
第二篇数据挖掘 106
第5章数据挖掘基础 105
5.1概述 105
5.1.1定义 105
5.1.2功能 108
5.1.3模型 109
5.1.4展望 115
5.2实现 117
5.3工具 118
5.3.1概述 118
5.3.2比较 120
第6章聚类分析 123
6.1硬聚类 124
6.1.1算法种类 124
6.1.2相似度计算 127
6.1.3实现方法 129
6.1.4主要算法 130
6.2模糊聚类 143
6.2.1概述 143
6.2.2主要算法 146
6.3评价 150
第7章分类和预测 155
7.1神经网络 156
7.2决策树 160
7.3实现过程 165
第8章关联分析 167
8.1概述 167
8.2Apriori 170
8.3FPGrowth 173
第9章Web挖掘 176
9.1概述 177
9.1.1定义 177
9.1.2自然语言理解 180
9.1.3Web挖掘过程 190
9.2Web文档抽取和表示 192
9.2.1Web文档抽取 192
9.2.2Web文档表示 192
9.3特征提取 194
9.4Web聚类 196
9.5Web分类 198
9.5.1朴素贝叶斯 199
9.5.2其他方法 201
9.5.3评价 201
第10章数据挖掘实例 203
10.1TOM和eTOM 203
10.2客户细分 210
10.2.1客户生命周期 211
10.2.2客户价值 212
10.2.3数据准备 214
10.2.4分析过程 215
10.2.5结果 220
10.3重入网识别 222
10.3.1定义 222
10.3.2数据准备 222
10.3.3分析过程 230
10.3.4结果 232
10.4WAP日志挖掘 232
10.4.1定义 233
10.4.2数据准备 234
10.4.3分析过程 238
10.4.4结果 239
第三篇语义网和本体 243
第11章知识 243
11.1概述 243
11.2知识分类 247
11.3知识表示 248
11.3.1知识表示观 249
11.3.2知识表示方法 251
11.4知识管理 256
11.4.1概述 256
11.4.2知识管理与信息管理的关系 257
11.4.3核心技术 258
第12章语义网和本体 261
12.1语义网 261
12.1.1概述 261
12.1.2层次结构 265
12.1.3元数据 267
12.1.4核心技术 269
12.1.5开发工具Jena 272
12.1.6Web 30272
12.2本体 274
12.2.1哲学本源 274
12.2.2定义 275
12.2.3建模 275
12.2.4分类 276
12.2.5构建方法 276
12.2.6描述语言 279
12.2.7实例 281
参考文献 288