《数据仓库与数据挖掘技术 第2版》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:夏火松主编
  • 出 版 社:北京:科学出版社
  • 出版年份:2009
  • ISBN:9787030129345
  • 页数:295 页
图书介绍:本书全面地分析了数据仓库与数据挖掘技术的发展和应用的重要性,介绍数据仓库的基本概念和数据仓库的基本描述方法,分析数据仓库的基本内容,开发数据仓库的基本方法。在建立数据仓库的基础上,介绍数据挖掘技术的研究现状和基本概念,分析数据挖掘的基本规则,介绍有代表性的数据挖掘算法和数据挖掘工具,给出具体应用的规则,特别是对离群数据挖掘模型进行介绍,最后展望数据挖掘的相应研究的前景。

第1章 数据仓库与数据挖掘概述 1

1.1 数据仓库引论 1

1.1.1 为什么要建立数据仓库 1

1.1.2 什么是数据仓库 2

1.1.3 数据仓库的特点 6

1.1.4 数据进入数据仓库的基本过程与建立数据仓库的步骤 10

1.1.5 分析数据仓库的内容 11

1.2 数据挖掘引论 12

1.2.1 为什么要进行数据挖掘 12

1.2.2 什么是数据挖掘 16

1.2.3 数据挖掘的特点 19

1.2.4 数据挖掘的基本过程与步骤 20

1.2.5 分析数据挖掘的内容 24

1.3 数据挖掘与数据仓库的关系 25

1.4 数据仓库与数据挖掘的应用 28

1.4.1 数据挖掘在零售业的应用 28

1.4.2 数据挖掘在商业银行中的应用 33

1.4.3 数据挖掘在电信部门的应用 36

1.4.4 数据挖掘在贝斯出口公司的应用 38

1.4.5 数据挖掘如何预测信用卡欺诈 38

1.4.6 数据挖掘在证券行业的应用 40

思考练习题 40

第2章 数据仓库的分析 42

2.1 数据仓库的需求分析模型 42

2.2 影响数据仓库成功的因素 43

2.3 数据仓库的生命周期 45

2.3.1 数据仓库计划与准备阶段 45

2.3.2 数据仓库的其他阶段 52

2.4 数据仓库的基本体系结构 53

2.5 数据仓库的逻辑结构 56

2.5.1 数据仓库中的粒度 56

2.5.2 数据仓库中的数据分割 57

2.5.3 数据仓库中的数据组织 57

2.5.4 数据仓库中的快照 58

2.5.5 数据仓库中的元数据 58

思考练习题 59

第3章 数据仓库的设计与实施 60

3.1 设计科学与数据仓库的设计 60

3.2 从数据库到数据仓库 61

3.3 面向主题的数据仓库设计 62

3.3.1 数据建模 62

3.3.2 星型连接 63

3.3.3 数据仓库的数据模型设计 70

3.4 开发数据仓库的物理设计 72

3.4.1 数据仓库设计工具的选择 72

3.4.2 物理数据模型设计 73

3.4.3 数据仓库中数据表的数量与规范化 74

3.5 数据仓库的实施 74

3.5.1 数据仓库的实施应注意的问题 74

3.5.2 在实施数据仓库过程中应避免的错误 75

3.5.3 数据仓库项目实施成功的要诀 77

思考练习题 81

第4章 信息分析的基本技术 83

4.1 自动信息分析的基本技术 83

4.1.1 智能代理 83

4.1.2 群体智能 85

4.1.3 小波分析 88

4.1.4 分形技术分析 91

4.2 联机分析 91

4.2.1 联机分析OLAP的基本术语 93

4.2.2 OLAP体系结构和处理的特性 94

4.2.3 OLAP多维数据结构与OLAP的分类 94

4.2.4 OLAP的多维数据分析方法 95

4.2.5 OLAP评价准则 97

4.2.6 OLAP的发展与流行的OLAP工具选择 100

4.3 Rough的信息分析技术 101

4.3.1 粗糙集理论的基本概念和理论基础 102

4.3.2 粗糙集在信息分析中的特征表示 103

思考练习题 105

第5章 数据挖掘过程 106

5.1 数据挖掘的方法与基本流程 106

5.1.1 SEMMA方法 106

5.1.2 数据挖掘的基本流程 107

5.2 确定主题和定义数据挖掘任务 108

5.2.1 确定主题 109

5.2.2 定义数据挖掘任务 110

5.3 数据预处理 111

5.3.1 数据的收集和准备 111

5.3.2 数据清理 112

5.3.3 数据集成 113

5.3.4 数据变换 114

5.3.5 数据归约 115

5.3.6 微软数据转换服务 115

5.4 数据挖掘的模型建立与理解 116

5.4.1 关于模型的准确性 118

5.4.2 关于模型的可理解性 118

5.4.3 关于模型的性能 119

5.4.4 描述和可视化 119

5.4.5 验证与评估 120

5.5 数据挖掘中常见的一些问题 122

5.5.1 商业用户提出的问题 122

5.5.2 技术问题 122

5.5.3 数据挖掘应用问题 122

5.5.4 实施数据挖掘项目考虑的问题 123

5.5.5 数据挖掘对社会的影响——有关隐私问题 123

5.6 事先无法预测的有价值知识 124

思考练习题 124

第6章 数据挖掘基本算法 125

6.1 分类规则挖掘 125

6.1.1 分类与估值 125

6.1.2 决策树 128

6.1.3 贝叶斯分类 135

6.2 预测分析与趋势分析规则 139

6.2.1 预言的基本方法 139

6.2.2 定量分析预测 140

6.2.3 预测的结果分析 142

6.2.4 趋势分析挖掘 143

6.3 数据挖掘的关联算法 144

6.3.1 关联规则的概念及分类 144

6.3.2 简单形式的关联规则算法(单维、单层和布尔关联规则) 148

6.3.3 多层和多维关联规则的挖掘 152

6.3.4 货篮子分析存在的问题 155

6.3.5 关联分析的其他算法 157

6.3.6 挖掘序列模式 160

6.4 数据挖掘的聚类算法 164

6.4.1 聚类分析的概念与分类 166

6.4.2 聚类分析中两个对象之间的相异度计算方法 171

6.4.3 划分方法 177

6.4.4 层次方法 181

6.4.5 基于密度的方法 186

6.4.6 基于网格的方法 188

6.4.7 基于模型的聚类方法 191

6.4.8 模糊聚类算法 192

6.5 数据挖掘的统计分析算法 193

6.5.1 辨别分析 193

6.5.2 回归建模 193

6.5.3 优点和缺点 194

6.6 数据挖掘的品种优化算法 194

6.6.1 品种优化 194

6.6.2 品种优化的算法 196

6.7 数据挖掘的进化算法 199

6.7.1 遗传算法 199

6.7.2 数据挖掘的神经网络算法 200

思考练习题 204

第7章 非结构化数据挖掘 206

7.1 文本挖掘 206

7.1.1 文本挖掘的一般过程与应用 207

7.1.2 文本表示与预处理 208

7.1.3 文本分类方法与文本聚类方法 212

7.1.4 自动摘要方法 213

7.2 Web数据挖掘 213

7.2.1 非结构化Web数据源 214

7.2.2 Web挖掘分类 219

7.2.3 Web内容挖掘 221

7.2.4 Web结构挖掘 222

7.2.5 Web访问挖掘 222

7.2.6 利用Web日志的聚类算法 225

7.2.7 电子商务中的Web挖掘 227

7.3 空间群数据挖掘 230

7.3.1 空间数据挖掘的概念 230

7.3.2 空间数据挖掘的分类 231

7.3.3 空间数据挖掘的体系结构 232

7.4 多媒体数据挖掘 232

7.4.1 多媒体数据挖掘的概念 232

7.4.2 多媒体数据挖掘的分类 233

7.4.3 多媒体数据挖掘的体系结构 233

思考练习题 234

第8章 离群数据挖掘 235

8.1 离群数据挖掘的概念 235

8.2 离群数据挖掘的分类 236

8.3 离群数据挖掘的算法 237

8.3.1 基于统计的方法 237

8.3.2 基于距离的离群数据方法 239

8.3.3 基于偏离的离群数据挖掘 241

8.3.4 高维数据的离群数据挖掘 243

8.3.5 基于小波的离群数据挖掘 244

8.4 市场营销离群数据挖掘 247

8.4.1 市场营销离群数据的特点 247

8.4.2 基于分形的市场营销离群数据挖掘模型 248

思考练习题 250

第9章 数据挖掘语言与工具的选择 251

9.1 数据挖掘语言及其标准化 251

9.1.1 数据挖掘语言的分类 251

9.1.2 分析与评价 257

9.2 数据挖掘的研究热点 257

9.3 数据挖掘工具的选择 258

9.3.1 评价数据挖掘工具的优劣指标 259

9.3.2 通用数据挖掘产品与工具 260

9.3.3 国内的数据挖掘产品与工具 273

9.3.4 数据可视化工具的选择 275

9.3.5 数据挖掘网站与可获得的数据挖掘算法源代码 276

思考练习题 278

第10章 知识管理与知识管理系统 279

10.1 知识管理 279

10.1.1 知识 279

10.1.2 知识管理的定义 280

10.1.3 有效的知识管理 281

10.2 知识管理系统 284

10.2.1 知识管理共享的条件 285

10.2.2 知识管理共享的困难 285

10.2.3 知识管理的激励机制 286

10.2.4 知识管理的体系结构 289

思考练习题 291

附录 数据挖掘产品部分信息 292

参考文献 294