《数据仓库与数据挖掘》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:周根贵主编
  • 出 版 社:杭州:浙江大学出版社
  • 出版年份:2004
  • ISBN:7308038319
  • 页数:292 页
图书介绍:本书介绍了数据仓库与数据挖掘的基本概念、基本方法和基本技术,以及数据仓库与数据挖掘的应用领域与最新进展。

第1章 概论 1

1.1决策支持技术与数据库的发展 2

1.1.1决策支持技术的发展 2

1.1.2数据库技术的发展 4

1.2数据仓库概述 7

1.2.1数据仓库概念的提出 8

1.2.2数据仓库的定义 10

1.2.3数据仓库的特征 11

1.2.4数据仓库的应用和发展 13

1.3 数据挖掘概述 18

1.3.1数据挖掘的定义 19

1.3.2数据挖掘与数据仓库的关系 21

1.3.3数据挖掘的应用和发展 22

本章小结 27

习题 27

第2章 数据仓库的技术与开发 29

2.1数据仓库的体系结构 30

2.1.1 用户眼中的数据仓库结构 30

2.1.2数据仓库系统的体系结构 31

2.1.3数据集市 35

2.2元数据 36

2.2.1元数据的定义 36

2.2.3元数据分类 37

2.2.2元数据的主要作用 37

2.3数据仓库的数据模型 39

2.3.1概念模型 39

2.3.2逻辑模型 43

2.3.3物理模型 45

2.4粒度和分割 46

2.4.1粒度的确定 46

2.4.2粒度划分实例 47

2.4.3数据分割 49

2.5数据仓库和开发流程 50

2.6.1统一的维 52

2.6.2统一的事实 52

2.6总线型结构的数据仓库 52

2.6.3数据仓库总线 53

本章小结 54

习题 54

第3章 数据仓库管理技术 55

3.1数据仓库管理的基本内容 56

3.2休眠数据管理 57

3.2.1休眠数据的定义与理解 58

3.2.2休眠数据的处理 60

3.3元数据的管理 62

3.3.1传统的元数据管理方法 63

3.3.2企业级中心知识库的管理方法 63

3.4.1脏数据的来源和清理 65

3.4数据清理 65

3.4.2过期数据的清理 67

本章小结 67

习题 68

第4章 联机分析处理 69

4.1概述 70

4.1.1 OLAP的定义 70

4.1.2 OLAP的基本概念 72

4.1.3 OLAP的基本分析操作 75

4.1.4 OLAP和OLTP的比较 78

4.2 多维OLAP和关系OLAP 79

4.2.1数据存储 79

4.2.2 MOLAP和ROLAP的特征 83

4.2.3星型模式 84

4.3 OLAP的新发展——OLAM 86

4.3.1OLAM应该具有的功能特征 87

4.3.2OLAM的主要发展方向 87

4.3.3基于 Web的OLAM须解决的问题 88

本章小结 88

习题 88

第5章 SQLServer数据仓库的应用与开发 89

5.1概述 90

5.2连接数据源 92

5.3.2建立数据源 94

5.3建多维数据集 94

5.3.1建立数据库 94

5.3.3建立多维数据集 96

5.3.4编辑多维数据集 107

5.3.5设计存储和处理多维数据集 108

5.4浏览多维数据集数据 109

5.5创建、使用数据挖掘模型 112

本章小结 126

习题 126

第6章 数据挖掘与知识发现 127

6.1知识发现与数据挖掘的概念 128

6.1.1数据挖掘的任务 131

6.1.2数据挖掘的分类 133

6.1.3数据挖掘的对象 137

6.1.4数据挖掘与专家系统的区别 139

6.2数据挖掘方法与技术 140

6.2.1归纳学习方法 141

6.2.2仿生物技术 142

6.2.3公式发现 144

6.2.4统计分析方法 145

6.2.5模糊数学方法 147

6.2.6可视化技术 148

6.3数据挖掘的知识表示 148

6.3.2决策树 149

6.3.1规则 149

6.3.3知识基(浓缩数据) 150

6.3.4网络权值 151

6.3.5公式 151

本章小结 152

习题 152

第7章 统计类数据挖掘技术 153

7.1基本概念 154

7.1.7统计学 154

7.1.2统计类数据挖掘技术 155

7.2最简单的统计类挖掘技术 155

7.3回归分析数据挖掘技术 156

7.2.1聚集函数与度量 156

7.2.2柱状图 156

7.3.1线性回归数据挖掘技术 157

7.3.2非线性回归数据挖掘技术 159

7.4聚类分析与最近邻挖掘技术 163

7.4.1聚类的概念 163

7.4.2最近邻技术 164

7.4.3聚类分析与最近邻技术的运用 165

7.4.4聚类分析应用示例 172

7.5统计分析工具及其使用——SPSS 174

7.5.1统计分析工具 174

7.5.2统计分析工具应用 178

7.5.3 SPSS及其应用 182

本章小结 185

习题 186

第8章 知识类数据挖掘技术 187

8.1知识发现系统的结构 188

8.2关联规则的数据挖掘技术 190

8.2.1关联规则描述 191

8.2.2关联规则的定义 192

8.2.3关联规则的种类 192

8.2.4关联规则挖掘算法——频繁集方法 193

8.2.5关联规则应用举例 195

8.3神经网络的数据挖掘技术 197

8.3.1人工神经元及其互连结构 198

8.3.2神经网络模型 202

8.3.3神经网络的应用 208

8.4遗传算法的数据挖掘技术 209

8.4.1遗传算法概述 210

8.4.2遗传算子 212

8.4.3遗传算法的应用 217

8.5粗糙集的数据挖掘技术 219

8.5.1粗糙集概念 220

8.5.2粗糙集分类规则发现模式 223

8.5.3粗糙集的应用 224

8.6.1知识发现工具的系统结构 225

8.6知识发现工具简介 225

8.6.2知识发现工具运用中的问题 227

8.6.3知识发现的作用 230

8.6.4知识类数据挖掘工具简介 230

本章小结 232

习题 233

第9章 21世纪的数据挖掘技术 235

9.1文本挖掘技术 236

9.1.1文本挖掘的概述 236

9.1.2信息检索系统 237

9.1.3文本挖掘 239

9.2.1 Web的特点 241

9.2 Web数据挖掘技术 241

9.2.2 Web结构挖掘 242

9.2.3 Web内容挖掘 243

9.2.4 Web日志挖掘 244

9.3可视化数据挖掘技术 245

9.3.1数据可视化技术 245

9.3.2可视化数据挖掘技术的应用 246

9.4基于GIS的空间数据挖掘技术 247

9.4.1地理信息系统 247

9.4.2空间数据挖掘 249

9.5分布式数据挖掘技术 251

9.5.1概述 251

9.5.2适合水平式数据划分的分布式挖掘方法 252

9.5.3适合垂直式数据划分的分布式挖掘方法 253

9.6数据挖掘的其他主题 254

9.6.1视频和音频数据挖掘 254

9.6.2科学和统计数据挖掘 255

9.6.3数据挖掘的理论基础 256

9.6.4数据挖掘和智能查询应答 257

本章小结 259

习题 259

第10章 数据仓库与数据挖掘的综合应用 261

10.1数据仓库在信息管理中的实际应用 262

10.1.1应用数据仓库弥补ERP的不足 264

10.1.2 建立良好的客户关系——数据仓库实现分析型CRM 266

10.1.3数据仓库提高供应链管理的效率 267

10.1.4用数据仓库支持企业决策 269

10.1.5数据仓库促使企业重构业务过程 271

10.2金融业中的数据挖掘 272

10.2.1数据挖掘在银行领域的应用 273

10.2.2数据挖掘在证券领域的应用 275

10.2.3数据挖掘在保险领域的应用 279

10.3零售业中的数据挖掘 280

10.4电信业中的数据挖掘 283

本章小结 288

习题 288

参考文献 289