《数据仓库与数据挖掘技术》PDF下载

  • 购买积分:14 如何计算积分?
  • 作  者:陈京民等编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2002
  • ISBN:7505379283
  • 页数:404 页
图书介绍:

第1章 数据仓库导论 1

1.1 数据仓库的发展及展望 2

1.1.1 从传统数据库到数据仓库 2

1.1.2 数据仓库的定义与基本特性 5

1.1.3 数据仓库的几个重要概念 8

1.1.4 数据仓库的未来发展 10

1.2 数据仓库的应用 12

1.2.1 数据仓库的两类用户——信息的使用者与知识的挖掘者 12

1.2.3 知识挖掘者的数据仓库应用 13

1.2.2 信息使用者的数据仓库应用 13

1.3 数据仓库总体结构 15

1.3.1 数据仓库的总体参考框架 16

1.3.2 数据仓库基本功能层 16

1.3.3 数据仓库的管理层 24

1.3.4 数据仓库的元数据管理层 25

1.3.5 数据仓库的环境支持层 26

1.4 数据仓库技术 28

本章小结 31

习题 31

第2章 Oracle的数据仓库设计与使用 33

2.1.1 Oracle数据仓库的技术基础工具 34

2.1 Oracle数据仓库开发工具简介 34

2.1.2 Oracle数据仓库的分析应用工具 35

2.1.3 Oracle数据仓库创建工具 36

2.1.4 Oracle数据仓库维护工具 36

2.2 Oracle数据仓库创建 36

2.2.1 Oracle数据仓库的创建 36

2.2.2 Oracle数据仓库表空间的创建 43

2.2.3 Oracle数据仓库表的创建 48

2.3.1 Oracle数据仓库的维创建 56

2.3 Oracle数据仓库的维与立方创建 56

2.3.2 Oracle数据仓库的立方创建 62

2.4 Oracle数据仓库的应用工具简介 67

2.4.1 Oracle数据仓库的OLAP应用 67

2.4.2 Oracle数据仓库的数据挖掘应用 68

本章小结 70

习题 71

第3章 SQL Server的数据仓库设计与使用 73

3.1 SQL Server数据仓库开发工具及应用 74

3.2.1 创建数据库 76

3.2 SQL Server的数据仓库创建 76

3.2.2 创建表 77

3.3 SQL Server中的数据仓库访问与操纵 79

3.3.1 Analysis Manager数据库的创建与数据源的确定 79

3.3.2 用Analysis Services创建维 82

3.3.3 用Analysis Services创建多维数据集 86

3.3.4 用查询分析器(Transact-SQL)访问数据仓库 92

3.3.5 用Microsoft English Query操纵数据仓库 92

3.4.1 SQL Server的数据复制工具与应用 95

3.4 SQL Server中的数据提取与加载 95

3.4.2 DTS的数据导出工具(DTS Export Wizard) 98

3.4.3 DTS的数据导入工具(DTS Import Wizard) 101

3.4.4 DTS的数据转换 103

3.5 SQL Server中的数据挖掘工具与应用 104

3.5.1 SQL Server中的数据挖掘工具 104

3.5.2 决策类数据挖掘工具的应用 105

3.5.3 聚类分析的数据挖掘工具应用 110

本章小结 113

习题 114

第4章 Delphi中的数据仓库设计与使用 115

4.1 Delphi 简介 116

4.1.1 Delphi的开发集成环境组成 116

4.1.2 Delphi的菜单栏与应用 117

4.1.3 Delphi的工具栏与应用 117

4.1.4 Delphi的组件板与应用 117

4.1.5 Delphi的对象检查器与应用 118

4.1.6 Delphi的窗体与应用 118

4.1.7 Delphi的代码编辑器与应用 118

4.1.8 Delphi应用程序的设计过程 119

4.2 Delphi中的数据仓库组件 121

4.3 DecisionQuery组件 122

4.3.1 DecisionQuery组件的主要属性 122

4.3.2 DecisionQuery组件的主要方法 124

4.3.3 DecisionQuery组件的主要事件 124

4.3.4 利用DecisionQuery组件选择需要分析的数据维 125

4.3.5 利用DecisionQuery组件选择数据的分析公式 126

4.4 DecisionCube与DecisionSource组件 126

4.4.1 DecisionCube组件的主要属性 127

4.4.3 DecisionCube组件的主要事件 129

4.4.2 DecisionCube组件的主要方法 129

4.4.4 DecisionSource组件的主要属性 130

4.4.5 DecisionSource组件的主要方法 131

4.4.6 DecisionSource组件的主要事件 131

4.5 DecisionPivot组件、DecisionGrid组件与DecisionGraph组件 132

4.5.1 DecisionPivot组件的主要属性 132

4.5.2 DecisionPivot组件的主要方法 132

4.5.3 DecisionPivot组件的主要事件 133

4.5.4 DecisionGrid组件的主要属性 133

4.5.7 DecisionGraph组件的主要属性 134

4.5.5 DecisionGrid组件的主要方法 134

4.5.6 DecisionGrid组件的主要事件 134

4.5.8 DecisionGraph组件的主要方法 140

4.5.9 DecisionGraph组件的主要事件 141

本章小结 141

习题 141

案例4.1 141

第5章 数据仓库开发模型 145

5.1 数据仓库的各种数据模型 146

5.2.1 概念数据模型 147

5.2 数据仓库概念模型 147

5.2.2 规范的数据模型 150

5.2.3 星型模型 152

5.2.4 雪花模型 153

5.3 中间层逻辑模型 154

5.4 物理数据模型 155

5.4.1 事实表模型设计 156

5.4.2 维模型设计 157

5.4.3 数据仓库物理数据模型的性能问题 157

5.5.1 元数据的类型与组成 159

5.5 元数据模型 159

5.5.2 元数据在数据仓库中的作用 161

5.5.3 元数据的收集 164

5.5.4 元数据的存储、管理与维护 166

5.5.5 元数据的用户与使用方法 168

5.5.6 元数据管理模型 170

5.6 数据仓库的粒度模型 170

5.6.1 数据粒度的划分 171

5.6.2 确定粒度的级别 172

习题 173

本章小结 173

第6章 数据仓库开发应用的阶段 175

6.1 数据仓库的生命周期 176

6.1.1 数据仓库的阶段性 176

6.1.2 数据仓库的螺旋式开发方法 177

6.1.3 数据仓库的开发特点 178

6.2 数据仓库的规划 179

6.2.1 选择数据仓库实现策略 180

6.2.2 确定数据仓库的开发目标和实现范围 181

6.2.3 数据仓库的结构 182

6.2.4 数据仓库使用方案和项目规划预算 184

6.3 数据仓库的需求定义 185

6.3.1 定义业主的需求 185

6.3.2 定义设计者的需求 185

6.3.3 开发者的需求定义 186

6.3.4 最终用户的需求定义 188

6.3.5 数据仓库的数据模型设计 189

6.4 数据仓库的设计和实施阶段 189

6.4.2 数据仓库的体系结构与数据库设计 190

6.4.1 数据仓库的数据源确定以及与业务处理系统接口的设计 190

6.4.3 数据仓库的中间件设计 192

6.4.4 数据仓库的数据抽取 193

6.4.5 数据仓库的数据加载 194

6.4.6 数据仓库数据的复制与发行 194

6.4.7 数据仓库的测试 195

6.5 数据仓库的使用、支持和增强阶段 196

6.5.1 数据仓库的用户培训及支持 196

6.5.2 数据仓库的使用方式 197

6.5.3 数据仓库使用中的数据刷新 198

6.5.4 数据仓库的增强 199

本章小结 201

习题 201

第7章 数据仓库的开发过程 203

7.1 数据仓库的概念模型设计 204

7.1.1 概念模型的需求调查 204

7.1.2 概念模型的定义 205

7.1.3 概念模型的分析 209

7.1.4 概念模型的设计 210

7.1.5 概念模型文档与评审 212

7.2 数据仓库的逻辑模型设计 213

7.2.1 分析主题域 213

7.2.2 粒度层次的划分 214

7.2.3 确定数据分割策略 215

7.2.4 关系模型定义 216

7.2.5 数据仓库的实体定义 216

7.2.6 数据仓库的数据抽取模型 217

7.2.7 逻辑模型的评审 219

7.3.2 确定数据结构的类型 220

7.3.1 数据仓库设计的规范 220

7.3 数据仓库物理模型的设计 220

7.3.3 确定索引策略 221

7.3.4 确定数据存放位置 222

7.3.5 确定存储分配 223

7.3.6 数据仓库物理模型的评审 224

7.4 数据仓库的运行技术管理 226

7.4.1 数据加载的一些问题 226

7.4.2 故障恢复管理 227

7.4.3 访问控制与安全管理 227

7.4.4 数据增长的管理 228

本章小结 230

习题 230

第8章 OLAP技术 231

8.1 OLAP技术基本概念 232

8.1.1 OLAP的发展 232

8.1.2 OLAP的特性 233

8.2 OLAP与多维分析 233

8.2.1 几个基本概念 233

8.2.2 多维分析 236

8.2.3 维的层次关系 237

8.2.4 维的类关系 238

8.2.5 OLAP与数据仓库关系 239

8.3 OLAP的实施 240

8.4 基于多维的OLAP 241

8.4.1 多维数据库 241

8.4.2 多维数据库的数据存储 242

8.4.3 多维数据库与数据仓库 243

8.5 关系OLAP 244

8.5.2 ROLAP的多维表示方法 245

8.5.1 ROLAP的三个规则 245

8.6 OLAP的选择与评价标准 248

8.6.1 MOLAP与ROLAP的比较 248

8.6.2 OLAP的衡量标准 250

8.6.3 OLAP服务器和工具的评价标准 253

本章小结 255

习题 255

第9章 数据挖掘技术导论 257

9.1 数据挖掘概述 258

9.1.1 数据挖掘的发展 258

9.1.2 数据挖掘的定义 259

9.1.3 数据挖掘与数据仓库关系 261

9.2 数据挖掘技术与数据挖掘工具 262

9.2.1 常用数据挖掘技术 262

9.2.2 常用数据挖掘工具 265

9.2.3 数据挖掘工具的评价标准 266

9.2.4 常用数据挖掘工具的选择 268

9.3 数据挖掘技术的应用过程 269

9.3.1 数据挖掘过程 269

9.4 数据挖掘的应用范围 274

9.3.2 数据挖掘的用户 274

9.4.1 客户的细分应用 276

9.4.2 客户盈利能力分析 277

9.4.3 客户的获取与保持分析 279

9.4.4 市场营销中的应用 280

9.4.5 数据挖掘的其他应用 281

本章小结 282

习题 283

第10章 统计类数据挖掘技术 285

10.1.1 统计与统计类数据挖掘技术 286

10.1 统计分析类数据挖掘技术 286

10.1.2 数据的聚集与度量技术 287

10.1.3 柱状图数据挖掘技术 287

10.1.4 线性回归数据挖掘技术 288

10.1.5 非线性回归数据挖掘技术 290

10.1.6 聚类数据挖掘技术 292

10.1.7 最近邻数据挖掘技术 295

10.2 统计分析类工具 297

10.2.1 统计类数据挖掘工具与商业分析员 297

10.2.2 统计类数据挖掘工具的功能 298

10.2.3 统计类数据挖掘工具——SPSS 299

10.3 统计分析类工具的用途 302

10.3.1 趋势分析 302

10.3.2 时序分析 303

10.3.3 周期分析 304

10.4 统计分析类工具应用中的问题 305

10.4.1 统计类数据挖掘的预处理问题 305

10.4.2 统计分析遵循的基本原则 307

10.4.3 统计分析的步骤 308

10.4.4 统计类数据挖掘的性能问题 309

本章小结 310

习题 310

第11章 知识类数据挖掘技术 313

11.1 知识发现系统的一般结构 314

11.1.1 知识发现的定义 314

11.1.2 知识发现系统的结构 315

11.2 知识发现技术 317

11.2.1 规则型知识挖掘技术 317

11.2.2 神经网络型知识挖掘技术 319

11.2.3 遗传算法型知识挖掘技术 321

11.2.4 粗糙集型知识挖掘技术 324

11.3 知识发现技术的运用 325

11.3.1 关联规则的应用 325

11.3.2 神经网络的应用 327

11.3.3 遗传算法的应用 328

11.3.4 粗糙集的应用 330

11.4 知识发现工具的应用 332

11.4.1 知识发现工具的系统结构 332

11.4.2 知识发现工具运用中的问题 334

11.4.3 知识发现的价值 336

11.4.4 知识类数据挖掘工具简介 337

本章小结 338

习题 339

第12章 其他数据挖掘技术和工具 341

12.1 文本挖掘技术 342

12.1.1 信息检索系统 342

12.1.2 文本分析和语义网络 344

12.1.3 文本挖掘 345

12.2.1 Web的特点 348

12.2 Web挖掘技术 348

12.2.2 Web内容挖掘 349

12.2.3 Web结构挖掘 350

12.2.4 Web使用记录的挖掘 352

12.2.5 Web数据挖掘的应用 353

12.3 分类分析技术 354

12.4 可视化数据挖掘技术 359

12.4.1 数据可视化技术 359

12.4.2 可视化数据挖掘技术 360

12.5.1 地理信息系统 363

12.5 地理信息系统与空间数据挖掘 363

12.5.2 空间数据挖掘 365

12.6 分布式数据挖掘 366

12.6.1 概述 366

12.6.2 适合水平式数据划分的分布式挖掘方法 367

12.6.3 适合垂直式数据划分的分布式挖掘方法 368

本章小结 369

习题 370

第13章 数据仓库的应用与管理 371

13.1.1 分层决策体系 372

13.1 数据仓库在信息管理中的实际应用 372

13.1.2 数据抽样分析 375

13.1.3 发挥历史数据的经济效益 376

13.1.4 回扣分析 377

13.1.5 客户关系管理 378

13.2 数据仓库应用与数据挖掘中的法律问题 379

13.2.1 数据的隐私权问题 380

13.2.2 数据隐私权的处理 380

13.3 数据仓库开发与应用的成本/效益分析 383

13.3.1 数据仓库投资回报的定量分析 383

13.3.2 数据仓库投资回报的定性分析 384

13.4 数据仓库的开发与运行管理 385

13.4.1 数据仓库开发与应用的组织结构 386

13.4.2 数据仓库的项目开发管理 388

13.4.3 数据仓库应用的阶段性 393

13.4.4 数据仓库的运行管理 396

13.4.5 数据仓库的评价 398

本章小结 400

习题 400

参考文献 403