《数据挖掘原理与商务应用》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:朱小栋,徐欣编著
  • 出 版 社:上海:立信会计出版社
  • 出版年份:2013
  • ISBN:9787542938169
  • 页数:176 页
图书介绍:本书介绍了数据挖掘的基础原理(包括关联分析、分类分析、聚类分析和时间序列分析以及主要的算法)和客户关系管理等方面的知识。本书通过丰富的示例讲解数据挖掘的算法理论。本书分为两大篇,共11章。实践性和理论性结合密切。

第1篇 理论篇 3

第1章 绪论 3

1.1 数据挖掘的基础概念 3

1.1.1 数据 3

1.1.2 知识 5

1.1.3 信息 5

1.1.4 数据挖掘的定义 10

1.2 数据挖掘与数据库的关系 11

1.2.1 数据库简介 11

1.2.2 数据挖掘与数据库 13

1.3 数据挖掘的过程 14

1.4 数据挖掘的体系结构 16

1.5 数据挖掘在商务智能中的位置 17

1.6 数据挖掘常见技术 18

1.7 数据挖掘标准的发展 20

1.7.1 预测模型标记语言PMML 20

1.7.2 公共仓库元模型CWM 22

1.7.3 跨行业数据挖掘标准流程CRISP-DM 24

1.8 习题 27

第2章 数据仓库与OLAP分析 28

2.1 数据仓库 28

2.1.1 数据仓库与数据挖掘的关系 29

2.1.2 数据仓库的数据模型 31

2.1.3 元数据 35

2.2 ETL过程 38

2.2.1 数据抽取 39

2.2.2 数据转换 40

2.2.3 数据加载 41

2.3 联机分析处理OLAP 41

2.3.1 OLAP概念 41

2.3.2 OLAP的操作 44

2.3.3 OLAP多维数据分析 45

2.4 习题 47

第3章 关联分析 48

3.1 关联概述 48

3.2 关联规则的定义 49

3.3 关联分析的过程 50

3.4 关联分析的基本算法 51

3.5 关联规则的分类 56

3.6 关联分析的发展 56

3.7 习题 57

第4章 分类分析 58

4.1 分类概述 58

4.2 基于决策树的分类 58

4.2.1 决策树的概念 58

4.2.2 决策树的基本算法 59

4.2.3 决策树修剪 66

4.2.4 决策树的改进 67

4.3 分类分析的其他技术 70

4.3.1 支持向量机 70

4.3.2 贝叶斯网络 73

4.4 习题 77

第5章 聚类分析 78

5.1 聚类概述 78

5.2 相似性度量 79

5.2.1 明氏(Minkowski)距离 80

5.2.2 兰氏(Canberra)距离 81

5.2.3 马氏(Mahalanobis)距离 81

5.3 层次聚类法 83

5.3.1 最短距离法 83

5.3.2 最长距离法 84

5.3.3 二元变量度量 85

5.4 K-均值聚类算法 86

5.5 习题 88

第6章 数据挖掘的仿生技术 89

6.1 人工神经网络 89

6.1.1 人脑神经元与神经元模型 90

6.1.2 人工神经网络模型 90

6.1.3 BP网络的基本原理 91

6.2 遗传算法 92

6.3 蚁群算法 94

6.4 习题 95

第7章 数据挖掘的集合论技术 96

7.1 粗糙集理论 96

7.1.1 信息系统 96

7.1.2 粗糙集 98

7.1.3 属性约简 99

7.2 模糊集理论 99

7.2.1 3次数学危机与模糊数学的诞生 99

7.2.2 模糊集合论的基础知识 101

7.2.3 λ截集和支集 103

7.2.4 怎样度量模糊性 104

7.2.5 模糊数学应用 106

7.3 习题 112

第2篇 实践篇 115

第8章 数据挖掘工具 115

8.1 SPSS工具 115

8.2 WEKA工具 116

8.2.1 WEKA的背景 116

8.2.2 WEKA的功能 117

8.2.3 WEKA的使用 118

8.3 IBM Data Miner工具 120

8.4 MS SQL Server 2008数据分析引擎 121

8.5 ETL工具Data Stage 124

8.5.1 Datastage过程理论 124

8.5.2 Datastage的并行机制 126

8.6 习题 127

第9章 关联分析在客户关系管理的应用 128

9.1 客户关系管理基本理论 128

9.1.1 客户关系管理定义 128

9.1.2 CRM中的客户类型 129

9.1.3 CRM系统体系理论 130

9.1.4 数据挖掘在客户关系管理中的应用 131

9.2 实例研究背景——Foodmart简介及DB分析 134

9.3 购物数据的预处理 138

9.4 数据集成与转换 139

9.5 建立Foodmart公司购物篮分析模型 141

9.6 WEKA软件挖掘过程 141

9.7 结果分析 146

9.8 习题 148

第10章 分类分析和聚类分析在客户关系管理的综合应用 149

10.1 Foodmart DB客户数据分析 149

10.2 决策树分类算法数据准备 150

10.2.1 数据的预处理 150

10.2.2 数据集成与转换 150

10.3 零售业客户决策树分类模型的建立 151

10.3.1 聚类分析 151

10.3.2 决策树分析 154

10.3.3 挖掘模型及流程 155

10.4 结果分析 158

10.5 习题 160

第11章 机场场区商务智能系统解决方案 162

11.1 OMC-DMS需求分析 162

11.2 方案设计思路 163

11.2.1 OMC商务智能的理念 163

11.2.2 OMC数据挖掘系统 164

11.3 OMC数据挖掘系统的部署 168

11.4 应用数据挖掘的OMC-DMS决策支持示例 169

11.5 OMC-DMS的职位需求 171

11.6 习题 171

参考文献 173

后记 176