《商业智能原理与应用》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:蔡颖,鲍立威著
  • 出 版 社:杭州:浙江大学出版社
  • 出版年份:2011
  • ISBN:9787308091206
  • 页数:301 页
图书介绍:本书针对信息化建设快速推进所产生的大量数据,主要讲解数据挖掘技术在商业智能中的应用,包括数据仓库构建和实施工具、数据预处理及其操作、多维数据分析方法和使用、智能报表生成、数据挖掘的各种主要技术、应用和工具使用等。结合MS SQL Server的使用,主要章节均有详细的案例描述及实验练习,大量案例为企业实际运行数据,学生通过实际操作可熟练掌握数据仓库构建和数据挖掘的实际应用。经调研比较,目前同类图书或是主要讲解数据仓库,或是主要讲解数据挖掘,多偏重于理论和算法,较少从实用出发,在数据仓库基础上实现数据挖掘以达到商业智能应用的目的。

第1章 数据挖掘和商业智能 1

1.1 数据挖掘的兴起 1

1.1.1 数据丰富与知识匮乏 1

1.1.2 从数据到知识 2

1.1.3 数据挖掘产生 3

1.1.4 数据挖掘解决的商业问题 4

1.2 什么是商业智能 5

1.2.1 企业决策实现过程的信息需求 5

1.2.2 企业信息化系统中的商业智能 6

1.2.3 商业智能的体系结构 7

1.3 数据挖掘和商业智能工具 9

1.3.1 商业智能工具的选择 9

1.3.2 SQL Server 2008的商业智能构架 10

1.4 数据挖掘应用案例 13

【本章小结】 15

【练习题】 16

第2章 数据仓库 17

2.1 数据仓库的概念 17

2.1.1 从传统数据库到数据仓库 17

2.1.2 数据仓库的定义与基本特性 19

2.2 数据仓库的体系结构 21

2.2.1 数据仓库的物理结构 21

2.2.2 数据仓库的系统结构 22

2.2.3 数据仓库的数据模型 23

2.3 元数据 26

2.3.1 元数据的定义 26

2.3.2 元数据的分类及作用 26

2.4 数据集市 28

2.4.1 两种数据集市结构 28

2.4.2 数据集市与数据仓库的差别 29

2.4.3 关于数据集市的误区 29

2.5 数据仓库设计与实施 30

2.5.1 自上而下还是自下而上的设计方法 30

2.5.2 数据仓库的设计步骤 31

2.5.3 数据仓库的实施 40

2.5.4 数据仓库的使用和维护 41

2.6 Microsoft数据仓库(DW)和商业智能(BI)工具 41

2.7 数据仓库设计案例 43

2.7.1 业务数据库AdventureWorks 44

2.7.2 业务数据分析 46

2.7.3 项目需求分析 47

2.7.4 构建数据仓库 48

【本章小结】 50

【练习题】 50

第3章 数据预处理 51

3.1 数据预处理的重要性 51

3.2 数据清洗 53

3.2.1 遗漏数据处理 53

3.2.2 噪声数据处理 54

3.2.3 不一致数据处理 55

3.3 数据集成与转换 56

3.3.1 数据集成处理 56

3.3.2 数据转换处理 56

3.4 数据消减 58

3.4.1 数据立方合计 59

3.4.2 维数消减 59

3.4.3 数据块消减 60

3.5 离散化和概念层次树生成 63

3.5.1 数值概念层次树生成 64

3.5.2 类别概念层次树生成 66

3.6 使用SSIS对数据进行ETL操作 67

3.6.1 SSIS的主要功能 68

3.6.2 SSIS的体系结构 70

3.6.3 SSIS包主要对象 74

3.6.4 创建并运行一个简单的包 76

【本章小结】 88

【思考题】 88

第4章 多维数据分析 89

4.1 多维数据分析基础 89

4.2 多维数据分析方法 92

4.3 多维数据的存储方式 95

4.3.1 三种存储方式 95

4.3.2 三种存储方式的比较 97

4.4 多维表达式(MDX) 98

4.4.1 MDX中的重要概念 98

4.4.2 MDX基本语法 100

4.4.3 MDX与SQL的区别 101

4.4.4 MDX核心函数 102

4.5 使用SQL Server Analysis Services(SSAS)构建维度和多维数据集 108

4.5.1 SSAS的体系结构 108

4.5.2 SSAS的统一维度模型(UDM) 109

4.5.3 SSAS示例 111

4.6 使用Excel数据透视图浏览多维数据集 141

【本章小结】 146

【思考题】 147

第5章 用Microsoft SSRS处理智能报表 148

5.1 SSRS商业智能报表 148

5.1.1 商业智能报表与商业智能 148

5.1.2 SSRS的结构 150

5.1.3 SSRS报表的3种状态 151

5.2 使用SSRS创建报表 151

5.2.1 创建一个简单报表项目 151

5.2.2 增强基本报表的功能 153

5.2.3 发布报表 160

【本章小结】 160

第6章 数据挖掘技术 161

6.1 数据挖掘的任务 161

6.1.1 分类 162

6.1.2 回归 163

6.1.3 时间序列分析 163

6.1.4 预测 164

6.1.5 聚类 164

6.1.6 关联规则 165

6.1.7 序列分析 166

6.1.8 偏差检测 166

6.2 数据挖掘的对象 167

6.3 数据挖掘系统的分类 171

6.4 数据挖掘项目的生命周期 172

6.4.1 商业理解 173

6.4.2 数据准备 173

6.4.3 模型构建 173

6.4.4 模型评估 174

6.4.5 应用集成和实施 174

6.5 数据挖掘面临的挑战及发展 175

6.5.1 数据挖掘面临的挑战 175

6.5.2 数据挖掘的发展趋势 176

【本章小结】 178

【思考题】 179

第7章 关联挖掘 180

7.1 关联规则挖掘 181

7.1.1 购物分析:关联挖掘 181

7.1.2 基本概念 181

7.1.3 关联规则挖掘分类 182

7.2 单维布尔关联规则挖掘 183

7.2.1 Apriori算法 183

7.2.2 关联规则的生成 186

7.3 挖掘多层级关联规则 186

7.3.1 挖掘多层次关联规则 186

7.3.2 挖掘多层次关联规则方法 188

7.3.3 多层次关联规则的冗余 190

7.4 多维关联规则的挖掘 191

7.4.1 多维关联规则 191

7.4.2 利用静态离散挖掘多维关联规则 192

7.5 关联挖掘中的相关分析 193

7.5.1 无意义强关联规则示例 193

7.5.2 从关联分析到相关分析 194

7.6 利用Microsoft SSAS进行关联挖掘 195

7.6.1 Microsoft关联规则模型简介 195

7.6.2 关联规则数据挖掘示例 197

【本章小结】 206

【思考题】 206

第8章 分类与预测 207

8.1 分类与预测基本知识 207

8.2 有关分类和预测的几个问题 209

8.3 基于决策树的分类 210

8.3.1 决策树生成算法 210

8.3.2 属性选择方法 211

8.3.3 树枝修剪 213

8.3.4 决策树分类规则获取 214

8.3.5 级别决策树方法的改进 215

8.3.6 数据仓库技术与决策树归纳的结合 216

8.4 贝叶斯分类方法 217

8.4.1 贝叶斯定理 217

8.4.2 基本贝叶斯分类方法 218

8.5 神经网络分类方法 220

8.5.1 多层前馈神经网络 220

8.5.2 神经网络结构 221

8.5.3 后传方法 221

8.5.4 后传方法和可理解性 224

8.6 分类器准确性 225

8.6.1 分类器准确性估计 225

8.7 预测方法 226

8.7.1 线性与多变量回归 226

8.7.2 非线性回归 227

8.7.3 其它回归模型 228

8.8 Microsoft贝叶斯算法 228

8.8.1 贝叶斯算法的参数 228

8.8.2 使用贝叶斯模型 229

8.8.3 浏览贝叶斯模型 231

8.9 Microsoft决策树算法 234

8.10 Microsoft神经网络算法 240

【本章小结】 242

【思考题】 242

第9章 聚类分析 243

9.1 聚类分析概念 243

9.2 聚类分析中的数据类型 245

9.2.1 间隔数值属性 246

9.2.2 二值属性 247

9.2.3 符号、顺序和比例数值属性 248

9.2.4 混合类型属性 250

9.3 主要聚类方法 251

9.4 划分方法 252

9.4.1 传统划分方法 252

9.4.2 大数据库的划分方法 255

9.5 层次方法 256

9.5.1 两种基本层次聚类方法 256

9.6 基于密度方法 258

9.6.1 基于密度方法:DBSCAN 258

9.7 异常数据分析 259

9.7.1 基于统计的异常检测方法 260

9.7.2 基于距离的异常检测方法 261

9.7.3 基于偏差的异常检查方法 261

9.8 Microsoft聚类算法 263

【本章小结】 270

【思考题】 270

第10章 时序数据和序列数据挖掘 271

10.1 时间序列模型 271

10.2 Microsoft的时序算法 273

10.2.1 自动回归 273

10.2.2 自动回归树 274

10.2.3 数据中的季节性处理 275

10.2.4 使用预测函数预测值 275

10.3 Microsoft时序算法示例 276

10.4 Microsoft的序列模式挖掘 281

10.4.1 Microsoft序列聚类算法 281

10.4.2 序列聚类挖掘示例 284

【本章小结】 289

【思考题】 290

第11章 基于多维数据集的数据挖掘 291

11.1 OLAP和数据挖掘之间的关系 291

11.2 构建OLAP挖掘模型 293

【本章小结】 300