PART Ⅰ 数据仓库、数据挖掘与商业智能 2
Chapter 1绪论 2
1-1商业智能 3
1-1-1什么是商业智能 3
1-1-2商业智能作用及意义 3
1-1-3商业智能架构 4
1-1-4商业智能中的挑战 6
1-2数据挖掘 7
1-3大数据 9
1-3-1何谓大数据 9
1-3-2大数据的应用 9
1-4云计算 10
Chapter 2数据仓库 13
2-1数据仓库定义 14
2-2数据仓库特性 14
2-3数据仓库架构 15
2-4创建数据仓库的目的 17
2-5数据仓库的运用 18
2-6数据仓库的管理 19
2-7 No SQL数据库 19
2-7-1 Key-Value型数据库 20
2-7-2内存数据库 20
2-7-3文件数据库 20
2-7-4图形数据库 20
2-8 Hadoop 21
Chapter 3数据挖掘简介 22
3-1数据挖掘的定义 23
3-2数据挖掘的重要性 23
3-3数据挖掘的功能 23
3-4数据挖掘的步骤 24
3-5数据挖掘建模的标准CRISP-DM 25
3-6数据挖掘的应用 27
3-7数据挖掘软件介绍 28
3-8数据挖掘与Excel 30
Chapter 4数据挖掘的主要方法 31
4-1回归分析 32
4-1-1简单线性回归分析 32
4-1-2多元回归分析 32
4-1-3脊回归分析 32
4-1-4逻辑回归分析 34
4-2关联规则 34
4-3聚类分析 34
4-4判别分析 36
4-5神经网络 37
4-6决策树 39
4-7其他分析方法 40
Chapter 5数据挖掘与相关领域的关系 42
5-1数据挖掘与统计分析 43
5-2数据挖掘与数据仓库 43
5-3数据挖掘与知识发现(KDD) 44
5-4数据挖掘与OLAP 45
5-5数据挖掘与机器学习 46
5-6数据挖掘与Web数据挖掘 46
5-7数据挖掘、云计算与大数据 47
PART Ⅱ Microsoft SQL Server概述 49
Chapter 6 Microsoft SQL Server中的商业智能 49
6-1 Microsoft SQL Server入门 50
6-2关系数据仓库 50
6-3 SQL Server 2014概述 51
6-4 SQL Server 2014技术 52
6-5 SQL Server 2014新增功能 54
Chapter 7 Microsoft SQL Server中的 56
数据挖掘功能 56
7-1创建商业智能应用程序 57
7-2 Microsoft SQL Server数据挖掘功能的优势 59
7-2-1易于使用 59
7-2-2简单而丰富的API 59
7-2-3可伸缩性 60
7-2-4数据挖掘算法 60
7-3 Microsoft SQL Server数据挖掘算法 61
7-4 Microsoft SQL Server可扩展性 62
7-5 Microsoft SQL Server是数据挖掘与商业智能的结合 62
7-5-1数据分析 62
7-5-2报告 63
7-6使用数据挖掘可以解决的问题 63
7-6-1构建挖掘模型 63
7-6-2构建数据挖掘应用程序 64
7-6-3 DMX范例 65
Chapter 8 Microsoft SQL Server的分析服务 67
8-1创建多维数据集的结构 68
8-2建立和部署多维数据集 69
8-3从模板创建自定义的数据库 69
8-4统一维度模型 70
8-5基于属性的维度 71
8-6维度类型 72
8-7量度组和数据视图 72
8-8计算效率 73
8-9 MDX脚本 74
8-10存储过程 75
8-11关键绩效指标(KPI) 75
8-12实时商业智能 76
Chapter 9 Microsoft SQL Server的报表服务 78
9-1为何使用报表服务 79
9-2报表服务的功能 80
9-2-1制作报表 80
9-2-2管理报表 80
9-2-3提交报表 81
Chapter 10 Microsoft SQL Server的整合服务 83
10-1 SSIS介绍 84
10-1-1 DTS与SSIS 84
10-1-2 DTS升级到Integration Services重点 84
10-1-3 SSIS版本 85
10-1-4 SSIS(SQL Server Integration Service)架构图 85
10-1-5 Integration Service数据流 85
10-1-6 SSIS Designer 87
10-1-7数据流 87
10-1-8控制流 88
10-2操作示例 92
10-2-1将Excel数据表导入SQL数据库中的数据表 92
10-2-2对数据进行抽样 103
Chapter 11 Microsoft SQL Server的DMX语言 114
11-1 DMX语言介绍 115
11-2 DMX函数 117
11-2-1模型建立 117
11-2-2模型训练 118
11-2-3模型使用(预测) 118
11-2-4其他函数语法 119
11-3 DMX语法 122
11-3-1决策树 123
11-3-2贝叶斯概率分类 124
11-3-3关联规则 125
11-3-4聚类分析 126
11-3-5时序聚类分析 127
11-3-6线性回归分析 127
11-3-7逻辑回归 128
11-3-8神经网络 129
11-3-9时序 130
11-4 DMX操作实例 131
11-4-1分类 132
11-4-2评估 133
11-4-3预测 134
11-4-4关联分组 135
11-4-5聚类分组 136
PART Ⅲ Microsoft SQL Server中的数据挖掘模型 138
Chapter 12决策树模型 138
12-1基本概念 139
12-2决策树与判别函数 139
12-3计算方法 140
12-4操作范例 142
Chapter 13贝叶斯分类器 152
13-1基本概念 153
13-2操作范例 155
Chapter 14关联规则 166
14-1基本概念 167
14-2关联规则的种类 168
14-3关联规则的算法:Apriori算法 168
14-4操作范例 169
Chapter 15 聚类分析 179
15-1基本概念 180
15-2层级聚类法与动态聚类法 180
15-3操作范例 185
Chapter 16时序聚类 197
16-1基本概念 198
16-2主要算法 198
16-3操作示例 200
Chapter 17线性回归模型 210
17-1基本概念 211
17-2一元回归模型 212
17-2-1模型假设及推估 212
17-2-2回归模型测试 215
17-3多元回归模型 216
17-3-1回归效果的评估 216
17-3-2回归变量的选择 218
17-4 操作范例 219
Chapter 18逻辑回归模型 228
18-1基本概念 229
18-2 logit变换与logistic分布 229
18-3逻辑回归模型 231
18-4操作范例 232
Chapter 19人工神经网络模型 242
19-1基本概念 243
19-2神经网络模型的特点 245
19-3神经网络模型的优劣比较 245
19-4 操作范例 247
Chapter 20时序模型 257
20-1基本概念 258
20-2时序的构成 260
20-3简单时序的预测 266
20-4包含趋势与季节成分的时序预测 268
20-5参数化的时序预测模型 270
20-6操作范例 274
PART Ⅳ Microsoft SQL Server数据挖掘应用实例 285
Chapter 21决策树模型实例 285
Chapter 22逻辑回归模型实例 293
22-1回归模型实例一:肾细胞癌转移的回归模型 294
22-2回归模型实例二:高中升学数据的回归模型 300
22-3回归模型实例三 306
Chapter 23神经网络模型实例 312
23-1实例一:肾细胞癌转移的神经网络模型 313
23-2实例二:电信行业神经网络模型 319
Chapter 24时序模型实例 332
24-1实例一:电力负载的时序模型 333
24-2实例二:进出品货物价值的时序模型 338
Chapter 25如何评估数据挖掘模型 344
25-1评估图节点Evaluation Chart Node介绍 345
25-2在SQL Server中如何评估模型 348
25-3规则度量:支持度与可信度 353
25-4结论 355