第1章 概述 1
1.1 初识数据仓库 1
1.1.1 数据仓库的产生过程 1
1.1.2 数据仓库的体系结构 3
1.1.3 数据仓库的关键技术 4
1.2 初识数据挖掘 5
1.2.1 数据挖掘对象 5
1.2.2 数据挖掘过程 7
1.2.3 数据挖掘方法 8
1.3 数据仓库与数据挖掘的关系 10
1.4 数据仓库与数据挖掘工具 10
1.5 图书馆为什么需要数据仓库与数据挖掘 13
第2章 数据仓库 14
2.1 数据仓库概述 14
2.2 数据仓库与数据库的区别 15
2.3 数据仓库数据组织结构 16
2.4 数据仓库开发过程 18
2.4.1 规划分析阶段 18
2.4.2 设计实现阶段 18
2.4.3 使用维护阶段 21
2.5 案例:利用SQL Server 2012创建数据仓库 22
2.5.1 概念模型设计 22
2.5.2 逻辑模型设计 23
2.5.3 物理模型设计 26
第3章 数据抽取转换加载 37
3.1 ETL过程 37
3.1.1 数据抽取 37
3.1.2 数据转换 38
3.1.3 数据加载 39
3.2 T-SQL语句 40
3.2.1 数据定义语句 40
3.2.2 数据控制语句 40
3.2.3 数据操纵语句 41
3.3 SSIS服务 41
3.3.1 SSIS工具箱 41
3.3.2 SSIS包 42
3.4 案例:利用SQL Server 2012抽取、转换及加载数据 44
3.4.1 数据抽取 44
3.4.2 数据清理、转换 51
3.4.3 数据加载 53
第4章 联机分析处理 66
4.1 联机分析处理特性及评价 66
4.1.1 OLAP特性 66
4.1.2 OLAP评价准则 67
4.2 OLAP的一些基本概念 68
4.3 OLAP的基本操作 69
4.4 案例:利用SQL Server 2012创建OLAP立方 73
4.4.1 建立数据源 73
4.4.2 创建数据源视图 76
4.4.3 根据向导创建多维数据集 79
4.4.4 修改Cube中的维度和度量 86
4.4.5 部署项目 90
4.4.6 分析多维数据集 93
第5章 关联规则 98
5.1 基本概念 98
5.2 关联规则的分类 100
5.3 Apriori算法 101
5.3.1 Apriori性质 101
5.3.2 Apriori算法步骤 101
5.3.3 Apriori算法示例 102
5.4 Microsoft关联规则算法 106
5.4.1 Microsoft关联规则算法的参数 107
5.4.2 Microsoft关联规则算法的要求 108
5.5 案例:利用SQL Server 2012进行Microsoft关联规则挖掘 108
5.5.1 数据准备 108
5.5.2 实现挖掘任务 111
5.5.3 浏览模型 120
5.5.4 关联预测 124
第6章 分类 129
6.1 决策树算法 129
6.1.1 基本概念 129
6.1.2 ID3算法 130
6.1.3 ID3算法示例 132
6.1.4 由决策树提取分类规则 134
6.1.5 Microsoft决策树算法 134
6.2 贝叶斯分类算法 136
6.2.1 贝叶斯分类的基础——贝叶斯定理 136
6.2.2 朴素贝叶斯分类器 137
6.2.3 朴素贝叶斯分类示例 137
6.2.4 Microsoft Naive Bayes算法 138
6.3 神经网络算法 139
6.3.1 生物神经元与人工神经元 140
6.3.2 神经网络的激发函数 141
6.3.3 多层感知器 141
6.3.4 Microsoft神经网络算法 143
6.4 逻辑 回归算法 144
6.4.1 逻辑 回归算法概述 144
6.4.2 Microsoft逻辑 回归算法 145
6.5 案例:利用SQL Server 2012进行分类挖掘 146
6.5.1 数据准备 146
6.5.2 实现挖掘任务 148
6.5.3 浏览模型 160
6.5.4 挖掘性能分析 172
第7章 聚类 180
7.1 聚类分析 180
7.1.1 聚类分析中的数据结构 180
7.1.2 聚类分析中的数据类型 181
7.2 k-平均算法 185
7.3 EM算法 186
7.4 Microsoft聚类算法 186
7.4.1 Microsoft聚类算法的参数 187
7.4.2 Microsoft聚类算法的要求 187
7.5 案例:利用SQL Server 2012进行Microsoft聚类分析挖掘 188
7.5.1 数据准备 188
7.5.2 实现挖掘任务 190
7.5.3 浏览模型 197
第8章 线性回归 200
8.1 一元线性回归 200
8.2 多元线性回归 201
8.3 Microsoft线性回归算法 202
8.3.1 Microsoft线性回归算法的参教 202
8.3.2 Microsoft线性回归算法的要求 203
8.4 案例:利用SQL Server 2012进行Microsoft线性回归挖掘 203
8.4.1 数据准备 203
8.4.2 实现挖掘任务 204
8.4.3 浏览模型 211
第9章 时序 213
9.1 基本概念 213
9.2 简单平均法 214
9.3 移动平均法 214
9.3.1 简单移动平均 214
9.3.2 加权移动平均 215
9.4 指数平滑法 215
9.4.1 简单指数平滑法 215
9.4.2 考虑趋势调整的指数平滑法 216
9.4.3 考虑季节性调整的指数平滑法 217
9.5 ARIMA模型 218
9.5.1 平稳时间序列ARIMA模型的一般形式 218
9.5.2 非平稳时间序列ARIMA模型的一般形式 219
9.5.3 方法性工具 220
9.6 ARIMA模型示例 222
9.7 Microsoft时序算法 225
9.7.1 Microsoft时序算法的参数 225
9.7.2 Microsoft时序算法的要求 227
9.8 案例:利用SQL Server 2012进行Microsoft时序算法挖掘 227
9.8.1 数据准备 227
9.8.2 实现挖掘任务 230
9.8.3 浏览模型 237
主要参考文献 241