第1章 数据挖掘简介 3
1.1 数据挖掘的定义 3
1.2 数据挖掘的重要性 3
1.3 数据挖掘的功能 3
1.4 数据挖掘的步骤 4
1.5 数据挖掘建模的标准CRISP-DM 5
第2章 数据挖掘运用的理论和技术 7
2.1 回归分析 7
2.1.1 简单线性回归分析 7
2.1.2 多元回归分析 7
2.1.3 岭回归分析 8
2.1.4 Logistic回归分析 9
2.2 关联规则 9
2.3 聚类分析 10
2.4 判别分析 11
2.5 类神经网络分析 12
2.6 决策树分析 13
2.7 其他分析方法 15
第3章 数据挖掘与相关领域的关系 17
3.1 数据挖掘与统计分析的不同 17
3.2 数据挖掘与数据仓储的关系 17
3.3 知识发现与数据挖掘的关系 18
3.4 OLAP与数据挖掘的关系 19
3.5 数据挖掘与机器学习的关系 19
3.6 网络挖掘与数据挖掘的关系 20
第4章 数据挖掘商业软件产品及其应用现状 21
4.1 数据挖掘商业软件的分类 21
4.2 主要软件的介绍 21
4.3 顾客关系管理 22
4.4 数据挖掘的行业应用 23
第5章 安装与设定Excel 2007数据挖掘加载项 27
5.1 系统需求 27
5.2 开始安装 27
5.3 完成安装验证 30
5.4 组件设定 30
5.5 配置完成检查 35
第6章 Excel 2007数据挖掘入门 37
6.1 Excel 2007数据挖掘功能介绍 37
6.2 数据挖掘使用说明 37
6.2.1 目录查询 37
6.2.2 开始功能 38
6.2.3 视频和教学 39
6.3 数据挖掘连接配置 39
6.3.1 设定目前的连接 39
6.3.2 跟踪 41
6.4 数据准备 41
6.4.1 浏览数据 41
6.4.2 清除数据 44
6.4.3 分割数据 46
6.5 数据建模 50
6.6 精确度和验证 51
6.6.1 准确性图表 51
6.6.2 分类矩阵 52
6.6.3 利润图 53
6.7 模型用法 53
6.7.1 浏览功能 53
6.7.2 查询功能 56
6.8 模型管理 57
6.8.1 重新命名挖掘模型 57
6.8.2 删除挖掘结构 57
6.8.3 清除挖掘结构 58
6.8.4 用原始数据处理挖掘结构 58
6.8.5 用新数据处理挖掘结构 58
6.8.6 导出挖掘结构 59
6.8.7 导入挖掘结构 60
第7章 决策树 61
7.1 基本概念 61
7.2 决策树模块的建立 61
7.3 决策树与判别函数比较 61
7.4 计算方法 62
7.4.1 确定预测精度的标准 62
7.4.2 选择分裂(分层)技术 62
7.4.3 定义停止分裂(分层)的时间点 62
7.4.4 选择适当大小的决策树 63
7.5 Excel 2007决策树算法 63
第8章 贝叶斯概率分类 71
8.1 基本概念 71
8.2 Excel 2007贝叶斯概率分类 73
第9章 关联规则 84
9.1 基本概念 84
9.2 关联规则的种类 85
9.3 关联规则的算法:Apriori算法 85
9.4 Excel 2007关联规则 86
第10章 聚类分析 96
10.1 基本概念 96
10.2 层次聚类分析 96
10.3 聚类分析原理 97
10.4 Excel 2007聚类分析 100
第11章 时序聚类 116
11.1 基本概念 116
11.2 相关研究和算法 116
11.3 Excel 2007时序聚类 117
第12章 线性回归 126
12.1 基本概念 126
12.2 简单回归分析 127
12.3 多元回归分析 130
12.4 Excel 2007线性回归 133
第13章 Logistic回归 142
13.1 基本概念 142
13.2 logit变换 142
13.3 Logistic分布 143
13.4 列联表的Logistic回归模型 144
13.5 Excel 2007 Logistic回归 145
第14章 类神经网络 161
14.1 基本概念 161
14.2 类神经网络的架构与训练算法 163
14.3 类神经网络的特性 163
14.4 类神经网络应用 163
14.5 类神经网络优缺点 164
14.6 Excel 2007类神经网络 165
第15章 时间序列分析 175
15.1 基本概念 175
15.2 时间序列的成分 177
15.3 时间序列数据的图形介绍 178
15.4 利用平滑法预测 182
15.5 用趋势方程预测时间序列 186
15.6 预测含趋势与季节成分的时间序列 187
15.7 利用回归模型预测时间序列 188
15.8 其他预测模型 189
15.9 单变量时间序列预测模型 189
15.10 时间趋势预测模型 192
15.11 Excel 2007时间序列 193
第16章 DMX介绍 198
16.1 DMX介绍 198
16.2 DMX函数介绍 199
16.2.1 模型建立 200
16.2.2 模型训练 201
16.2.3 模型使用(预测) 201
16.2.4 其他函数语法 202
16.3 DMX数据挖掘语法 205
16.3.1 决策树 206
16.3.2 贝叶斯概率分类 207
16.3.3 关联规则 207
16.3.4 聚类分析 208
16.3.5 时序聚类 209
16.3.6 线性回归 210
16.3.7 Logistic回归 211
16.3.8 类神经网络 212
16.3.9 时间序列 213
16.4 DMX应用范例 214
16.4.1 分类 215
16.4.2 估计 216
16.4.3 预测 217
16.4.4 关联分组 217
16.4.5 聚类 218
第17章 分析关键影响因素 223
第18章 检测类别 228
第19章 从示例填充 231
第20章 预测 233
第21章 突出显示异常值 235
第22章 应用场景分析 238
22.1 目标查找 238
22.2 假设 240
第23章 Visio 2007数据透视分析 243
第24章 上市公司投资价值分析的挖掘模型 251
24.1 研究动机与目的 251
24.2 挖掘模型的构建 251
24.3 变量筛选 252
24.4 决策树模型 253
24.5 贝叶斯概率模型 255
24.6 Logistic回归模型 255
24.7 预测准确度比较 256
第25章 信用卡用户信用评测的挖掘模型 259
25.1 研究背景 259
25.2 研究动机 260
25.3 研究目的 260
25.4 Excel 2007构建数据挖掘模型 260
25.4.1 决策树分析 260
25.4.2 聚类分析 263
25.4.3 Logistic回归 269
第26章 市场营销与客户细分的挖掘模型 271
26.1 研究动机与目的 271
26.2 研究方法与限制 271
26.3 数据分析 271
26.4 挖掘建模 273
26.4.1 决策树 273
26.4.2 单纯贝叶斯分类 280
26.4.3 聚类分析 282
26.4.4 决策树 286
26.4.5 Logistic回归 288
26.4.6 关联分析 292
26.5 结论 295