第1章 数据挖掘简介 1
1.1 何谓数据挖掘 2
1.2 数据仓库、KDD、数据挖掘的关系 2
1.3 数据挖掘的应用 3
1.4 数据挖掘的进行步骤 6
1.5 个案研究 7
1.6 数据挖掘的分析方法 9
1.6.1 分类 10
1.6.2 决策树 10
1.6.3 回归 11
1.6.4 时间序列 11
1.6.5 聚类 12
1.6.6 关联规则 12
1.6.7 顺序规则 12
1.6.8 其他分析方法 12
1.7 数据挖掘的运用理论与实际运用功能 13
1.8 数据挖掘软件 14
1.9 数据挖掘在CRM中扮演的角色 19
1.9.1 客服中心是顾客关系管理的火车头 20
1.9.2 从客服中心角度看顾客关系管理 21
第2章 Clementine 11.0简介 29
2.1 Clementine的安装与启动 29
2.1.1 安装Clementine 11.0 29
2.1.2 启动Clementine 11.0 31
2.2 Clementine 11.0一览 32
2.2.1 Clementine 11.0界面 32
2.2.2 在Clementine 11.0中使用鼠标 35
2.2.3 利用快捷键 35
2.2.4 Clementine 11.0中获得帮助 36
2.3 Clementine选项设置 37
2.3.1 系统选项 37
2.3.2 默认目录的设置 37
2.3.3 用户选项的设置 38
2.4 Clementine自动化 41
2.5 Clementine 11.0版本的新功能 41
2.5.1 商业品质的图形展示 42
2.5.2 改进的SPSS输出节点 42
2.5.3 增强的数据审核节点 43
2.5.4 增强的数据变换节点 43
2.5.5 优化分块节点 44
2.5.6 SPSS转换节点 44
2.5.7 改进的数据挖掘模型和算法 44
2.5.8 运行效率、安全性和远程部署 46
第3章 数据挖掘入门 47
3.1 数据挖掘回顾 47
3.2 机器学习技术 47
3.2.1 神经网络 47
3.2.2 规则归纳 48
3.2.3 Kohonen网络 49
3.2.4 关联规则 49
3.2.5 统计模型 51
3.2.6 聚类模型 51
3.3 潜在数据挖掘应用评估 52
3.4 数据挖掘的策略 53
3.5 数据挖掘中的小技巧 55
第4章 构建数据流 56
4.1 概述 56
4.2 建立数据流 56
4.2.1 节点的操作 56
4.2.2 数据流的操作 53
4.2.3 执行数据流 69
4.2.4 保存数据流 69
4.2.5 装载文件 70
4.2.6 映射数据流 70
第5章 处理缺失值 74
5.1 概述 74
5.2 指定缺失值 74
5.3 处理缺失值 75
5.3.1 处理带缺失值的记录 75
5.3.2 处理带缺失值的字段 76
5.4 针对缺失值的CLEM函数 76
第6章 来源节点 78
6.1 概述 78
6.2 变量文件节点 78
6.3 固定文件节点 80
6.4 为文本区设置数据存储 81
6.5 数据库节点 83
6.5.1 设置数据库节点选项 83
6.5.2 添加数据库连接 84
6.5.3 选择表 84
6.5.4 数据库查询 85
6.6 SPSS导入节点 85
6.7 多维数据集导入节点 86
6.8 SAS导入节点 86
6.9 Excel输入节点 87
6.10 用户输入节点 88
6.11 一般来源节点项目 91
6.11.1 在来源节点中设置数据类型 91
6.11.2 在来源节点处过滤字段 93
第7章 记录操作节点 95
7.1 概述 95
7.2 选择节点 95
7.3 抽样节点 96
7.4 均衡节点 97
7.5 聚合节点 97
7.6 排序节点 99
7.7 合并节点 100
7.7.1 指定合并方法和关键字段 100
7.7.2 从合并节点过滤字段 101
7.7.3 设置输入顺序并加上卷标 102
7.8 区分节点 103
7.9 附加节点 104
第8章 字段操作节点 106
8.1 概述 106
8.2 类型节点 106
8.2.1 数据类型 107
8.2.2 什么是实例化 109
8.2.3 读取数据值 110
8.2.4 缺失值处理 113
8.2.5 检查类型值 113
8.2.6 设置字段方向 114
8.2.7 复制类属性 115
8.3 过滤节点 115
8.4 导出节点 117
8.4.1 设置导出节点的基本选项 117
8.4.2 导出多重字段 118
8.4.3 设置导出规则选项 119
8.4.4 设置导出标记选项 119
8.4.5 设置导出设置节点选项 120
8.4.6 设置导出状态选项 120
8.4.7 设置导出计数选项 121
8.4.8 设置导出条件选项 122
8.5 导出节点 123
8.6 再分类节点 125
8.7 分块节点 126
8.8 分割节点 126
8.9 设置标记节点 127
8.10 调整节点 128
8.11 换位节点 129
8.12 时间间隔节点 129
8.13 历史节点 129
8.14 字段记录节点 131
8.15 SPSS转移节点 131
第9章 建立CLEM表达式 132
9.1 什么是CLEM 132
9.1.1 值及数据类型 132
9.1.2 表达式及条件 133
9.2 使用表达式编辑器 134
9.2.1 获取表达式编辑器 134
9.2.2 构造表达式 135
9.2.3 选择函数 135
9.2.4 选择字段、参数以及全局变量 135
9.2.5 选择变量值 136
9.2.6 检查CLEM表达式 136
9.3 CLEM函数类型 137
9.4 CLEM的常见用法 138
9.4.1 对字符串的操作 138
9.4.2 处理空缺和缺失值 138
9.4.3 处理数字 138
9.4.4 处理时间和日期 139
第10章 图节点 140
10.1 概述 140
10.1.1 层迭图 140
10.1.2 三维图像 142
10.1.3 动画效果 143
10.2 建立图 144
10.2.1 为图设置输出选项 144
10.2.2 设置图外观选项 144
10.3 使用图 145
10.4 点图节点 147
10.4.1 为点图节点设置选项 149
10.4.2 使用点图 151
10.5 分布节点 154
10.5.1 设置分布节点选项 154
10.5.2 使用一个分布图 155
10.6 直方图节点 156
10.6.1 设置直方图节点更多选项 157
10.6.2 使用一个直方图 158
10.7 堆积图节点 161
10.7.1 设置堆积图节点的更多选项 162
10.7.2 堆积图的使用 162
10.8 多点图节点 164
10.8.1 为多点图节点设置选项 164
10.8.2 使用一个多点图 166
10.9 网络图节点 166
10.9.1 设置网络图节点选项 167
10.9.2 设置网络图节点的更多选项 168
10.9.3 网络图节点的外观选项 169
10.10 评估图表节点 173
10.10.1 设置评估图表节点选项 176
10.10.2 设置评估图表的更多选项 177
10.10.3 读取模型评估的结果 178
10.10.4 一个评估图表的使用 179
10.11 时间序列点图 179
10.11.1 时间序列点图设置选项 179
10.11.2 时间序列点图的显示选项 180
10.11.3 时间序列点图的输出选项 181
10.11.4 使用一个时间序列点图 182
第11章 建模节点 183
11.1 概述 183
11.2 建模节点字段选项 184
11.3 二进位分类节点 185
11.3.1 二进位分类节点模型选项 185
11.3.2 二进位节点的高级选项 186
11.3.3 二进位节点的Discard选项 187
11.4 神经网络节点 188
11.4.1 神经网络节点模型选项 188
11.4.2 神经网络节点的附加选项 190
11.4.3 神经网络节点高级选项——快速方法 192
11.4.4 神经网络节点高级选项——多重方法 192
11.4.5 神经网络节点高级选项——修剪方法 193
11.4.6 神经网络节点高级选项——RBFN方法 194
11.4.7 神经网络节点学习比率 195
11.5 C5.0节点 195
11.5.1 C5.0节点模型选项 196
11.5.2 错误归类损失选项 197
11.6 分类回归树节点 198
11.6.1 分类回归树节点模型选项 198
11.6.2 分类回归树节点高级选项 199
11.6.3 分类回归树节点终止选项 200
11.6.4 分类回归树节点先验概率选项 201
11.7 QUEST节点 201
11.7.1 QUEST分类模型选项 201
11.7.2 QUEST高级选项 202
11.7.3 QUEST的成本选项 203
11.8 CHAID 204
11.8.1 CHAID模型选项 204
11.8.2 CHAID高级选项 204
11.8.3 CHAID的成本选项 205
11.9 决策表 206
11.9.1 决策表模型选项 206
11.9.2 决策表高级选项 207
11.10 Kohonen节点 208
11.10.1 Kohonen节点模型选项 209
11.10.2 Kohonen节点高级选项 210
11.11 K-Means节点 211
11.11.1 K-Means节点型选项 211
11.11.2 K-Means节点高级选项 212
11.12 两步聚类节点 213
11.13 时间序列节点 215
11.14 异常探测节点 217
11.14.1 异常探测节点模型选项 217
11.14.2 异常节点高级选项 218
11.15 Apriori节点 218
11.15.1 Apriori节点模型选项 219
11.15.2 Apriori节点高级选项 220
11.16 广义规则归纳节点 221
11.17 Carma规则分析 223
11.17.1 Carma规则的模型选项 223
11.17.2 Carma高级选项 223
11.18 序列节点 224
11.18.1 序列节点字段选项 225
11.18.2 序列节点模型选项 226
11.18.3 序列节点高级选项 227
11.19 因子分析/主成分分析 228
11.19.1 因子分析/主成分分析模型选项 229
11.19.2 因子分析/主成分分析高级选项 230
11.19.3 因子分析/主成分分析旋转选项 231
11.20 特征选择节点 232
11.20.1 特征选择节点的模型选项 232
11.20.2 特征选择节点的附加选项 233
11.21 线性回归节点 234
11.21.1 线性回归节点模型选项 234
11.21.2 线性回归节点高级选项 235
11.21.3 线性回归节点单步选项 236
11.21.4 线性回归节点输出选项 236
11.22 Logistic回归节点 237
11.22.1 Logistic回归节点模型选项 237
11.22.2 Logistic回归节点高级选项 238
11.22.3 Logistic回归节点收敛选项 239
11.22.4 Logistic回归输出选项 240
11.23 判别分析节点 241
11.23.1 判别分析节点模型选项 241
11.23.2 判别分析的高级选项 241
11.24 广义线性模型 242
11.24.1 广义线性模型选项 242
11.24.2 广义线性模型的高级选项 243
第12章 输出节点 247
12.1 概述 247
12.2 使用输出 247
12.3 输出浏览菜单 248
12.4 输出节点输出页签 249
12.5 表格节点 250
12.5.1 表格节点设置页签 250
12.5.2 表格节点格式页签 251
12.5.3 表格浏览器 252
12.6 矩阵节点 254
12.6.1 矩阵节点设置页签 254
12.6.2 矩阵节点外观页签 255
12.6.3 矩阵输出浏览器 256
12.7 分析节点 257
12.7.1 分析节点Analysis页签 257
12.7.2 分析输出浏览器 259
12.8 数据审查节点 260
12.8.1 数据审查节点页签 260
12.8.2 数据审查输出浏览器 262
12.9 转换节点 264
12.9.1 转换节点设置标签 264
12.9.2 转换输出浏览器 265
12.10 统计量节点 266
12.10.1 统计量节点设置页签 266
12.10.2 统计量输出浏览器 267
12.11 均值节点 269
12.11.1 均值节点设置标签 269
12.11.2 均值节点选项标签 270
12.11.3 均值节点输出标签 270
12.11.4 均值节点输出浏览器 271
12.12 报告节点 272
12.12.1 报告节点模板页签 272
12.12.2 报告节点输出浏览器 273
12.13 设置全局节点 273
12.14 SPSS输出节点 274
12.14.1 SPSS程序节点语法页签 275
12.14.2 SPSS程序输出浏览器 275
12.15 数据库输出节点 276
12.16 平面文件节点 277
12.17 SPSS导出节点 279
12.18 SAS导出节点 280
12.19 Excel导出节点 280
12.20 方案发布节点 281
12.21 应用软件帮助 282
第13章 生成模型 284
13.1 概述 284
13.2 在生成模型选项板中利用生成模型进行操作 284
13.3 在数据流中使用生成模型 286
13.4 使用生成模型浏览器 286
13.5 生成二进制分类器 287
13.6 生成网络节点 288
13.6.1 生成的神经网络概要页签 289
13.6.2 从神经网络中生成一个过滤节点 290
13.7 生成C5.0节点 291
13.8 生成C&R决策树 292
13.8.1 决策树模型页签 292
13.8.2 决策树浏览页签 294
13.8.3 决策树概要页签 295
13.8.4 从决策树生成规则集 296
13.9 生成QUEST节点 296
13.10 生成CHAID节点 297
13.11 生成决策表 298
13.12 生成Kohonen节点 299
13.13 生成K-Means节点 300
13.13.1 生成的K-Means模型页签 301
13.13.2 生成的K-Means概要页签 302
13.14 生成两步聚类节点 303
13.14.1 生成的两步聚类模型页签 303
13.14.2 生成的两步概要页签 304
13.15 生成时间序列节点 305
13.16 生成异常探测节点 305
13.17 生成Apriori节点 306
13.18 生成GRI节点 307
13.19 生成Carma节点 308
13.20 生成序列规则序列节点 308
13.20.1 生成的序列规则节点 308
13.20.2 序列规则模型页签 309
13.20.3 序列规则的概要页签 311
13.20.4 从序列规则节点生成规则超级节点 312
13.21 因子分析/主成分分析节点 313
13.21.1 因子分析/主成分分析模型页签 314
13.21.2 因子分析/主成分分析概要页签 314
13.21.3 因子分析/主成分分析高级输出 315
13.22 生成特征选择节点 316
13.23 Logistic回归方程节点 317
13.23.1 Logistic回归方程概要页签 318
13.23.2 高级Logistic回归输出 319
13.24 生成线性回归模型 320
13.24.1 线性回归概要页签 320
13.24.2 线性回归模型的高级输出 321
13.25 判别分析 323
13.26 广义线性回归模型 323
13.27 未精练的规则模型 324
13.27.1 未精练规则的模型页签 324
13.27.2 未精练规则的概要页签 325
13.27.3 生成规则集 326
13.28 生成的规则集节点 327
13.28.1 生成的规则集模型页签 328
13.28.2 生成的规则集概要页签 329
第14章 PMML输出模型 331
14.1 概述 331
14.2 用PMML输出 332
第15章 超级节点 333
15.1 概述 333
15.2 超级节点类型 333
15.3 创建一个超级节点 335
15.3.1 嵌套超级节点 336
15.3.2 有效超级节点举例 337
15.3.3 无效超级节点举例 338
15.4 编辑超级节点 339
15.4.1 修改超级节点的类型 339
15.4.2 注释和重命名超级节点 339
15.4.3 超级节点参数 339
15.4.4 超级节点和暂存 343
15.4.5 超级节点和脚本 343
15.5 保存并装载超级节点 344
第16章 建立项目和报告 346
16.1 项目介绍 346
16.1.1 CRISP-DM浏览窗口 346
16.1.2 Classes浏览窗口 347
16.2 建立项目 347
16.2.1 增加新项目 348
16.2.2 加入到项目中 348
16.2.3 设置项目属性 349
16.2.4 评注项目 350
16.2.5 对象属性 351
16.2.6 关闭项目 352
16.3 建构报告 352
16.3.1 生成报告 353
16.3.2 保存和输出报告 354
第17章 批处理模式 356
17.1 批处理模式一览 356
17.2 在批处理模式下工作 356
17.2.1 软件调用 356
17.2.2 使用命令行参数 356
17.2.3 批处理模式日志文件 357
17.2.4 批处理模式中的脚本编程 357
17.2.5 在批处理模式中使用参数 358
17.2.6 在批处理模式下输出 358
第18章 Clementine 11.0中的脚本编程 359
18.1 脚本编程介绍 359
18.1.1 脚本类型 359
18.1.2 Clementine脚本范例 359
18.2 在用户接口上进行脚本编程 360
18.2.1 在流中使用脚本 360
18.2.2 在超级节点中使用脚本 362
18.2.3 使用独立脚本 363
18.3 以批处理模式编写脚本 364
第19章 Clementine外部模块接口 365
19.1 概述 365
19.2 执行CEMI 365
19.3 系统体系结构 365
19.4 规范说明文件 366
19.4.1 参数 367
19.4.2 外部程序 367
19.4.3 命令行选项 367
19.4.4 编辑对话框 367
19.4.5 输入和输出字段 368
19.4.6 输入和输出文件 368
19.4.7 元文件 368
19.4.8 结果 368
19.4.9 返回代码 368
19.5 限制 368
19.6 规范说明文件范例 369
19.6.1 节点说明 369
19.6.2 核心说明 369
19.6.3 参数 370
19.6.4 执行 371
19.6.5 选项 371
19.6.6 控件 371
19.6.7 输出字段 372
19.6.8 输出数据 373
19.6.9 返回代码 373
19.6.10 完整的规范文件 373
19.7 CEMI节点管理 376
19.7.1 增加CEMI节点 376
19.7.2 清除CEMI节点 377
19.8 编写外部程序的技巧 377
第20章 应用范例 378
20.1 概述 378
20.2 状态监测范例 378
20.2.1 审视数据 379
20.2.2 数据准备 380
20.2.3 学习 381
20.3 测试 382
20.3.1 欺诈探测范例 382
20.3.2 数据采集 383
20.3.3 数据探索 383
20.3.4 训练神经网络 386
20.3.5 总结 388
20.4 零售业范例 388
20.4.1 数据审核 388
20.4.2 学习和测试 390
20.5 市场购物篮分析范例 391
20.5.1 获取数据 391
20.5.2 购物关联分析 392
20.5.3 客户细分 394
20.5.4 小结 396
第21章 ACMR企业数据库挖掘研究 397
21.1 研究背景 397
21.2 操作过程 397
附录A 命令行参数 403
附录B CLEM语言参考 405
附录C 脚本语言参考 421
附录D 节点及流属性 436
附录E CEMI规范文件参考 462
参考文献 487
英文参考文献 488
后记 515