第1部分 本书焦点 3
第1章 数据挖掘概述 3
1.什么是数据挖掘? 4
2.数据挖掘能做什么? 5
分类 5
估计 5
预测 6
组合或关联法则 6
聚类 6
描述与可视化 7
3.商业领域的数据挖掘 7
作为研究工具的数据挖掘 7
改进生产过程的数据挖掘 8
市场营销中的数据挖掘 8
客户关系管理中的数据挖掘 9
4.技术层面的数据挖掘 9
数据挖掘与机器学习 9
数据挖掘与统计学 10
数据挖掘与决策支持 10
数据挖掘与计算机技术 12
5.数据挖掘的社会背景 12
第2章 为什么要精通数据挖掘这门艺术 14
1.数据挖掘的四种方法 15
购买评分 16
购买软件 16
聘请编外专家 22
培养企业内部骨干 24
本章小结 25
第3章 数据挖掘方法论:互动循环系统 26
1.数据挖掘的两种类型 27
有监督的数据挖掘 27
无监督的数据挖掘 28
2.数据挖掘的互动循环过程 29
3.正确识别业务问题 30
实施数据挖掘是否必要? 31
是否存在最让人感兴趣的客户子群或客户细分? 31
相应的行业规范有哪些? 31
关于数据 31
印证业内专家的观点 32
4.将数据转换成可操作的决策 32
确认和获取数据 32
生成有效数据、探索数据以及清洁数据 34
将数据转换成具有合适的粒度的数据 35
加入衍生变量 36
准备建模数据集 36
选择建模技术和训练模型 37
检测模型的执行效率 37
5.将结果生成决策 39
6.评测模型的有效性 40
7.成功建立预测模型的要点 41
预测模型的时间范围 41
模型的使用有效期 42
假定1:过去是将来的预言家 42
假定2:数据是可以获得的 43
假定3:数据中应包括我们的预期目标 44
本章小结 44
第4章 客户和他们的生命周期 46
1.谁是企业的客户 46
消费者 47
企业客户 48
客户市场细分 50
2.客户的生命周期 51
客户生命周期的不同阶段 52
客户生命周期中的重要事件 53
客户生命周期中不同的时段所产生的资料 55
3.客户的生理生命周期 56
4.选择最佳时机,锁定最佳客户 57
预算最优化 57
促销活动最优化 59
客户最优化 61
本章小结 64
第2部分 数据挖掘的三大支柱 71
第5章 数据挖掘技术与算法 71
1.不同的目标要求不同的技术 71
不同的数据类型要求不同的方法 73
2.三种数据挖掘技术 73
3.自动类别侦测 74
K—均值类别侦测的工作原理 74
选择聚类所产生的后果 77
4.决策树 79
决策树的工作原理 79
决策树的建立过程 81
选择决策树所产生的后果 85
5.神经网络 85
神经网络的训练 89
选择神经网络所产生的后果 90
本章小结 91
第6章 无所不在的数据 92
1.数据结构 93
行 93
列 95
数据挖掘中列的作用 97
数据挖掘中的数据 99
2.数据看起来究竟像什么? 100
数据从哪里来 100
粒度的合适水平 105
度量数据取值的不同方法 107
3.多少数据才足够呢? 110
4.衍生变量 111
使用衍生变量时应该注意的问题 112
离群点的处理 112
列变量的组合 113
分类汇总 114
从某一列中提取信息 115
时间序列 117
5.案例:客户行为的界定 119
6.受污染的数据 125
缺失数据 125
定义模糊 126
谬误值 126
本章小结 127
第7章 建立有效的预测模型 129
1.建立好的预测模型 129
预测模型的建立过程 130
对模型效果的衡量 131
模型稳定性 135
保持模型稳定性所面临的挑战 136
2.对模型集进行处理 136
分割与掌握:训练集、测试集与评价集 137
模型集规模对模型效果的影响 137
模型集密度对模型效果的影响 138
抽样 138
何谓过抽样? 139
利用时间相关资料来建立模型 142
模型输入和模型输出 144
执行时间:考虑模型的建立时间 145
时间和遗漏数据 148
建立时间上易于转换的模型 149
字段命名 151
3.使用多个模型 151
多个模型的表决 152
将输入分段 155
对模型进行组合的其他原因 156
4.做试验! 157
模型集 158
不同类型的模型以及模型参数 158
时间范围 159
本章小结 160
第8章 实施控制:建立数据挖掘环境 161
1.起步 161
何谓数据挖掘环境? 162
四个案例研究 162
数据挖掘环境得以成功的要素 162
2.案例1:建造公司内部核心竞争力 163
保险行业的数据挖掘 163
开端 164
3.案例2:创造新的商机 166
向网上发展 166
环境 167
潜在客户的数据仓库 167
下一个步骤 169
4.案例3:在数据仓库工作中培养数据挖掘技能 169
特殊类型的数据仓库 169
数据挖掘的计划 171
信息技术部门内部的数据挖掘 171
5.案例4:利用特斯拉快速建模环境法(RME)进行数据挖掘 172
建立高级数据挖掘环境所需的条件 172
什么是RME? 173
RME如何运作? 173
RME如何协助数据准备 175
RME如何支持抽样 176
RME如何协助建立模型 177
RME如何协助模型评估和管理 177
本章小结 179
第3部分 案例研究 186
第9章 数据挖掘在目录直销业中的应用——有谁会需要香油袋和长裤拉伸器? 186
1.佛蒙特乡村小店 186
VCS的发家史 187
预测模型 189
2.商业问题 189
3.数据 191
4.技术路线 192
数据挖掘软件的选择 192
RFM与细分的基础 192
挑战者——神经网络、决策树和回归分析 194
决定可能已经发生的事 196
计算投资回报率 196
5.未来 196
期望收益 197
本章小结 197
第10章 数据挖掘在在线银行业中的应用——顾客垂青的下一个产品是什么? 198
1.获取利润 198
2.商业问题 199
3.数据 200
从账户到客户 202
推出产品 204
4.解决问题的方法 206
标准分数 206
如果走起来像只鸭 207
这个方法的陷阱 208
5.建模 209
决策树模型 211
建立其他模型 218
得到交叉销售模型 218
6.更完美的世界 219
本章小结 220
第11章 数据挖掘在无线通信业中的应用——客人,您慢些走! 221
1.无线通信业 222
一个快速成熟的行业 222
与其他行业的区别 223
2.商业问题 224
项目背景 224
无线通信市场的特点 225
何为流失? 225
为什么建立流失模型有用? 226
三个目标 227
建立流失模型的方法 228
项目简介 230
3.实际应用——寻找流失模型 230
建模工具的选取 231
对模型进行分类 231
最终的四个模型 232
选择建模算法 235
模型集的大小和密度 239
潜伏期的影响(或考虑实际应用) 240
及时更新模型 241
4.数据 242
基本客户模型 243
从通电话到数据 243
顾客历史流失率 244
客户及账单层次的数据 244
服务端数据 245
付费历史资料 245
变量剔除 245
衍生变量 246
5.建立客户流失模型的经验 247
寻找最显著的变量 247
听取用户意见 247
听取数据的声音 247
包含历史流失率 248
构造模型集 249
为流失管理应用建立模型 251
由数据决定模型参数 251
理解算法和工具 251
本章小结 251
第12章 数据挖掘在电信业中的应用——以客户为中心 253
1.数据流程 254
什么是数据流程? 254
基础操作 255
并行环境下的数据流程 256
数据流程为何有效率? 258
2.业务问题 258
项目背景 258
重要的市场营销问题 259
3.数据 259
通话明细数据 260
客户数据 261
辅助文件 264
4.发现之旅 264
在通话记录中能发现什么? 264
每日时段通话分析 266
通话的市场细分 268
国际长途模式 271
什么时候使用者在家? 274
因特网服务的提供者 276
专用网络 276
同时发生的通话 279
本章小结 282
第13章 谁正在买什么?——超市内的数据挖掘应用 283
1.行业发展趋势 283
超市作为信息中介商 285
将重心从商品转换到客户 285
2.三个案例 287
3.分析不同人种的购买模式 287
商业背景 287
数据 288
可视化工具的成功 289
一个失败的方法 290
恰好与事实相符 291
4.谁在超市购买酸奶? 293
商业背景 293
数据 294
从杂货到客户 299
寻找顾客聚类 299
将聚类结果应用到业务中 302
5.谁在健康食品店购买肉? 303
购物篮分析用的关联规则 306
人比杂货店更令人感兴趣 307
本章小结 308
第14章 不浪费、不短缺:改善生产流程 310
1.唐纳利父子公司用以降低成本的数据挖掘技术 310
技术问题 311
商业问题 311
数据 312
归纳滚筒条纹惯例 315
印刷厂的改变 316
长期影响 317
2.时代公司减少纸张损耗的努办 317
商业问题 318
数据 320
解决问题的方法 322
浪费的种类 323
可避免的浪费 325
可避免浪费的归纳规则 325
数据转换 325
数据的特性描述和概要 327
决策树 327
关联规则 330
综合 330
本章小结 331
第15章 社会议题:数据挖掘与隐私权 332
1.隐私棱镜 333
2.数据挖掘是一种威胁吗? 334
3.对隐私的期望 335
隐私的重要性 336
4.现实世界中的信息 339
5.电子世界中的信息 340
分辨客户 341
综合 342
6.数据挖掘的希望 344
索引 347