第一部分 数据挖掘对CRM的影响 1
第一章 客户关系 3
1.1 介绍 3
1.2 什么是数据挖掘 4
1.3 一个例子 4
1.4 与商业过程的关联 5
1.5 数据挖掘和客户关系管理 6
1.5.1 数据挖掘是如何辅助基于数据库的销售的 7
1.5.2 评分 7
1.5.3 活动管理软件的作用 7
1.5.4 增加客户在整个生命周期里的价值(Lifetime Value) 7
1.5.6 评估数据挖掘模型带来的好处 8
1.5.5 数据挖掘和活动管理的结合 8
第二章 用联系的观点看数据挖掘和数据仓库 9
2.1 介绍 9
2.2 数据挖掘和数据仓库——联系 9
2.3 数据仓库综述 10
2.3.1 数据仓库ROI 11
2.3.2 操作和信息数据存储 11
2.3.3 数据仓库的定义和特性 14
2.3.4 数据仓库的体系结构 15
2.3.5 数据仓库访问和客户/服务器体系结构 17
2.4 数据挖掘 18
2.4.1 数据挖掘定义 18
2.4.3 数据挖掘的分类和研究重点 19
2.4.2 数据挖掘的应用领域 19
3.1 介绍 23
3.2 最有利可图的客户 23
第三章 客户关系管理 23
3.3 客户关系管理 24
3.3.1 以客户为中心的数据库 25
3.3.2 管理活动 26
3.4 推销活动的演变 27
3.5 封闭循环的推销 27
3.6 CRM体系结构 28
3.7 下一代CRM 28
第二部分 基础——技术和工具 29
4.2 整体体系结构 31
第四章 数据仓库部件 31
4.1 介绍 31
4.3 数据仓库型的数据库 32
4.4 寻找、获取、清理和转换工具 33
4.5 元数据 33
4.6 访问工具 35
4.6.1 评估和可视化信息 35
4.6.2 工具分类 37
4.6.3 查询和报表工具 37
4.6.4 应用软件 38
4.6.5 OLAP工具 38
4.6.6 数据挖掘工具 38
4.7 数据集市 39
4.8 数据仓库的经营和管理 41
4.9 Web的影响 41
4.10 利用Web的方法 42
4.11 设计选项和问题 43
第五章 数据挖掘 49
5.1 什么是数据挖掘 49
5.2 数据挖掘不是什么 50
5.2.1 统计 50
5.2.2 OLAP 50
5.2.3 数据仓库 50
5.3 数据挖掘已经成熟 50
5.4 数据挖掘的潜力是巨大的 51
5.5 从你过去的错误中学习 52
5.6 我不需要数据挖掘——我已有了统计分析 53
5.7 测量数据挖掘的效力——准确性、速度和代价 53
5.8 将数据挖掘嵌入到你的业务处理中 55
5.9 改变的东西越多、保留不变的也越多 55
5.10 发掘与预测 56
5.10.1 塔尔沙漠中的黄金 56
5.10.2 发掘——发现你尚未寻找到的东西 56
5.10.3 预测 57
5.11 过适应 57
5.12 行业状态 57
5.12.4 研究分析家的工具 58
5.12.3 商业分析家的工具 58
5.12.2 商业工具 58
5.12.1 目标解决方案 58
5.13 数据挖掘方法学 59
5.13.1 模式和模型各是什么 59
5.13.2 模式的可视化 60
5.13.3 术语说明 62
5.13.4 对知识和智慧的说明 63
5.13.5 取样 63
5.13.6 随机取样 64
5.13.7 验证模型 64
5.13.8 选择最好的模型 65
5.14 数据挖掘应用的类型 66
6.2 统计 67
第六章 经典技术:统计、近邻、聚类 67
6.1 经典 67
6.2.1 统计和数据挖掘之间有什么不同之处 68
6.2.2 什么是统计 68
6.2.3 数据、计算和概率 69
6.2.4 柱状图 69
6.2.5 为预测而做的统计 71
6.2.6 线性回归 71
6.2.7 如果数据中的模式看起来不像一条直线怎么办 72
6.3 最近邻 73
6.3.1 一个聚类的简单例子 73
6.3.2 一个最近邻的简单例子 73
6.3.4 在商业中最近邻技术应用在何处 74
6.3.3 怎样应用最近邻来做预测 74
6.3.5 在股票市场上应用最近邻技术 75
6.3.6 为什么投票选举更好——K近邻 75
6.3.7 最近邻如何能告诉你对预测有多大的可信性 76
6.4 聚类 76
6.4.1 聚类 76
6.4.2 发现不能匹配的例子——对局外点的聚类 77
6.4.3 聚类和最近邻怎样地相像 77
6.4.4 怎样用聚类和最近邻来作出预测 77
6.4.5 还有其他聚类的正确方法吗 78
6.4.6 如何权衡哪条记录该属于哪一簇 79
6.4.7 聚类是在相似的簇和较少数量的簇之间的折中方法 79
6.4.10 怎样定义聚类和最近邻的空间 80
6.4.8 聚类和最近邻预测之间有什么不同之处 80
6.4.9 n维空间是什么 80
6.4.11 分层聚类和不分层聚类 81
6.4.12 不分层聚类 82
6.4.13 分层聚类 82
6.5 选择典型的技术 84
第七章 下一代技术:树、网络和规则 85
7.1 下一代 85
7.2 决策树 85
7.2.1 什么是决策树 85
7.2.2 把决策树看作是有目的的分割 86
7.2.3 决策树在业务中的应用 86
7.2.7 决策树用于预测 87
7.2.6 决策树用于数据预处理 87
7.2.4 决策树可以用在哪里 87
7.2.5 决策树用于勘测 87
7.2.8 第一步是产生树 88
7.2.9 好问题与坏问题之间的区别 88
7.2.10 树何时停止生长 88
7.2.11 数据不够时决策树算法为什么要停止生长树 88
7.2.12 建好树并不意味着决策树的完成 89
7.2.13 ID3及其改进——C4.5 89
7.2.14 CART——生成森林和挑选最优树 90
7.2.15 CART自动验证树 90
7.2.16 用CART替代属性来处理缺少的数据 90
7.2.17 CHAID 90
7.3.2 神经元网络不是通过学习能得到更好的预测吗 91
7.3 神经元网络 91
7.3.1 什么是神经元网络 91
7.3.3 神经元网络简单易用吗 92
7.3.4 神经元网络在业务中的应用 92
7.3.5 什么地方使用神经元网络 93
7.3.6 神经元网络用于聚类 93
7.3.7 神经元网络用于奇异分析 93
7.3.8 神经元网络用于特征抽取 93
7.3.9 神经元网络是什么样的 94
7.3.10 神经元网络如何进行预测 95
7.3.11 神经元网络模型是如何建立的 95
7.3.14 隐藏节点中进行的学习 96
7.3.12 神经元网络模型有多复杂 96
7.3.13 对输出节点来说隐藏节点就像是值得信赖的顾问 96
7.3.15 在组织中分享责备与荣耀 97
7.3.16 不同类型的神经元网络 97
7.3.17 Kohonen特征图 98
7.3.18 神经元网络与人脑有多相似 98
7.3.19 防止过适应——使模型应用范围更广 98
7.3.20 对网络进行解释 99
7.4 规则归纳 99
7.4.1 规则归纳在业务中的应用 100
7.4.2 什么是规则 100
7.4.3 如何应用规则 101
7.4.4 规则并不表示因果关系 101
7.4.5 用于规则归纳的数据库类型 102
7.4.6 一般思想 103
7.4.7 正确率和覆盖率的商业重要性 103
7.4.8 正确率和覆盖率之间的权衡就像赌马 104
7.4.9 如何评价规则 104
7.4.10 定义“兴趣度” 105
7.4.11 有用度的其他定义 105
7.4.12 规则与决策树的比较 106
7.4.13 决策树与规则归纳系统的另一个共同特点 106
7.4.14 什么时候用哪种技术 107
7.4.15 权衡勘查与利用 107
8.2.1 数据挖掘过程 109
8.2 使用正确的技术 109
8.1 介绍 109
第八章 什么时候使用数据挖掘 109
8.2.2 决策树与最近邻方法有何相似之处 111
8.2.3 规则用于归纳什么地方与决策树相似 111
8.2.4 如何用神经元网络做连接分析 112
8.3 业务处理中的数据挖掘 112
8.3.1 避免数据挖掘中的错误 113
8.3.2 理解数据 114
8.4 嵌入式数据挖掘 116
8.4.1 分布式业务处理的代价 118
8.4.2 衡量数据挖掘工具的最佳方法 119
8.4.3 嵌入式数据挖掘 120
8.5.1 衡量正确率 122
8.5 如何衡量正确率、可解释性和集成度 122
8.5.2 衡量可解释性 123
8.5.3 衡量集成度 123
8.6 嵌入式数据库挖掘的前景如何 124
第三部分 商业价值 125
第九章 客户盈利能力分析 127
9.1 介绍 127
9.2 为什么要计算客户盈利能力 128
9.3 忠诚度在客户盈利能力上的作用 128
9.4 客户忠诚度和复合效应法则 129
9.5 什么是客户关系管理 129
9.6 通过数据挖掘技术使客户盈利能力最大化 129
9.7 预测未来的盈利能力 130
9.8 预测客户盈利能力的变化 131
9.9 以客户盈利能力为导向的市场策略 131
9.10 为什么只计算营业收入是不够的 132
9.11 增量客户盈利能力 133
9.12 什么是增量客户盈利能力 133
9.13 让销售人员停止推销 134
9.14 如何系统地开始应用 135
9.15 用替代品通常比什么都不用更糟 136
9.16 圣杯 136
9.17 如何评估数据挖掘技术的价值 137
10.1 介绍 139
第十章 客户的获取 139
10.2 数据挖掘和统计模型如何发挥作用 140
10.3 一些关键概念的定义 140
10.4 一切从数字开始 142
10.5 试验活动 142
10.6 评估试验活动 143
10.7 用反应行为模式建立数据挖掘模型 143
第十一章 交叉营销 145
11.1 介绍 145
11.2 如何进行交叉营销 146
11.3 处理步骤 146
11.4.1 建模阶段 148
11.4.2 评分阶段 148
11.4 开始分析 148
11.4.3 优化阶段 149
11.5 多种服务 153
第十二章 客户的保持 155
12.1 介绍 155
12.2 移动电话业的客户流失 156
12.3 用到的数据挖掘技术 158
12.4 案例分析-移动通信业的客户保持 158
12.4.1 数据 158
12.4.2 定义预测目标 159
12.4.3 实施数据挖掘 159
12.4.4 数据挖掘模型 159
12.5 商业实施 162
12.6 结果 163
12.7 经验教训 164
12.7.1 令人惊讶的结果 165
12.7.2 改变预测模式的目标 165
12.7.3 其它的数据源亦能提供帮助 165
12.7.4 考虑客户价值 165
12.7.5 关于保留团队和其他市场努力 165
12.8 其他行业中的客户保持 166
第十三章 客户的细分 167
13.1 介绍 167
13.2 什么是细分 167
13.4 与“一对一”市场的区别 168
13.5 什么是数据驱动的细分 168
13.3 细分的意义是什么 168
13.6 如何完成数据驱动细分 169
13.7 细分的不同用途 170
13.7.1 了解你的业务并执行一个策略 170
13.7.2 人口统计学细分 170
13.7.3 心理学细分 170
13.7.4 目的性细分 171
13.8 细分完成的方法 171
13.9 数据挖掘如何运用到细分上来 171
13.10 用集成数据驱动细分 172
13.11.3 改变市场细分 173
13.11.2 正确使用它们 173
13.11.1 市场细分是公司的共用语言 173
13.11 引入和去除细分模式 173
13.12 案例分析 174
13.13 参考文献 175
第四部分 建立解决方案的关健 177
第十四章 建立商业案例 179
14.1 介绍 179
14.1.1 数据挖掘很复杂 179
14.1.2 你如何知道已经取得了成功 180
14.1.3 商业战略的根本转变 180
14.2 发现公司对数据挖掘的需要 180
14.2.1 执行得不好的CRM或者简单的促销活动管理 180
14.3.2 利润 181
14.3.1 收益的增长 181
14.2.3 缺乏将客户转移到高价值群体的能力 181
14.3 定义商业价值 181
14.2.2 不相称的客户投资和客户价值 181
14.3.3 降低成本 182
14.3.4 投资回报率(ROI) 182
14.3.5 竞争优势 183
14.3.6 成为早的采纳者 183
14.4 成本 183
14.4.1 数据 183
14.4.2 基础设施的成本 184
14.4.3 人力成本 184
14.5 创建商业案例 185
14.4.5 控制成本:利用已有的投资 185
14.4.4 维护成本 185
第十五章 在CRM中应用数据挖掘系统 187
15.1 介绍 187
15.2 启动一个数据挖掘应用的10个步骤 187
15.3 问题定义 188
15.3.1 找到关键环节 188
15.3.2 定义可交付系统的标准 189
15.3.3 选择明确的小问题 189
15.3.4 理解已有的CRM流程 190
15.4 用户定义 190
15.4.1 为每一个用户建立个人资料 191
15.4.2 利用快速启动程序培训未来的用户并了解用户的需求和愿望 191
15.5.1 定位数据字典 192
15.5 数据定义 192
15.5.2 找到数据情报员 193
15.5.3 指标定义 193
15.6 真正地定义数据 194
15.6.1 评估数据完整性的符合程度 194
15.6.2 验证数据源 194
15.7 控制项目的范围 194
15.7.1 用文档来控制项目范围的平稳扩大 195
15.7.2 控制数据清洗的范围 195
15.7.3 控制数据转移、建模和存储的范围 195
15.7.4 控制数据挖掘的范围 195
15.7.5 控制试验性设计和评价的成本 195
15.8.2 从小的系统开始但要完成全过程 196
15.8 试验 196
15.8.1 不要等待太久 196
15.9 质量保证 197
15.9.1 使质量保证成为一个程序 197
15.9.2 验证和传达模型的结果 197
15.10 教育培训 198
15.11 发布 198
15.11.1 选择第一批用户 198
15.11.2 在得到全部结果前保守秘密 199
15.11.3 协助用户解释所得结果 199
15.12 持续的过程 199
15.13 结论——使数据挖掘成为业务流程的一部分 200
16.2 三种类型客户数据 201
第十六章 收集客户数据 201
16.1 介绍 201
16.2.1 描述性数据 202
16.2.2 市场促销活动的数据 203
16.2.3 客户交易数据 203
16.3 收集客户数据 203
16.3.1 内部数据源 204
16.3.2 Web数据 204
16.4 连接客户数据 205
16.4.1 数据仓库和数据集市 205
16.4.2 数据泵和连接器 205
16.4.3 远距离连结 206
16.6 隐私和数据挖掘技术 207
16.5 客户数据和隐私 207
16.7 处理隐私问题的方针 208
16.7.1 匿名和身份信息 208
16.7.2 具体数据与汇总数据 209
16.7.3 信息用于市场定位或评估 209
16.7.4 合并数据源 210
16.7.5 匿名系统结构 210
16.8 与数据挖掘有关的法律问题 210
第十七章 为客户评分 213
17.1 介绍 213
17.2 评分过程 214
17.3 评分系统结构和配置 215
17.4 准备数据 216
17.4.2 偏移映射 217
17.4.1 直接映射 217
17.5 将评分过程与其他应用集成 218
17.5.1 创建模型 218
17.5.2 动态地给数据评分 219
第十八章 优化CRM过程 221
18.1 介绍 221
18.2 通过优化提高客户收益率 222
18.3 为什么不优化客户关系 223
18.4 控制要优化的对象 224
18.5 为什么现在可以 224
18.6 优化了的CRM 225
18.8 最佳的CRM过程:评价、预测和行动 226
18.7 完整的过程 226
18.9 促销优化不是什么 227
18.10 使用数据挖掘技术来优化CRM客户关系管理系统 228
18.11 优化技术 228
第十九章 对数据挖掘和CRM工具市场的看法 231
19.1 介绍 231
19.2 数据挖掘市场 231
19.3 数据挖掘工具的分类 232
19.4 工具评估:属性和方法学 233
19.5 工具评估 234
19.5.1 Clementine(SPSS) 234
19.5.2 4Thought和Scenario(Cognos) 235
19.5.3 Darwin(Oracle) 237
19.5.4 Database Mining Workstation(HNC) 239
19.5.5 Decision Series(Neo Vista) 240
19.5.6 Enterprise Miner(SAS) 242
19.5.7 Intelligent Miner(IBM) 243
19.5.8 KnowledgeSEEKER and Knowledge Studio(Angoss) 245
19.5.9 Model 1 and Pattern Recognition Workbench(Unica) 246
19.6 别的数据挖掘工具 248
19.7 客户关系管理工具 249
19.7.1 个性化工具 249
19.7.2 市场活动管理/行销工具 250
19.7.3 销售自动化和客户服务工具 251
20.1 商业智能和信息挖掘 253
第二十章 有效进行客户关系管理的下一代信息挖掘和知识发现技术 253
20.2 文本挖掘和知识管理 254
20.3 文本挖掘的好处 255
20.4 文本挖掘技术 255
20.4.1 互联网搜索 255
20.4.2 文本分析 256
20.4.3 语义网络和其他技术 256
20.5 文本挖掘产品 257
20.6 使用人脑的力量 261
20.7 结论 264
20.7.1 知识管理 264
20.7.2 电子商务世界中的客户关系管理 264
20.7.3 应用服务提供商 266
附录 术语表 269