《数据挖掘实践》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:(美)Olivia Parr Rud著;朱扬勇等译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2003
  • ISBN:7111122216
  • 页数:315 页
图书介绍:本书详细介绍了新的数据挖掘技术——数据建模,并着重阐述了模型的开发过程。

第一部分 计划菜单 3

第1章 设立目标 3

1.1 定义目标 4

1.1.1 特征分析 7

1.1.2 划分 7

1.1.3 响应 7

1.1.4 风险 8

1.1.5 激活 9

1.1.6 交叉销售和提升销售 9

1.1.7 流失 9

1.1.8 净现值 10

1.1.9 生命周期价值 10

1.2 选择建模方法 10

1.2.1 线性回归 11

1.2.2 逻辑回归 13

1.2.3 神经网络 14

1.2.4 遗传算法 15

1.2.5 分类树 16

1.3 自适应公司 17

1.3.1 雇佣和合作 18

1.3.2 以产品为中心与以客户为中心 19

1.4 小结 19

第2章 选择数据源 21

2.1 数据类型 21

2.1.1 人口统计学数据一般描述个人或家庭特性 21

2.1.2 行为数据是行动或行为的一种度量 22

2.1.3 心理或态度数据以观点、生活方式特性或个人价值为特征 22

2.2 数据源 23

2.2.1 内部数据源 23

2.2.2 外部数据源 30

2.3 选择建模数据 31

2.3.1 潜在客户数据 31

2.3.2 客户模型数据 34

2.3.3 风险模型数据 36

2.4 构造建模数据集 37

2.4.1 如何确定样本尺寸 37

2.4.2 采样方法 38

2.4.3 根据已建立模型的数据开发模型 39

2.4.4 集成多个宣传活动的数据 40

2.5 小结 40

第二部分 烹调演示 43

第3章 准备数据 43

3.1 访问数据 43

3.1.1 数据分类 45

3.1.2 读原始数据 46

3.2 创建建模数据集 48

3.3 清理数据 50

3.3.1 连续变量 50

3.3.2 类别变量 59

3.4 小结 59

第4章 选择及转换变量 61

4.1 定义目标函数 61

4.1.1 激活概率 62

4.1.2 风险指数 63

4.1.3 产品收益率 63

4.1.4 营销费用 63

4.2 派生变量 63

4.2.1 概化 63

4.2.2 比率 64

4.2.3 日期 64

4.3 变量归约 65

4.3.1 连续变量 65

4.3.2 类别变量 68

4.4 开发线性预测因子 74

4.4.1 连续变量 75

4.4.2 类别变量 82

4.5 相互作用检测 84

4.6 小结 85

第5章 处理和评价模型 87

5.1 处理模型 87

5.1.1 分割数据 89

5.1.2 方法1:单模型 93

5.1.3 方法2:双模型——响应 102

5.1.4 方法2:双模型——激活 103

5.1.5 方法1与方法2的比较 104

5.2 小结 107

第6章 验证模型 109

6.1 收益表与收益图 109

6.1.1 方法1:单模型 109

6.1.2 方法2:双模型 111

6.2 为备用数据集评分 113

6.3 重新采样 116

6.3.1 折叠 116

6.3.2 自引导 121

6.4 关键变量的十分位数分析 128

6.5 小结 130

第7章 实施与维护模型 131

7.1 为新文件评分 131

7.1.1 内部评分 131

7.1.2 外部评分与审计 135

7.2 实施模型 140

7.2.1 计算财务状况 140

7.2.2 决定文件分割点 143

7.2.3 卫冕者与挑战者 144

7.2.4 双模型矩阵 145

7.3 模型跟踪 147

7.4 模型维护 153

7.4.1 模型寿命 153

7.4.2 模型记录 154

7.5 小结 155

第三部分 每个节日的菜肴配方 159

第8章 了解你的客户:特征化和划分 159

8.1 为什么了解客户很重要 159

8.2 目录服务公司客户的特征化和渗透分析 164

8.2.1 RFM分析 164

8.2.2 渗透分析 167

8.3 为信用卡公司开发客户价值矩阵 171

8.4 执行聚类分析以发现客户划分 175

8.5 小结 176

第9章 定位新的潜在客户:响应建模 181

9.1 定义目标 181

9.2 准备变量 183

9.2.1 连续变量 184

9.2.2 类别变量 190

9.3 处理模型 192

9.4 用自引导验证 197

9.5 实现模型 200

9.6 小结 201

第10章 避免高风险客户:风险建模 203

10.1 信用评分和风险建模 203

10.2 定义目标 205

10.3 准备变量 206

10.4 处理模型 214

10.5 验证模型 218

10.6 实现模型 220

10.7 另一种风险:欺诈 222

10.8 小结 222

第11章 留住创利客户:流失建模 225

11.1 客户忠诚度 225

11.2 定义目标 226

11.3 准备变量 230

11.3.1 连续变量 230

11.3.2 类别变量 233

11.4 处理模型 234

11.5 验证模型 236

11.6 实现模型 239

11.6.1 建立流失客户特征 240

11.6.2 优化客户创利能力 241

11.6.3 提前保留客户 243

11.7 小结 243

第12章 定位创利客户:生命周期价值建模 245

12.1 什么是生命周期价值 245

12.1.1 使用生命周期价值 246

12.1.2 生命周期价值的组成 247

12.2 生命周期价值的应用 249

12.3 为可续约产品或服务计算生命周期价值 252

12.4 计算生命周期价值:案例研究 252

12.4.1 案例研究:第一年净收入 253

12.4.2 生命周期价值计算 260

12.5 小结 264

第13章 快餐:Web建模 265

13.1 Web挖掘和Web建模 265

13.1.1 定义目标 266

13.1.2 Web数据源 266

13.1.3 准备Web数据 268

13.1.4 选择方法学 269

13.2 在Web上建立品牌 275

13.3 实时洞察客户 276

13.4 Web使用挖掘——案例研究 277

13.5 小结 280

附录A 连续变量的单变量分析 283

附录B 类别变量的单变量分析 307

附录C 推荐阅读材料 315