目录 1
第1部分 项目规划阶段 1
第1章 数据可视化和可视化数据挖掘介绍 3
1.1 可视化数据集 4
1.1.1 可视化数据类型 5
1.1.2 可视维与数据维 6
1.2数据可视化工具 7
1.2.1 多维数据可视化工具 8
1.2.2 层次和地形数据可视化工具 17
1.3 可视化数据挖掘工具 20
1.4 小结 21
第2章 步骤1:验证和规划数据可视化和数据挖掘项目 22
2.1 项目类型 23
2.2 项目可行性分析 24
2.2.1 Dayton Hudson公司成功案例 25
2.2.2 Marketing Dynamics成功案例 26
2.2.3 Sprint成功案例 26
2.2.5 可视化数据挖掘的挑战 27
2.2.4 Lowestfarecom成功案例 27
2.3 闭环的业务模型 29
2.3.1 使用闭环业务模型 30
2.4 项目时间表 32
2.5 项目资源和角色 33
2.5.1 数据和业务分析团队 34
2.5.2 领域专家团队 35
2.5.3 决策制定团队 36
2.5.4 操作团队 36
2.5.5 数据仓库团队 37
2.6 项目验证和计划的案例研究 39
2.7 小结 42
第3章 步骤2:识别关键的业务问题 43
3.1 选择关键的业务问题 43
3.1.1 数据挖掘不能解决的问题 44
3.1.2 数据可视化问题定义 44
3.1.3 可视化数据挖掘问题定义 46
3.2 计划投资回报率(ROI)目标 50
3.2.1 决定可视化和数据挖掘分析目标以及成功的条件 53
3.3 问题和目标定义案例研究 55
3.4 小结 56
第2部分 数据预处理阶段 57
第4章 步骤3:选择业务数据集 59
4.1 识别操作型数据 60
4.1.1 探索型数据集市 61
4.1.2 业务数据集 62
4.1.3 数据类型 65
4.1.4 实验单元 66
4.2 从操作型数据源选择字段 71
4.2.1 数据维编码 72
4.2.2 数据维一致性 73
4.2.3 业务规则一致性 74
4.2.4 惟一列 74
4.2.5 重复列 75
4.2.6 关联字段 76
4.2.7 可忽略的字段 76
4.3 ECTL过程的开发和归档 77
4.3.1 数据清洗 79
4.3.2 操作型数据源抽样 84
4.3.3 避免样本偏差 87
4.3.4 可用的ECTL工具 89
4.3.5 ECTL过程归档 89
4.4 选择业务数据集案例研究 91
4.4.1 识别操作型数据源 92
4.4.2 客户文件的ECTL过程 94
4.4.3 客户文件ECTL过程归档 99
4.4.4 合同文件的ECTL过程 101
4.4.6 账单文件的ECTL过程 104
4.4.5 合同文件ECTL过程归档 104
4.4.7 账单文件ECTL构成归档 108
4.4.8 人口统计文件的ECTL过程 108
4.4.9 人口统计文件ECTL过程归档 112
4.4.10 创建业务数据集的过程 113
4.4.11 案例ECTL过程回顾 114
4.5 小结 115
第5章 步骤4:转换业务数据集 116
5.1 逻辑转换的类别 117
5.1.1 表级别的逻辑转换 118
5.1.2 字段级别的逻辑转换 129
5.1.3 逻辑转换归档 136
5.2 客户保留业务数据集逻辑转换的VDM案例研究 139
5.2.1 customer_join业务数据集逻辑转换 141
5.2.2 业务数据集customer_join逻辑转换归档 147
5.2.3 customer_demographic业务数据集逻辑转换 148
5.2.5 案例研究中的逻辑转换过程回顾 152
5.3 小结 152
5.2.4 业务数据集customer_demographic逻辑转换归档 152
第6章 步骤5:验证业务数据集 154
6.1 验证过程 155
6.1.1 验证数据准备操作的完整性 156
6.1.2 验证数据准备操作的逻辑 163
6.2 数据特征分析工具 169
6.3 验证案例学习中的数据集 170
6.3.1 验证ECTL过程 170
6.3.2 验证逻辑转换 179
6.4 小结 181
第3部分 数据分析阶段和其他 183
第7章 步骤6:选择可视化或挖掘工具 185
7.1 选择合适的数据可视化工具 185
7.1.1 多维可视化 187
7.1.2 特殊的地形和层次可视化工具 199
7.2 选择合适的数据挖掘工具 203
7.2.1 哪些数据挖掘工具是可用的 203
7.2.2 有监督和无监督的学习 205
7.2.3 有监督学习工具 206
7.2.4 无监督学习工具 210
7.2.5 数据挖掘工具解决典型问题的情况 213
7.2.6 哪种可用的工具最适合目前的情况 214
7.3 为本案例选择可视化和数据挖掘工具 218
7.3.1 选择数据可视化工具 219
7.3.2 选择数据挖掘工具 223
7.4 小结 226
第8章 步骤7:分析可视化或挖掘工具 227
8.1 分析数据可视化 227
8.1.1 使用频率图发现和评估关键的业务指标 228
8.1.2 使用帕雷托图发现和评估关键业务指标的重要性 235
8.1.3 使用雷达图描绘季节性的趋势和问题区域 238
8.1.4 使用折线图分析时间关系 240
8.1.5 使用散点图评估因果关系 243
8.2 分析数据挖掘模型 248
8.2.1 使用可视化了解核心数据挖掘任务的性能 249
8.3 使用可视化了解和评估有监督学习模型 259
8.3.1 在模型部署之后使用可视化 262
8.4 分析案例中的可视化和数据挖掘工具 263
8.4.2 使用帕雷托图发现和评估关键业务指标的重要性 265
8.4.1 使用带有趋势线的频率图分析时间关系 265
8.4.3 使用散点图评估因果关系 268
8.4.4 使用数据挖掘进一步认识客户流失问题 269
8.5 小结 283
第9章 步骤8:验证和展示可视化或挖掘模型 284
9.1 验证数据可视化和挖掘模型 284
9.1.1 验证业务数据集的逻辑转换 285
9.1.2 验证你的业务假设 286
9.2 组织和创建业务展示 286
9.2.1 业务展示部分 287
9.2.2 要求采取行动 291
9.3 VDM项目的实施阶段 292
9.4 验证和展示分析结果的案例研究 295
9.4.1 验证对业务数据集所做的逻辑转换 295
9.4.2 验证业务假设 296
9.4.3 业务展示 296
9.5 小结 302
第10章 可视化数据挖掘的未来 303
10.1 项目计划阶段 304
10.2 数据准备阶段 305
10.3 数据分析阶段 310
10.4 商业可视化数据挖掘软件的趋势 312
10.4.1 更多的图表种类和用户自定义的布局 313
10.4.2 允许用于进行交互的动态可视化 315
10.4.3 可视化数据结构的大小和复杂性 316
10.4.4 工具间交换信息的标准 316
10.5 小结 317
词汇表 318