《数据挖掘Clementine应用实务》PDF下载

  • 购买积分:16 如何计算积分?
  • 作  者:谢邦昌主编
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2008
  • ISBN:7111235770
  • 页数:516 页
图书介绍:

第1章 数据挖掘简介 1

1.1 何谓数据挖掘 2

1.2 数据仓库、KDD、数据挖掘的关系 2

1.3 数据挖掘的应用 3

1.4 数据挖掘的进行步骤 6

1.5 个案研究 7

1.6 数据挖掘的分析方法 9

1.6.1 分类 10

1.6.2 决策树 10

1.6.3 回归 11

1.6.4 时间序列 11

1.6.5 聚类 12

1.6.6 关联规则 12

1.6.7 顺序规则 12

1.6.8 其他分析方法 12

1.7 数据挖掘的运用理论与实际运用功能 13

1.8 数据挖掘软件 14

1.9 数据挖掘在CRM中扮演的角色 19

1.9.1 客服中心是顾客关系管理的火车头 20

1.9.2 从客服中心角度看顾客关系管理 21

第2章 Clementine 11.0简介 29

2.1 Clementine的安装与启动 29

2.1.1 安装Clementine 11.0 29

2.1.2 启动Clementine 11.0 31

2.2 Clementine 11.0一览 32

2.2.1 Clementine 11.0界面 32

2.2.2 在Clementine 11.0中使用鼠标 35

2.2.3 利用快捷键 35

2.2.4 Clementine 11.0中获得帮助 36

2.3 Clementine选项设置 37

2.3.1 系统选项 37

2.3.2 默认目录的设置 37

2.3.3 用户选项的设置 38

2.4 Clementine自动化 41

2.5 Clementine 11.0版本的新功能 41

2.5.1 商业品质的图形展示 42

2.5.2 改进的SPSS输出节点 42

2.5.3 增强的数据审核节点 43

2.5.4 增强的数据变换节点 43

2.5.5 优化分块节点 44

2.5.6 SPSS转换节点 44

2.5.7 改进的数据挖掘模型和算法 44

2.5.8 运行效率、安全性和远程部署 46

第3章 数据挖掘入门 47

3.1 数据挖掘回顾 47

3.2 机器学习技术 47

3.2.1 神经网络 47

3.2.2 规则归纳 48

3.2.3 Kohonen网络 49

3.2.4 关联规则 49

3.2.5 统计模型 51

3.2.6 聚类模型 51

3.3 潜在数据挖掘应用评估 52

3.4 数据挖掘的策略 53

3.5 数据挖掘中的小技巧 55

第4章 构建数据流 56

4.1 概述 56

4.2 建立数据流 56

4.2.1 节点的操作 56

4.2.2 数据流的操作 53

4.2.3 执行数据流 69

4.2.4 保存数据流 69

4.2.5 装载文件 70

4.2.6 映射数据流 70

第5章 处理缺失值 74

5.1 概述 74

5.2 指定缺失值 74

5.3 处理缺失值 75

5.3.1 处理带缺失值的记录 75

5.3.2 处理带缺失值的字段 76

5.4 针对缺失值的CLEM函数 76

第6章 来源节点 78

6.1 概述 78

6.2 变量文件节点 78

6.3 固定文件节点 80

6.4 为文本区设置数据存储 81

6.5 数据库节点 83

6.5.1 设置数据库节点选项 83

6.5.2 添加数据库连接 84

6.5.3 选择表 84

6.5.4 数据库查询 85

6.6 SPSS导入节点 85

6.7 多维数据集导入节点 86

6.8 SAS导入节点 86

6.9 Excel输入节点 87

6.10 用户输入节点 88

6.11 一般来源节点项目 91

6.11.1 在来源节点中设置数据类型 91

6.11.2 在来源节点处过滤字段 93

第7章 记录操作节点 95

7.1 概述 95

7.2 选择节点 95

7.3 抽样节点 96

7.4 均衡节点 97

7.5 聚合节点 97

7.6 排序节点 99

7.7 合并节点 100

7.7.1 指定合并方法和关键字段 100

7.7.2 从合并节点过滤字段 101

7.7.3 设置输入顺序并加上卷标 102

7.8 区分节点 103

7.9 附加节点 104

第8章 字段操作节点 106

8.1 概述 106

8.2 类型节点 106

8.2.1 数据类型 107

8.2.2 什么是实例化 109

8.2.3 读取数据值 110

8.2.4 缺失值处理 113

8.2.5 检查类型值 113

8.2.6 设置字段方向 114

8.2.7 复制类属性 115

8.3 过滤节点 115

8.4 导出节点 117

8.4.1 设置导出节点的基本选项 117

8.4.2 导出多重字段 118

8.4.3 设置导出规则选项 119

8.4.4 设置导出标记选项 119

8.4.5 设置导出设置节点选项 120

8.4.6 设置导出状态选项 120

8.4.7 设置导出计数选项 121

8.4.8 设置导出条件选项 122

8.5 导出节点 123

8.6 再分类节点 125

8.7 分块节点 126

8.8 分割节点 126

8.9 设置标记节点 127

8.10 调整节点 128

8.11 换位节点 129

8.12 时间间隔节点 129

8.13 历史节点 129

8.14 字段记录节点 131

8.15 SPSS转移节点 131

第9章 建立CLEM表达式 132

9.1 什么是CLEM 132

9.1.1 值及数据类型 132

9.1.2 表达式及条件 133

9.2 使用表达式编辑器 134

9.2.1 获取表达式编辑器 134

9.2.2 构造表达式 135

9.2.3 选择函数 135

9.2.4 选择字段、参数以及全局变量 135

9.2.5 选择变量值 136

9.2.6 检查CLEM表达式 136

9.3 CLEM函数类型 137

9.4 CLEM的常见用法 138

9.4.1 对字符串的操作 138

9.4.2 处理空缺和缺失值 138

9.4.3 处理数字 138

9.4.4 处理时间和日期 139

第10章 图节点 140

10.1 概述 140

10.1.1 层迭图 140

10.1.2 三维图像 142

10.1.3 动画效果 143

10.2 建立图 144

10.2.1 为图设置输出选项 144

10.2.2 设置图外观选项 144

10.3 使用图 145

10.4 点图节点 147

10.4.1 为点图节点设置选项 149

10.4.2 使用点图 151

10.5 分布节点 154

10.5.1 设置分布节点选项 154

10.5.2 使用一个分布图 155

10.6 直方图节点 156

10.6.1 设置直方图节点更多选项 157

10.6.2 使用一个直方图 158

10.7 堆积图节点 161

10.7.1 设置堆积图节点的更多选项 162

10.7.2 堆积图的使用 162

10.8 多点图节点 164

10.8.1 为多点图节点设置选项 164

10.8.2 使用一个多点图 166

10.9 网络图节点 166

10.9.1 设置网络图节点选项 167

10.9.2 设置网络图节点的更多选项 168

10.9.3 网络图节点的外观选项 169

10.10 评估图表节点 173

10.10.1 设置评估图表节点选项 176

10.10.2 设置评估图表的更多选项 177

10.10.3 读取模型评估的结果 178

10.10.4 一个评估图表的使用 179

10.11 时间序列点图 179

10.11.1 时间序列点图设置选项 179

10.11.2 时间序列点图的显示选项 180

10.11.3 时间序列点图的输出选项 181

10.11.4 使用一个时间序列点图 182

第11章 建模节点 183

11.1 概述 183

11.2 建模节点字段选项 184

11.3 二进位分类节点 185

11.3.1 二进位分类节点模型选项 185

11.3.2 二进位节点的高级选项 186

11.3.3 二进位节点的Discard选项 187

11.4 神经网络节点 188

11.4.1 神经网络节点模型选项 188

11.4.2 神经网络节点的附加选项 190

11.4.3 神经网络节点高级选项——快速方法 192

11.4.4 神经网络节点高级选项——多重方法 192

11.4.5 神经网络节点高级选项——修剪方法 193

11.4.6 神经网络节点高级选项——RBFN方法 194

11.4.7 神经网络节点学习比率 195

11.5 C5.0节点 195

11.5.1 C5.0节点模型选项 196

11.5.2 错误归类损失选项 197

11.6 分类回归树节点 198

11.6.1 分类回归树节点模型选项 198

11.6.2 分类回归树节点高级选项 199

11.6.3 分类回归树节点终止选项 200

11.6.4 分类回归树节点先验概率选项 201

11.7 QUEST节点 201

11.7.1 QUEST分类模型选项 201

11.7.2 QUEST高级选项 202

11.7.3 QUEST的成本选项 203

11.8 CHAID 204

11.8.1 CHAID模型选项 204

11.8.2 CHAID高级选项 204

11.8.3 CHAID的成本选项 205

11.9 决策表 206

11.9.1 决策表模型选项 206

11.9.2 决策表高级选项 207

11.10 Kohonen节点 208

11.10.1 Kohonen节点模型选项 209

11.10.2 Kohonen节点高级选项 210

11.11 K-Means节点 211

11.11.1 K-Means节点型选项 211

11.11.2 K-Means节点高级选项 212

11.12 两步聚类节点 213

11.13 时间序列节点 215

11.14 异常探测节点 217

11.14.1 异常探测节点模型选项 217

11.14.2 异常节点高级选项 218

11.15 Apriori节点 218

11.15.1 Apriori节点模型选项 219

11.15.2 Apriori节点高级选项 220

11.16 广义规则归纳节点 221

11.17 Carma规则分析 223

11.17.1 Carma规则的模型选项 223

11.17.2 Carma高级选项 223

11.18 序列节点 224

11.18.1 序列节点字段选项 225

11.18.2 序列节点模型选项 226

11.18.3 序列节点高级选项 227

11.19 因子分析/主成分分析 228

11.19.1 因子分析/主成分分析模型选项 229

11.19.2 因子分析/主成分分析高级选项 230

11.19.3 因子分析/主成分分析旋转选项 231

11.20 特征选择节点 232

11.20.1 特征选择节点的模型选项 232

11.20.2 特征选择节点的附加选项 233

11.21 线性回归节点 234

11.21.1 线性回归节点模型选项 234

11.21.2 线性回归节点高级选项 235

11.21.3 线性回归节点单步选项 236

11.21.4 线性回归节点输出选项 236

11.22 Logistic回归节点 237

11.22.1 Logistic回归节点模型选项 237

11.22.2 Logistic回归节点高级选项 238

11.22.3 Logistic回归节点收敛选项 239

11.22.4 Logistic回归输出选项 240

11.23 判别分析节点 241

11.23.1 判别分析节点模型选项 241

11.23.2 判别分析的高级选项 241

11.24 广义线性模型 242

11.24.1 广义线性模型选项 242

11.24.2 广义线性模型的高级选项 243

第12章 输出节点 247

12.1 概述 247

12.2 使用输出 247

12.3 输出浏览菜单 248

12.4 输出节点输出页签 249

12.5 表格节点 250

12.5.1 表格节点设置页签 250

12.5.2 表格节点格式页签 251

12.5.3 表格浏览器 252

12.6 矩阵节点 254

12.6.1 矩阵节点设置页签 254

12.6.2 矩阵节点外观页签 255

12.6.3 矩阵输出浏览器 256

12.7 分析节点 257

12.7.1 分析节点Analysis页签 257

12.7.2 分析输出浏览器 259

12.8 数据审查节点 260

12.8.1 数据审查节点页签 260

12.8.2 数据审查输出浏览器 262

12.9 转换节点 264

12.9.1 转换节点设置标签 264

12.9.2 转换输出浏览器 265

12.10 统计量节点 266

12.10.1 统计量节点设置页签 266

12.10.2 统计量输出浏览器 267

12.11 均值节点 269

12.11.1 均值节点设置标签 269

12.11.2 均值节点选项标签 270

12.11.3 均值节点输出标签 270

12.11.4 均值节点输出浏览器 271

12.12 报告节点 272

12.12.1 报告节点模板页签 272

12.12.2 报告节点输出浏览器 273

12.13 设置全局节点 273

12.14 SPSS输出节点 274

12.14.1 SPSS程序节点语法页签 275

12.14.2 SPSS程序输出浏览器 275

12.15 数据库输出节点 276

12.16 平面文件节点 277

12.17 SPSS导出节点 279

12.18 SAS导出节点 280

12.19 Excel导出节点 280

12.20 方案发布节点 281

12.21 应用软件帮助 282

第13章 生成模型 284

13.1 概述 284

13.2 在生成模型选项板中利用生成模型进行操作 284

13.3 在数据流中使用生成模型 286

13.4 使用生成模型浏览器 286

13.5 生成二进制分类器 287

13.6 生成网络节点 288

13.6.1 生成的神经网络概要页签 289

13.6.2 从神经网络中生成一个过滤节点 290

13.7 生成C5.0节点 291

13.8 生成C&R决策树 292

13.8.1 决策树模型页签 292

13.8.2 决策树浏览页签 294

13.8.3 决策树概要页签 295

13.8.4 从决策树生成规则集 296

13.9 生成QUEST节点 296

13.10 生成CHAID节点 297

13.11 生成决策表 298

13.12 生成Kohonen节点 299

13.13 生成K-Means节点 300

13.13.1 生成的K-Means模型页签 301

13.13.2 生成的K-Means概要页签 302

13.14 生成两步聚类节点 303

13.14.1 生成的两步聚类模型页签 303

13.14.2 生成的两步概要页签 304

13.15 生成时间序列节点 305

13.16 生成异常探测节点 305

13.17 生成Apriori节点 306

13.18 生成GRI节点 307

13.19 生成Carma节点 308

13.20 生成序列规则序列节点 308

13.20.1 生成的序列规则节点 308

13.20.2 序列规则模型页签 309

13.20.3 序列规则的概要页签 311

13.20.4 从序列规则节点生成规则超级节点 312

13.21 因子分析/主成分分析节点 313

13.21.1 因子分析/主成分分析模型页签 314

13.21.2 因子分析/主成分分析概要页签 314

13.21.3 因子分析/主成分分析高级输出 315

13.22 生成特征选择节点 316

13.23 Logistic回归方程节点 317

13.23.1 Logistic回归方程概要页签 318

13.23.2 高级Logistic回归输出 319

13.24 生成线性回归模型 320

13.24.1 线性回归概要页签 320

13.24.2 线性回归模型的高级输出 321

13.25 判别分析 323

13.26 广义线性回归模型 323

13.27 未精练的规则模型 324

13.27.1 未精练规则的模型页签 324

13.27.2 未精练规则的概要页签 325

13.27.3 生成规则集 326

13.28 生成的规则集节点 327

13.28.1 生成的规则集模型页签 328

13.28.2 生成的规则集概要页签 329

第14章 PMML输出模型 331

14.1 概述 331

14.2 用PMML输出 332

第15章 超级节点 333

15.1 概述 333

15.2 超级节点类型 333

15.3 创建一个超级节点 335

15.3.1 嵌套超级节点 336

15.3.2 有效超级节点举例 337

15.3.3 无效超级节点举例 338

15.4 编辑超级节点 339

15.4.1 修改超级节点的类型 339

15.4.2 注释和重命名超级节点 339

15.4.3 超级节点参数 339

15.4.4 超级节点和暂存 343

15.4.5 超级节点和脚本 343

15.5 保存并装载超级节点 344

第16章 建立项目和报告 346

16.1 项目介绍 346

16.1.1 CRISP-DM浏览窗口 346

16.1.2 Classes浏览窗口 347

16.2 建立项目 347

16.2.1 增加新项目 348

16.2.2 加入到项目中 348

16.2.3 设置项目属性 349

16.2.4 评注项目 350

16.2.5 对象属性 351

16.2.6 关闭项目 352

16.3 建构报告 352

16.3.1 生成报告 353

16.3.2 保存和输出报告 354

第17章 批处理模式 356

17.1 批处理模式一览 356

17.2 在批处理模式下工作 356

17.2.1 软件调用 356

17.2.2 使用命令行参数 356

17.2.3 批处理模式日志文件 357

17.2.4 批处理模式中的脚本编程 357

17.2.5 在批处理模式中使用参数 358

17.2.6 在批处理模式下输出 358

第18章 Clementine 11.0中的脚本编程 359

18.1 脚本编程介绍 359

18.1.1 脚本类型 359

18.1.2 Clementine脚本范例 359

18.2 在用户接口上进行脚本编程 360

18.2.1 在流中使用脚本 360

18.2.2 在超级节点中使用脚本 362

18.2.3 使用独立脚本 363

18.3 以批处理模式编写脚本 364

第19章 Clementine外部模块接口 365

19.1 概述 365

19.2 执行CEMI 365

19.3 系统体系结构 365

19.4 规范说明文件 366

19.4.1 参数 367

19.4.2 外部程序 367

19.4.3 命令行选项 367

19.4.4 编辑对话框 367

19.4.5 输入和输出字段 368

19.4.6 输入和输出文件 368

19.4.7 元文件 368

19.4.8 结果 368

19.4.9 返回代码 368

19.5 限制 368

19.6 规范说明文件范例 369

19.6.1 节点说明 369

19.6.2 核心说明 369

19.6.3 参数 370

19.6.4 执行 371

19.6.5 选项 371

19.6.6 控件 371

19.6.7 输出字段 372

19.6.8 输出数据 373

19.6.9 返回代码 373

19.6.10 完整的规范文件 373

19.7 CEMI节点管理 376

19.7.1 增加CEMI节点 376

19.7.2 清除CEMI节点 377

19.8 编写外部程序的技巧 377

第20章 应用范例 378

20.1 概述 378

20.2 状态监测范例 378

20.2.1 审视数据 379

20.2.2 数据准备 380

20.2.3 学习 381

20.3 测试 382

20.3.1 欺诈探测范例 382

20.3.2 数据采集 383

20.3.3 数据探索 383

20.3.4 训练神经网络 386

20.3.5 总结 388

20.4 零售业范例 388

20.4.1 数据审核 388

20.4.2 学习和测试 390

20.5 市场购物篮分析范例 391

20.5.1 获取数据 391

20.5.2 购物关联分析 392

20.5.3 客户细分 394

20.5.4 小结 396

第21章 ACMR企业数据库挖掘研究 397

21.1 研究背景 397

21.2 操作过程 397

附录A 命令行参数 403

附录B CLEM语言参考 405

附录C 脚本语言参考 421

附录D 节点及流属性 436

附录E CEMI规范文件参考 462

参考文献 487

英文参考文献 488

后记 515