第1部分 数据可视化篇 2
第1章 可视化数据挖掘概述 2
1.1 数据可视化 2
1.1.1 Tableau 3
1.1.2 Qlik View 5
1.1.3 Power BI 5
1.2 可视化数据挖掘 6
1.2.1 IBM SPSS Modeler 6
1.2.2 Intelligent Miner 7
1.2.3 SAS Enterprise Miner 9
第2章 Tableau Desktop简介 11
2.1 软件页面简介 11
2.1.1 开始页面 12
2.1.2 数据源页面 13
2.1.3 工作簿页面 15
2.2 数据类型 15
2.2.1 主要数据类型 15
2.2.2 更改数据类型 16
2.3 运算符及优先级 18
2.3.1 算术运算符 18
2.3.2 逻辑运算符 18
2.3.3 比较运算符 19
2.3.4 运算符优先级 19
2.4 软件安装 20
2.4.1 软件下载 20
2.4.2 安装步骤 21
2.4.3 软件激活 23
2.5 文件类型 26
第3章 连接数据源 27
3.1 连接到文件 27
3.1.1 Excel文件 27
3.1.2 文本文件 29
3.1.3 Access 30
3.1.4 JSON文件 32
3.1.5 PDF文件 34
3.1.6 空间文件 35
3.1.7 统计文件 36
3.1.8 其他文件 38
3.2 连接到数据库 38
3.2.1 Tableau Server 38
3.2.2 SQL Server 39
3.2.3 MySQL 40
3.2.4 Oracle 41
3.2.5 Amazon Redshift 42
3.2.6 更多数据库 43
第4章 Tableau主要操作 47
4.1 维度和度量 47
4.1.1 维度 47
4.1.2 度量 49
4.2 连续和离散 50
4.2.1 连续字段 50
4.2.2 离散字段 51
4.3 工作区操作 52
4.3.1 “数据”窗格 53
4.3.2 “分析”窗格 54
4.3.3 工具栏 54
4.3.4 状态栏 55
4.3.5 卡和功能区 56
4.4 工作表操作 58
4.4.1 创建工作表 58
4.4.2 复制工作表 59
4.4.3 导出工作表 59
4.4.4 删除工作表 60
4.5 Tableau高级操作 61
4.5.1 表计算 61
4.5.2 创建字段 63
4.5.3 创建参数 65
4.5.4 聚合计算 71
4.5.5 缺失值处理 74
第5章 创建图表 76
5.1 单变量图形 76
5.1.1 条形图 76
5.1.2 饼图 79
5.1.3 直方图 80
5.1.4 折线图 81
5.2 多变量图形 84
5.2.1 散点图 84
5.2.2 甘特图 85
第2部分 可视化数据挖掘篇 88
第6章 SPSS Modeler简介 88
6.1 软件简介 88
6.1.1 软件历史 88
6.1.2 软件界面 90
6.1.3 软件特点 96
6.2 算法及功能 97
6.2.1 软件算法 97
6.2.2 软件功能 99
6.3 软件安装及启动 101
6.3.1 软件安装 101
6.3.2 授权许可 104
6.3.3 启动软件 107
第7章 数据挖掘流程 110
7.1 业务理解 110
7.2 数据理解 111
7.3 数据准备 112
7.4 建立模型 113
7.5 评估模型 114
7.6 应用模型 114
第8章 SPSS Modeler导入数据源 116
8.1 连接到文件 116
8.1.1 Excel文件 117
8.1.2 变量文件 117
8.1.3 固定文件 119
8.1.4 SAS文件 120
8.1.5 Statistics文件 121
8.2 连接到数据库 121
第9章 SPSS Modeler基础操作 125
9.1 数据流操作 125
9.1.1 生成数据流 125
9.1.2 添加和删除节点 125
9.1.3 连接数据流 126
9.1.4 修改连接节点 127
9.1.5 执行数据流 128
9.2 图形制作 128
9.2.1 散点图 129
9.2.2 直方图 131
9.2.3 网络图 132
9.2.4 评估图 132
第3部分 案例实战篇 136
第10章 电信行业中的应用 136
10.1 建模思路 137
10.2 Logistic回归 138
10.3 业务理解 139
10.4 数据理解 140
10.5 数据准备 142
10.6 建立模型 143
10.6.1 模型参数设置 143
10.6.2 模型运行结果 154
10.7 模型评估 157
10.7.1 模型精确度 157
10.7.2 模型拟合度 158
10.8 模型应用 158
10.9 小结 161
第11章 电力行业中的应用 162
11.1 建模思路 163
11.2 时间序列模型 163
11.3 业务理解 165
11.4 数据理解 166
11.5 数据准备 167
11.6 建立模型 168
11.6.1 模型参数设置 168
11.6.2 模型运行结果 184
11.7 模型评估 186
11.8 模型应用 187
11.9 小结 188
第12章 医药行业中的应用 189
12.1 建模思路 189
12.2 聚类模型 190
12.3 业务理解 192
12.4 数据理解 193
12.5 数据准备 195
12.6 建立模型 196
12.6.1 模型参数设置 196
12.6.2 模型运行结果 199
12.7 模型评估 202
12.8 模型应用 204
12.9 小结 206
第13章 银行业中的应用 207
13.1 建模思路 208
13.2 判别分析 208
13.3 业务理解 210
13.4 数据理解 211
13.5 数据准备 213
13.6 建立模型 214
13.6.1 模型参数设置 214
13.6.2 模型运行结果 221
13.7 模型评估 226
13.8 模型应用 226
13.9 小结 229
第14章 电商中的应用 230
14.1 建模思路 231
14.2 神经网络模型 232
14.2.1 神经元 234
14.2.2 多层感知器 235
14.2.3 径向基函数 237
14.3 业务理解 238
14.4 数据理解 239
14.5 数据准备 241
14.6 建立模型 243
14.6.1 模型参数设置 243
14.6.2 模型运行结果 251
14.7 模型评估 254
14.8 模型应用 255
14.9 小结 257
第15章 房地产业中的应用 258
15.1 建模思路 258
15.2 决策树模型 259
15.3 业务理解 261
15.4 数据理解 261
15.5 数据准备 263
15.6 建立模型 266
15.6.1 模型参数设置 266
15.6.2 模型运行结果 276
15.7 模型评估 277
15.7.1 模型精确度 277
15.7.2 模型拟合度 278
15.8 模型应用 279
15.9 小结 281
附录A 配置MySQL ODBC数据源 282
附录B Tableau重要函数 285
附录C SPSS Modeler函数 313