第1章 绪论 1
1.1 本书背景 1
1.2 数据挖掘应用概述 2
1.3 本书的主要内容安排 4
1.4 小结 5
第2章 基于GPS信息的出租车行车轨迹数据挖掘 6
2.1 概述 6
2.2 出租车GPS数据挖掘问题描述 6
2.3 基于GPS数据的出租车轨迹挖掘与分析 9
2.4 挖掘任务点评 30
2.5 小结 31
第3章 NBA比赛结果预测 32
3.1 问题背景 32
3.2 数据采集 33
3.2.1 数据来源 33
3.2.2 数据采集方法 33
3.2.3 原始数据 34
3.3 挖掘方法 36
3.3.1 挖掘的目标与实现思路 36
3.3.2 预测特征选取 37
3.4 分类和预测方法 38
3.5 预测结果的分析和对比 39
3.5.1 使用球队平均数据预测比赛结果 39
3.5.2 使用球队近期数据预测比赛结果 40
3.6 挖掘任务点评 43
3.7 小结 43
参考文献 44
第4章 大型商业银行后台运维数据故障分析 46
4.1 概述 46
4.1.1 应用背景 46
4.1.2 主要研发内容 49
4.2 相关方法回顾 51
4.2.1 主成分分析法 51
4.2.2 前向特征选择法 52
4.2.3 随机森林方法 52
4.3 交易超时故障预测方法设计与实现 54
4.3.1 问题定义 54
4.3.2 工作流程 55
4.3.3 数据预处理 55
4.3.4 降维处理 61
4.3.5 预测模型 62
4.3.6 防范模型 63
4.3.7 评价方法 64
4.4 综合系统的设计与实现 65
4.4.1 系统框架 65
4.4.2 数据预处理模块 65
4.4.3 随机森林模块 66
4.4.4 展示模块 67
4.4.5 最终效果模块 67
4.5 结果分析与评价 69
4.5.1 实验数据 69
4.5.2 交易故障预测相关实验 70
4.6 挖掘任务点评 75
4.7 小结 76
4.7.1 总结 76
4.7.2 展望 77
参考文献 77
第5章 RNA排序预测 80
5.1 概述 80
5.2 研发现状 81
5.2.1 内部核糖体进入位点的数据挖掘研发现状 81
5.2.2 冷冻电镜图像蛋白质颗粒挑选研究现状 84
5.3 工作设计与实现 86
5.3.1 基本的设计框架与实现思路 86
5.3.2 核心挖掘模型设计与实现 91
5.4 应用实现 94
5.4.1 实现程序与功能 94
5.4.2 数据挖掘分析结果展示 95
5.5 操作说明 98
5.6 挖掘任务点评 98
5.7 小结 99
参考文献 100
第6章 “乐学”微信公众号关注趋势分析 101
6.1 前言 101
6.1.1 研究背景 101
6.1.2 数据来源 102
6.1.3 数据预处理 102
6.1.4 研究思路 103
6.2 平台发展现状 104
6.2.1 平台用户特性 105
6.2.2 平台传播状态 108
6.2.3 便捷操作发展状况 113
6.3 推送发展模式探究 119
6.3.1 成功推送案例分析 120
6.3.2 理想发展模式探究 123
6.3.3 不同模式下的平台关注量预测 123
6.3.4 推送发展的改进思路 126
6.4 便捷操作功能探究 127
6.4.1 用户使用习惯分析 127
6.4.2 便捷操作功能的改进思路 128
6.5 挖掘任务点评 129
6.6 小结 130
参考文献 130
第7章 保险行业客户特征识别 131
7.1 概述 131
7.2 数据挖掘问题描述 133
7.2.1 问题背景 133
7.2.2 关于数据集 133
7.3 保险客户特征识别与分析 134
7.3.1 数据预处理 134
7.3.2 挖掘与分析结果 145
7.4 挖掘任务点评 148
7.5 小结 150
参考文献 150
第8章 电力系统不良数据辨识案例分析 155
8.1 概述 155
8.1.1 电力系统不良数据辨识 155
8.1.2 数据介绍 156
8.2 研究内容 157
8.2.1 基于GSA的k-means聚类 157
8.2.2 基于有效指数的k-means聚类 164
8.2.3 模糊C-means聚类 168
8.3 总结分析 171
8.3.1 不良数据辨识结果对比 171
8.3.2 不良数据分析 173
8.4 挖掘任务点评 175
8.5 小结 175
第9章 总结 177