数据挖掘实用案例分析PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:赵卫东,董亮著
- 出 版 社:北京:清华大学出版社
- 出版年份:2018
- ISBN:9787302490494
- 页数:252 页
第1章 数据分析过程的主要问题 1
1.1业务理解 1
1.2数据理解 2
1.3数据质量问题与预处理 3
1.4数据分析常见陷阱 9
1.5数据分析方法的选择 10
1.5.1分类算法 11
1.5.2聚类算法 15
1.5.3关联分析 16
1.5.4回归分析 17
1.5.5深度学习 19
1.5.6统计方法 19
1.6数据分析结果的评价 19
1.6.1分类算法的评价 20
1.6.2聚类结果的评价 21
1.6.3关联分析的评价 22
1.6.4回归分析结果的评价 22
1.6.5深度学习的评价 23
1.7数据分析团队的组建 24
1.7.1项目经理 24
1.7.2业务专家 24
1.7.3数据工程师 25
1.7.4数据建模人员 25
1.7.5可视化人员 25
1.7.6评估人员 25
1.8数据分析人才培养的难题 26
1.8.1数理要求高 26
1.8.2跨学科综合能力 26
1.8.3国内技术资料少 26
1.8.4实践机会少 27
第2章 数据挖掘算法的选择——保险产品推荐 28
2.1业务理解 28
2.2数据分析目标 29
2.3数据探索 30
2.3.1数据质量评估 30
2.3.2探索数据统计特性 32
2.3.3数据降维 34
2.4模型选择过程 36
2.4.1算法初选 37
2.4.2算法验证 40
2.4.3算法优化 43
2.4.4平衡数据集 43
2.4.5修改模型参数 46
2.5总结 48
第3章 常用可视化的多维分析 50
3.1箱图 51
3.2雷达图 53
3.3标签云 55
3.4气泡图 56
3.5树图 57
3.6地图 58
3.7高低图 59
3.8双轴图 60
3.9关系图 61
3.10热图 63
第4章 SPSS Modeler建模组件介绍 65
4.1数据预处理组件 65
4.1.1数据清理组件 65
4.1.2数据集成组件 66
4.1.3数据选择组件 67
4.1.4数据变换组件 67
4.2数据挖掘建模组件 68
4.2.1模型筛选 68
4.2.2自动建模 68
4.2.3决策树模型 69
4.2.4贝叶斯网络模型 70
4.2.5神经网络模型 70
4.2.6支持向量机模型 71
4.2.7时间序列模型 71
4.2.8统计模型 71
4.2.9聚类模型 73
4.2.10关联分析 73
4.2.11 KNN模型 74
4.2.12数据挖掘模式评估 74
4.3知识表示 74
4.3.1图形节点 75
4.3.2数据输出 75
4.3.3数据导出 76
第5章 香水销售分析 77
5.1香水销售数据预处理 77
5.2香水销售数据统计分析 79
5.3影响香水销量的因素分析 84
5.4香水适用场所关联分析 87
5.5香水聚类分析 89
5.6香水营销建议 92
第6章 银行信用卡欺诈与拖欠行为分析 93
6.1客户信用等级影响因素 94
6.1.1客户信用卡申请数据预处理 94
6.1.2信用卡申请成功影响因素 96
6.2信用卡客户信用等级影响因素 102
6.3基于消费的信用等级影响因素 104
6.4信用卡欺诈判断模型 105
6.4.1基于Apriori算法的欺诈模型 106
6.4.2基于判别的欺诈模型 109
6.4.3基于分类算法的欺诈模型 110
6.5欺诈人口属性分析 114
6.5.1欺诈人口属性统计分析 115
6.5.2基于逻辑回归的欺诈人口属性分析 116
6.5.3逾期还款的客户特征 119
6.5.4基于决策树分析逾期客户特征 120
6.5.5基于回归分析逾期客户特征 123
6.5.6根据消费历史分析客户特征 128
6.5.7基于聚类分析客户特征 128
6.5.8基于客户细分的聚类分析 134
第7章 海底捞火锅运营分析 138
7.1火锅相关数据抓取 139
7.2数据预处理 140
7.3数据分析 145
7.3.1海底捞运营分析 145
7.3.2店铺选址分析 148
7.4菜品关联分析 153
7.5用户评论与评分的关联分析 160
7.6顾客情感分析 168
第8章 商务宾馆竞争分析 172
8.1目前经济型酒店行业竞争态势 172
8.2用户相关数据准备 174
8.3通过Python编程抓取评论 180
8.4数据预处理 183
8.5商务宾馆客户数据分析 184
8.5.1酒店评分影响因素 184
8.5.2酒店评分与酒店业绩关系 187
8.5.3酒店评分分析 189
8.5.4客户情感分析 198
8.5.5竞争分析 205
8.6建议 214
第9章 耐热导线工厂质量管理数据分析 215
9.1项目概述 215
9.2耐热导线生产质量数据预处理 216
9.3耐热铝线质量检测数据分析 218
第10章 基于逻辑回归模型的高危人员分析 225
10.1高危人员分析需求 226
10.2高危人群相关数据收集与预处理 226
10.3建立模型 229
第11章 卷积神经网络在音频质量评价领域的应用 236
11.1深度学习基础 236
11.1.1深度学习的发展过程 237
11.1.2深度学习常用技术框架 237
11.1.3常用的深度学习算法 239
11.2音频质量评价 241
11.2.1音频样本及特征预处理 242
11.2.2音频特征选择 244
11.2.3卷积神经网络模型训练 245
11.2.4模型参数调优 248
11.3性能验证 249
参考文献 251
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《分析化学》陈怀侠主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《中学语文教学案例研究》贺卫东主编 2019
- 《中学语文教学案例研究》贺卫东主编 2019
- 《一寸光阴一寸暖》周海亮著 2017
- 《洪洞道情》王春亮著 2019
- 《新型摆线针轮传动系统动力学特性的研究》单丽君,何卫东著 2019
- 《水中盐》房鑫亮著 2019
- 《中国抗日战争史 第1卷 局部抗战》黄道玄,王希亮著;步平,王建朗主编 2019
- 《洪洞鼓乐》王春亮著 2019
- 《中国抗日战争史 第7卷 伪政权与沦陷区》臧运祜,王希亮著;步平,王建朗主编 2019
- 《香学三百问》傅京亮著 2019
- 《中国近海重金属环境质量现状与污染风险评价》暨卫东,陈泓哲 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019