数据挖掘基础PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:刘鹏,张燕,陶建辉,姜才康
- 出 版 社:北京:清华大学出版社
- 出版年份:2018
- ISBN:9787302502197
- 页数:170 页
第1章 数据挖掘概念 1
1.1 数据挖掘概述 1
1.1.1 什么是数据挖掘 2
1.1.2 数据挖掘常用算法概述 2
1.1.3 数据挖掘常用工具概述 4
1.2 数据探索 5
1.2.1 数据概述 5
1.2.2 数据质量 7
1.2.3 数据预处理 10
1.3 数据挖掘的应用 11
1.3.1 数据挖掘现状及发展趋势 11
1.3.2 数据挖掘需要解决的问题 12
1.3.3 数据挖掘的应用场景 14
1.4 作业与练习 18
参考文献 18
第2章 分类 19
2.1 分类概述 19
2.1.1 分类的基本概念 19
2.1.2 解决分类问题的一般方法 20
2.1.3 决策树 21
案例:Web机器人检测 23
2.1.4 模型的过分拟合 24
2.2 贝叶斯决策与分类器 25
2.2.1 规则分类器 25
2.2.2 分类中贝叶斯定理的应用 26
2.2.3 分类中朴素贝叶斯的应用 27
2.3 支持向量机 28
2.3.1 最大边缘超平面 29
2.3.2 线性支持向量机SVM 30
2.3.3 非线性支持向量机SVM 33
2.4 分类在实际场景中的应用案例 36
案例一:如何解决文章主题关键字与搜索引擎关键字带来的检索结果差异 36
案例二:甄别新金融交易方式的欺诈行为 36
案例三:在线广告推荐中的分类 37
2.5 作业与练习 40
参考文献 41
第3章 聚类 42
3.1 聚类概述 42
3.1.1 聚类的基本概念 42
3.1.2 聚类算法 45
3.2 聚合分析方法 48
3.2.1 欧氏距离 48
3.2.2 聚合过程 49
3.2.3 聚类树 51
3.2.4 聚合分析方法应用例子 52
3.3 聚类在实际场景中的应用案例 53
3.4 聚类的实现例子 54
3.5 作业与练习 61
参考文献 61
第4章 关联规则 63
4.1 关联规则概述 63
4.1.1 经典案例导入 63
4.1.2 关联规则的基本概念和定义 64
4.1.3 关联规则的分类 67
4.2 关联规则的挖掘过程 68
4.2.1 知识回顾 68
4.2.2 频繁项集产生 69
4.2.3 强关联规则 71
4.2.4 关联规则评价标准 71
4.3 关联规则的Apriori算法 73
4.3.1 知识回顾 73
4.3.2 Apriori算法的核心思想 74
4.3.3 Apriori算法描述 74
4.3.4 Apriori算法评价 76
4.3.5 Apriori算法改进 77
4.4 关联规则的FP-growth算法 78
4.4.1 构建FP树 79
4.4.2 从FP树中挖掘频繁项集 82
4.5 实战:关联规则挖掘实例 83
4.5.1 关联规则挖掘技术在国内外的应用现状 83
4.5.2 关联规则应用实例 83
4.5.3 关联规则在大型超市中应用的步骤 86
4.6 作业与练习 88
参考文献 88
第5章 综合实战——日志的挖掘与应用 90
5.1 日志概念 90
5.1.1 日志是什么 91
5.1.2 日志能做什么 91
5.2 日志处理 93
5.2.1 产生日志 93
5.2.2 传输日志 93
5.2.3 存储日志 96
5.2.4 分析日志 100
5.2.5 日志规范与标准 111
5.3 日志分析原理及工具 113
5.3.1 日志分析原理 114
5.3.2 日志分析工具 120
5.3.3 日志分析系统规划建设 123
5.4 日志挖掘应用 127
5.4.1 安全运维 127
5.4.2 系统健康分析 128
5.4.3 用户行为分析 129
5.4.4 业务分析设计 130
5.5 日志分析挖掘实例 131
5.6 作业与练习 133
参考文献 133
第6章 数据挖掘应用案例 134
6.1 电力行业采用聚类方法进行主变油温分析 134
6.1.1 需求背景及采用的大数据分析方法 134
6.1.2 大数据分析方法的实现过程 135
6.1.3 大数据分析方法的实现结果 137
6.2 银行信贷评价 138
62.1 简介 138
6.2.2 神经网络模型 138
6.2.3 实证检验 139
6.3 指数预测 140
6.3.1 金融时间序列概况 140
6.3.2 小波消噪 141
6.3.3 向量机 142
6.3.4 指数预测 143
6.4 客户分群的精准智能营销 143
6.4.1 挖掘目标 143
6.4.2 分析方法和过程 144
6.4.3 建模仿真 148
6.5 使用WEKA进行房屋定价 150
6.6 作业与练习 154
参考文献 155
- 《市政工程基础》杨岚编著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《零基础学会素描》王金著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《生物质甘油共气化制氢基础研究》赵丽霞 2019
- 《花时间 我的第一堂花艺课 插花基础技法篇》(日)花时间编辑部编;陈洁责编;冯莹莹译 2020
- 《Photoshop CC 2018基础教程》温培利,付华编著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《看视频零基础学英语口语》宋德伟 2019
- 《胃癌基础病理》(日)塚本彻哉编者;宫健,刘石译者 2019
- 《全国职业院校工业机器人技术专业规划教材 工业机器人技术基础》(中国)陶守成,周平 2019
- 《模形式的p-进性质》陶利群译;(印度)巴斯卡·巴拉素布拉曼扬 2019
- 《世界贸易组织讲席计划丛书 “一带一路”沿线国家投资仲裁案例集》李天一责任编辑;(中国)陶立峰 2019
- 《数学学科课程群》张燕丽 2019
- 《科技翻译教程》陶全胜主编 2019
- 《马云全传》(中国)张燕 2019
- 《中国对外经济贸易70年=70 YEARS OF CHINAS FOREIGN ECONOMY AND TRADE》张燕生 2019
- 《苏黄尺牍合刊 新式标点 第3版》陈伯陶标点 1932
- 《此刻的温柔》陶立夏著 2019
- 《宗教与历史》陶飞亚主编 2018
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019