数据挖掘前沿问题PDF电子书下载
- 电子书积分:8 积分如何计算积分?
- 作 者:吴喜之,马景义,吕晓玲等著
- 出 版 社:北京:中国统计出版社
- 出版年份:2009
- ISBN:9787503756399
- 页数:138 页
第1章 数据挖掘概论 1
1.1 引言 1
1.2 统计学家和计算机学家从不同角度看数据挖掘 2
1.3 数据源 4
1.4 数据挖掘的应用 5
第2章 传统统计面对的挑战 7
2.1 统计的黑匣子特性 7
2.2 统计从数学继承了什么 9
2.3 传统的数据建模在应用中所遇到的问题 10
2.4 算法建模 11
2.5 回到统计的最初宗旨 13
第3章 常用算法建模概述 14
3.1 引言 14
3.2 关联规则分析 14
3.3 最近邻方法 20
3.4 人工神经网络 24
3.5 支持向量机 29
3.6 VC维数和误差界限 37
第4章 决策树 41
4.1 引言 41
4.2 决策树的构建 45
4.3 不纯度 45
4.4 ID3和C4.5算法 47
4.5 CART算法 49
4.6 CHAID方法 55
第5章 模型评价 61
5.1 引言 61
5.2 贝叶斯规则 62
5.3 模型评价——再论CART 63
5.4 推广误差和期望推广误差 67
5.5 推广误差和期望推广误差的估计 70
第6章 Bagging预测方法 72
6.1 Bagging方法简介 72
6.2 分类问题的Bagging算法 72
6.3 回归问题的Bagging算法 76
6.4 Out-of-Bag(OOB)估计 79
6.5 讨论 80
第7章 Boosting预测方法 82
7.1 AdaBoost算法 82
7.2 自适应重新抽样 84
7.3 AdaBoost算法的性质 86
7.4 可加模型:从统计的角度看AdaBoost 90
7.5 梯度下降提升算法 92
7.6 分类问题的不同损失函数及LogitBoost分类算法 96
7.7 回归问题的不同损失函数及L2-Boosting回归方法 101
7.8 讨论 103
第8章 随机森林 106
8.1 子模型h(x;Θm) 107
8.2 随机森林用于分类的案例 107
8.3 分类问题中随机森林算法预测精度 111
8.4 随机森林算法用于回归问题 115
8.5 随机森林中的OOB估计 117
8.6 再析随机森林算法 119
8.7 自适应随机森林算法 126
参考文献 133
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《强制执行前沿与热点问题》陈兴责编;乔宇 2020
- 《党员干部理论学习培训教材 理论热点问题党员干部学习辅导》(中国)胡磊 2018
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《强磁场下的基础科学问题》中国科学院编 2020
- 《建筑施工企业统计》杨淑芝主编 2008
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《清至民国中国西北戏剧经典唱段汇辑 第8卷》孔令纪 2018