数据挖掘中的集成方法 通过集成预测来提升精度PDF电子书下载
- 电子书积分:7 积分如何计算积分?
- 作 者:(美)赛尼,(美)艾德著;王攀,张健,杨洋等译
- 出 版 社:北京:科学出版社
- 出版年份:2015
- ISBN:9787030443274
- 页数:96 页
第1章 集成发现 1
1.1 建立集成 5
1.2 正则化 6
1.3 现实世界中的实例:信用评分+网飞挑战 7
1.4 本书的组织架构 8
第2章 预测学习和决策树 10
2.1 决策树归纳纵览 14
2.2 决策树的性能 16
2.3 决策树的缺陷 17
第3章 模型复杂度、模型选择和正则化 19
3.1 什么是树的“合适”规模 19
3.2 偏差-方差分解 20
3.3 正则化 23
3.3.1 正则化与成本-复杂度树修剪 23
3.3.2 交叉验证 24
3.3.3 运用收缩的正则化 26
3.3.4 通过构建增量模型的正则化 30
3.3.5 实例 31
3.3.6 正则化综述 34
第4章 重要性采样和经典集成方法 36
4.1 重要性采样 39
4.1.1 参数重要性测度 40
4.1.2 扰动采样 42
4.2 泛化集成生成 42
4.3 Bagging 44
4.3.1 实例 47
4.3.2 为什么Bagging有用 51
4.4 随机森林 51
4.5 AdaBoost 53
4.5.1 实例 54
4.5.2 为什么使用指数损失 56
4.5.3 AdaBoost的总体最小值 57
4.6 梯度Boosting 58
4.7 MART 59
4.8 并行集成与顺序集成的比较 59
第5章 规则集成和解释统计 61
5.1 规则集成 61
5.2 解释 63
5.2.1 仿真数据实例 64
5.2.2 变量重要性 68
5.2.3 偏相关 69
5.2.4 交互统计 70
5.3 制造业数据实例 70
5.4 总结 74
第6章 集成复杂性 75
6.1 复杂性 75
6.2 广义自由度 77
6.3 实例:带有噪声的决策树表面 78
6.4 广义自由度的R代码和实例 82
6.5 总结与讨论 83
参考文献 85
附录A AdaBoost与FSF程序的等价性 90
附录B 梯度Boosting和鲁棒损失函数 93
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《民国时期医药卫生文献集成 37》路丽明编 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《民国时期医药卫生文献集成 19》路丽明编 2019
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《民国时期医药卫生文献集成 24》路丽明编 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《美国小学分级阅读 二级D 地球科学&物质科学》本书编委会 2016
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《强磁场下的基础科学问题》中国科学院编 2020
- 《小牛顿科学故事馆 进化论的故事》小牛顿科学教育公司编辑团队 2018
- 《小牛顿科学故事馆 医学的故事》小牛顿科学教育公司编辑团队 2018
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019