数据挖掘与R语言 原书第2版PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:(葡)路易斯·托尔戈(Luis Torgo)
- 出 版 社:北京:机械工业出版社
- 出版年份:2018
- ISBN:9787111596660
- 页数:346 页
第1章 简介 1
1.1如何阅读本书 2
1.2重现性 2
第一部分 R与数据挖掘简介 6
第2章 R简介 6
2.1R起步 6
2.2与R控制台的简单交互 8
2.3R对象和变量 9
2.4R函数 11
2.5向量 14
2.6向量化 15
2.7因子 16
2.8生成序列 18
2.9数据子集 20
2.10矩阵和数组 22
2.11列表 25
2.12数据框 28
2.13数据框的扩展 31
2.14对象、类和方法 34
2.15管理R会话 35
第3章 数据挖掘简介 37
3.1数据挖掘鸟瞰图 37
3.2数据收集和业务理解 38
3.2.1数据和数据集 39
3.2.2导入数据到R 40
3.3数据预处理 45
3.3.1数据清洗 45
3.3.2变换变量 53
3.3.3生成变量 55
3.3.4降维 66
3.4建模 74
3.4.1探索性数据分析 75
3.4.2使用关联规则的依赖建模 94
3.4.3聚类 101
3.4.4异常检测 112
3.4.5预测分析 120
3.5评估 147
3.5.1Holdout和随机子抽样 148
3.5.2交叉验证 150
3.5.3Bootstrap估计 153
3.5.4推荐程序 154
3.6报告和部署 155
3.6.1通过动态文档进行报告 155
3.6.2通过Web应用程序进行部署 158
第二部分 数据挖掘案例研究 164
第4章 预测海藻数量 164
4.1问题描述与目标 164
4.2数据说明 164
4.3加载数据到R 165
4.4数据可视化和总结 167
4.5数据缺失 173
4.5.1将缺失部分剔除 173
4.5.2尝试找到缺失值最有可能的赋值 175
4.5.3通过变量的相关关系填补缺失值 176
4.5.4通过探索类似个案填补缺失值 179
4.6获取预测模型 180
4.6.1多元线性回归 181
4.6.2回归树 185
4.7模型评价和选择 189
4.8预测7种海藻的频率 200
4.9小结 202
第5章 预测股票市场收益 203
5.1问题描述与目标 203
5.2可用的数据 204
5.2.1从CSV文件读取数据 205
5.2.2从网站上获取数据 205
5.3定义预测任务 206
5.3.1预测什么 206
5.3.2预测变量是什么 208
5.3.3预测任务 212
5.3.4模型评价准则 213
5.4预测模型 215
5.4.1如何应用训练集数据来建模 215
5.4.2建模工具 216
5.5从预测到实践 222
5.5.1如何应用预测模型 222
5.5.2与交易相关的评价准则 223
5.5.3模型集成:仿真交易 224
5.6模型评价和选择 230
5.6.1蒙特卡罗估计 230
5.6.2实验比较 231
5.6.3结果分析 235
5.7交易系统 243
5.7.1评估最终测试数据 243
5.7.2在线交易系统 247
5.8小结 248
第6章 侦测欺诈交易 249
6.1问题描述与目标 249
6.2可用的数据 249
6.2.1加载数据到R 250
6.2.2探索数据集 250
6.2.3数据问题 256
6.3定义数据挖掘任务 263
6.3.1问题的不同解决方法 263
6.3.2评价准则 265
6.3.3实验方法 270
6.4计算离群值的排序 271
6.4.1无监督方法 271
6.4.2有监督方法 280
6.4.3半监督方法 290
6.5小结 295
第7章 微阵列样本分类 296
7.1问题描述与目标 296
7.1.1微阵列实验背景简介 296
7.1.2数据集ALL 297
7.2可用的数据 297
7.3基因(特征)选择 302
7.3.1基于分布特征的简单过滤方法 302
7.3.2ANOVA过滤 304
7.3.3使用随机森林进行过滤 306
7.3.4使用特征聚类的组合进行过滤 308
7.4遗传学异常的预测 309
7.4.1定义预测任务 309
7.4.2模型评价标准 309
7.4.3实验过程 310
7.4.4建模技术 311
7.4.5模型比较 313
7.5小结 320
参考文献 321
主题索引 332
数据挖掘术语索引 337
R函数索引 339
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《程序逻辑及C语言编程》卢卫中,杨丽芳主编 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《幼儿园课程资源丛书 幼儿园语言教育资源》周兢编 2015
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《高等学校“十三五”规划教材 C语言程序设计》翟玉峰责任编辑;(中国)李聪,曾志华,江伟 2019
- 《复活》冯一兵责任编辑;力冈译;(俄罗斯)列夫·托尔斯泰 2019
- 《少年》谢素台译;(俄)列夫·托尔斯泰 2019
- 《南方快车》朱卫净,潘丽萍责编;吴娴敏译者;(智利)路易斯·塞普尔维达 2019
- 《微刺绣 绣绷里的插画艺术》(葡)伊瑞姆·亚兹瓷(Irem Yazici)著 2019
- 《纳尼亚传奇 凯斯宾王子》姜舒文责任编辑;(英)C.S.刘易斯 2019
- 《悲观的智者》(美)彼得·刘易斯(Peter B.Lewis)著 2019
- 《金银岛》(英)罗伯特·路易斯·史蒂文森著 2019
- 《生命的善行 托尔斯泰陪你走过春夏秋冬 冬》(俄)列夫·尼古拉耶维奇·托尔斯泰;冯永,李俊杰译 2019
- 《纳尼亚传奇》(英)C.S.刘易斯(C.S.Lewis)著 2019
- 《战争与和平 上》(俄)列夫·托尔斯泰著;张捷译 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019