R语言与数据挖掘最佳实践和经典案例PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:(澳)YANCHANGZHAO著;陈健,黄琰译
- 出 版 社:北京:机械工业出版社
- 出版年份:2014
- ISBN:9787111475415
- 页数:205 页
第1章 简介 1
1.1 数据挖掘 1
1.2 R 1
1.3 数据集 2
1.3.1 iris数据集 2
1.3.2 bodyfat数据集 3
第2章 数据的导入与导出 4
2.1 R数据的保存与加载 4
2.2 CSV文件的导入与导出 4
2.3 从SAS中导入数据 5
2.4 通过ODBC导入与导出数据 6
2.4.1 从数据库中读取数据 7
2.4.2 从Excel文件中导入与导出数据 7
第3章 数据探索 8
3.1 查看数据 8
3.2 探索单个变量 10
3.3 探索多个变量 12
3.4 更多探索 15
3.5 将图表保存到文件中 19
第4章 决策树与随机森林 21
4.1 使用party包构建决策树 21
4.2 使用rpart包构建决策树 24
4.3 随机森林 29
第5章 回归分析 33
5.1 线性回归 33
5.2 逻辑回归 38
5.3 广义线性回归 38
5.4 非线性回归 40
第6章 聚类 41
6.1 k-means聚类 41
6.2 k-medoids聚类 43
6.3 层次聚类 45
6.4 基于密度的聚类 46
第7章 离群点检测 50
7.1 单变量的离群点检测 50
7.2 局部离群点因子检测 53
7.3 用聚类方法进行离群点检测 56
7.4 时间序列数据的离群点检测 58
7.5 讨论 59
第8章 时间序列分析与挖掘 60
8.1 R中的时间序列数据 60
8.2 时间序列分解 60
8.3 时间序列预测 62
8.4 时间序列聚类 63
8.4.1 动态时间规整 63
8.4.2 合成控制图的时间序列数据 64
8.4.3 基于欧氏距离的层次聚类 65
8.4.4 基于DTW距离的层次聚类 66
8.5 时间序列分类 67
8.5.1 基于原始数据的分类 67
8.5.2 基于特征提取的分类 68
8.5.3 k-NN分类 69
8.6 讨论 70
8.7 延伸阅读 70
第9章 关联规则 71
9.1 关联规则的基本概念 71
9.2 Titanic数据集 71
9.3 关联规则挖掘 73
9.4 消除冗余 78
9.5 解释规则 79
9.6 关联规则的可视化 80
9.7 讨论与延伸阅读 82
第10章 文本挖掘 84
10.1 Twitter的文本检索 84
10.2 转换文本 85
10.3 提取词干 86
10.4 建立词项-文档矩阵 88
10.5 频繁词项与关联 90
10.6 词云 91
10.7 词项聚类 92
10.8 推文聚类 94
10.8.1 基于k-means算法的推文聚类 94
10.8.2 基于k-medoids算法的推文聚类 96
10.9 程序包、延伸阅读与讨论 98
第11章 社交网络分析 99
11.1 词项网络 99
11.2 推文网络 102
11.3 双模式网络 107
11.4 讨论与延伸阅读 110
第12章 案例Ⅰ:房价指数的分析与预测 111
12.1 HPI数据导入 111
12.2 HPI数据探索 112
12.3 HPI趋势与季节性成分 118
12.4 HPI预测 120
12.5 房地产估价 122
12.6 讨论 122
第13章 案例Ⅱ:客户回复预测与效益最大化 123
13.1 简介 123
13.2 KDD Cup 1998的数据 123
13.3 数据探索 131
13.4 训练决策树 137
13.5 模型评估 140
13.6 选择最优决策树 143
13.7 评分 145
13.8 讨论与总结 148
第14章 案例Ⅲ:内存受限的大数据预测模型 150
14.1 简介 150
14.2 研究方法 150
14.3 数据与变量 151
14.4 随机森林 152
14.5 内存问题 153
14.6 样本数据的训练模型 154
14.7 使用已选变量建立模型 156
14.8 评分 162
14.9 输出规则 168
14.9.1 以文本格式输出规则 168
14.9.2 输出SAS规则的得分 172
14.10 总结与讨论 177
第15章 在线资源 178
15.1 R参考文档 178
15.2 R 178
15.3 数据挖掘 179
15.4 R的数据挖掘 180
15.5 R的分类与预测 181
15.6 R的时间序列分析 181
15.7 R的关联规则挖掘 181
15.8 R的空间数据分析 181
15.9 R的文本挖掘 182
15.10 R的社交网络分析 182
15.11 R的数据清洗与转换 182
15.12 R的大数据与并行计算 182
R语言数据挖掘参考文档 184
参考资料 197
通用索引 201
包索引 203
函数索引 204
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《国学经典诵读》(中国)严琼燕 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《激光加工实训技能指导理实一体化教程 下》王秀军,徐永红主编;刘波,刘克生副主编 2017
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《日本面包师的经典配方》马妍责任编辑;王森 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《清至民国中国西北戏剧经典唱段汇辑 第8卷》孔令纪 2018
- 《小提琴经典练习曲简编 沃尔法特》丁芷诺,杨宝智 2019
- 《经典沐心 第2卷 智慧卷》宋伟 2016
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019