R语言数据分析PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:(美)盖尔盖伊·道罗齐(Gergely Daroczi)著
- 出 版 社:北京:机械工业出版社
- 出版年份:2016
- ISBN:9787111547952
- 页数:280 页
第1章 你好,数据! 1
1.1 导入一个大小合适的文本文件 2
1.2 文本文件编译测试平台 5
1.3 导入文本文件的子集 6
1.4 从数据库中导入数据 8
1.4.1 搭建测试环境 9
1.4.2 MySQL和MariaDB 11
1.4.3 PostgreSQL 15
1.4.4 Oracle数据库 17
1.4.5 访问ODBC数据库 22
1.4.6 使用图形化用户面连接数据库 23
1.4.7 其他数据库后台 24
1.5 从其他统计系统导入数据 25
1.6 导入Excel电子表格 26
1.7 小结 26
第2章 从Web获取数据 28
2.1 从Internet导入数据集 29
2.2 其他流行的在线数据格式 32
2.3 从HTML表中读取数据 37
2.4 从其他在线来源获取数据 39
2.5 使用R包与数据源API交互 42
2.5.1 Socrata的开源数据API 43
2.5.2 金融API 44
2.5.3 使用Quandl获取时序数据 45
2.5.4 Google文档和统计数据 46
2.5.5 在线搜索的发展趋势 47
2.5.6 天气历史数据 48
2.5.7 其他在线数据源 49
2.6 小结 49
第3章 数据筛选和汇总 50
3.1 去掉多余的数据 50
3.1.1 快速去掉多余数据 52
3.1.2 快速去掉多余数据的其他方法 53
3.2 聚集 54
3.2.1 使用基础的R命令实现快速聚集 55
3.2.2 方便的辅助函数 56
3.2.3 高性能的辅助函数 57
3.2.4 使用data.table完成聚集 59
3.3 测试 59
3.4 汇总函数 62
3.5 小结 64
第4章 数据重构 65
4.1 矩阵转置 65
4.2 基于字符串匹配实现数据筛选 66
4.3 数据重排序 67
4.4 dplyr包和data.table包的比较 70
4.5 创建新变量 70
4.5.1 内存使用分析 71
4.5.2 同时创建多个变量 72
4.5.3 采用dplyr包生成新变量 73
4.6 数据集合并 74
4.7 灵活地实现数据整形 76
4.7.1 将宽表转换为长表 77
4.7.2 将长表转换为宽表 78
4.7.3 性能调整 80
4.8 reshape包的演变 80
4.9 小结 81
第5章 建模 82
5.1 多元模型的由来 83
5.2 线性回归及连续预测变量 83
5.2.1 模型解释 83
5.2.2 多元预测 85
5.3 模型假定 87
5.4 回归线的拟合效果 90
5.5 离散预测变量 92
5.6 小结 95
第6章 线性趋势直线外的知识 96
6.1 工作流建模 96
6.2 逻辑回归 97
6.2.1 数据思考 100
6.2.2 模型拟合的好处 101
6.2.3 模型比较 102
6.3 计数模型 102
6.3.1 泊松回归 103
6.3.2 负二项回归 107
6.3.3 多元非线性模型 107
6.4 小结 115
第7章 非结构化数据 116
7.1 导入语料库 116
7.2 清洗语料库 118
7.3 展示语料库的高频词 121
7.4 深度清洗 121
7.4.1 词干提取 122
7.4.2 词形还原 124
7.5 词条关联说明 124
7.6 其他一些度量 125
7.7 文档分段 126
7.8 小结 128
第8章 数据平滑 129
8.1 缺失值的类型和来源 129
8.2 确定缺失值 130
8.3 忽略缺失值 131
8.4 去掉缺失值 134
8.5 在分析前或分析中筛选缺失值 136
8.6 填补缺失值 136
8.6.1 缺失值建模 138
8.6.2 不同填补方法的比较 140
8.6.3 不处理缺失值 141
8.6.4 多重填补 141
8.7 异常值和孤立点 141
8.8 使用模糊方法 144
8.9 小结 146
第9章 从大数据到小数据 147
9.1 充分性测试 148
9.1.1 正态性 148
9.1.2 多元变量正态性 149
9.1.3 变量间的依赖关系 152
9.1.4 KMO和Barlett检验 154
9.2 主成分分析 157
9.2.1 PCA算法 158
9.2.2 确定成分数 159
9.2.3 成分解释 161
9.2.4 旋转方法 164
9.2.5 使用PCA检测孤立点 167
9.3 因子分析 170
9.4 主成分分析和因子分析 172
9.5 多维尺度分析 173
9.6 小结 176
第10章 分类和聚类 177
10.1 聚类分析 178
10.1.1 层次聚类 178
10.1.2 确定簇的理想个数 181
10.1.3 k均值聚类 183
10.1.4 可视化聚类 185
10.2 潜类别模型 186
10.2.1 潜类别分析 187
10.2.2 LCR模型 189
10.3 判别分析 189
10.4 逻辑回归 192
10.5 机器学习算法 194
10.5.1 k近邻算法 195
10.5.2 分类树 197
10.5.3 随机森林 200
10.5.4 其他算法 201
10.6 小结 203
第11章 基于R的社会网络分析 204
11.1 装载网络数据 204
11.2 网络中心性度量 206
11.3 网络数据的展现 207
11.3.1 交互网络图 210
11.3.2 绘制层次图 211
11.3.3 使用R包来解释包的依赖关系 212
11.4 更多网络分析资源 212
11.5 小结 213
第12章 时序数据分析 214
12.1 创建时序对象 214
12.2 展现时序数据 215
12.3 季节性分解 217
12.4 Holt-Winters筛选 218
12.5 自回归积分滑动平均模型 220
12.6 孤立点检测 221
12.7 更复杂的时序对象 224
12.8 高级时序数据分析 225
12.9 小结 225
第13章 我们身边的数据 226
13.1 地理编码 226
13.2 在空间中展示数据点 228
13.3 找出数据点的多边形重叠区域 230
13.4 绘制主题图 232
13.5 围绕数据点绘制多边形 233
13.5.1 等高线 234
13.5.2 冯洛诺伊图 236
13.6 卫星图 237
13.7 交互图 238
13.7.1 查询Google地图 238
13.7.2 Java脚本地图库 240
13.8 其他绘图方法 242
13.9 空间数据分析 244
13.10 小结 246
第14章 分析R社区 247
14.1 R创始团队的成员 247
14.2 R开发包的维护入员 249
14.3 R-help邮件列表 253
14.3.1 R-help邮件列表的规模 256
14.3.2 预测未来的邮件规模 258
14.4 分析用户列表的重叠部分 260
14.5 社交媒体内的R用户数 262
14.6 社交媒体中与R相关的贴子 263
14.7 小结 266
附录 267
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《分析化学》陈怀侠主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《程序逻辑及C语言编程》卢卫中,杨丽芳主编 2019
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《看漫画学钢琴 技巧 3》高宁译;(日)川崎美雪 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《海明威书信集:1917-1961 下》(美)海明威(Ernest Hemingway)著;潘小松译 2019
- 《迁徙 默温自选诗集 上》(美)W.S.默温著;伽禾译 2020
- 《上帝的孤独者 下 托马斯·沃尔夫短篇小说集》(美)托马斯·沃尔夫著;刘积源译 2017
- 《巴黎永远没个完》(美)海明威著 2017
- 《剑桥国际英语写作教程 段落写作》(美)吉尔·辛格尔顿(Jill Shingleton)编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019