R语言实战 统计分析与数据挖掘宝典PDF电子书下载
- 电子书积分:14 积分如何计算积分?
- 作 者:李倩星编著
- 出 版 社:北京:电子工业出版社
- 出版年份:2016
- ISBN:7121281155
- 页数:408 页
第1章 R的基本介绍 1
1.1 强大的R 1
1.2 R的安装与启动 2
1.2.1 安装并启动R 3
1.2.2 安装并启动一个IDE 5
1.3 R的向量、矩阵和数组 6
1.3.1 向量的操作方法和固有属性 6
1.3.2 矩阵的操作和运算 9
1.3.3 数组中的维度函数 12
1.4 R的列表和数据框 14
1.4.1 列表的特性和编辑方法 14
1.4.2 数据框的创建和基本操作 18
1.5 R数据文件的载入和载出 20
1.5.1 结构化纯文本文件的读取和输出 21
1.5.2 其他文件的读取和输出 23
1.6 向R中安装包 25
第2章 原始数据的探索与预处理 29
2.1 度量数据集的集中程度 29
2.2 度量数据集的分散程度 31
2.2.1 极值、方差和标准差 31
2.2.2 标准误和偏度系数、峰度系数 33
2.3 创建一个数值摘要表 35
2.4 异常值的观测与说明 37
2.4.1 利用箱线图观测异常值并处理 38
2.4.2 异常值检测的其他情况和说明 40
2.5 缺失值的填补与处理 42
2.5.1 删除缺失值或对其进行简单填补 42
2.5.2 按照相关性对空缺值进行填补 45
第3章 R的数据可视化 47
3.1 plot()函数和常用的图形参数 47
3.1.1 设置plot()函数中的参数 47
3.1.2 修改散点图的坐标并加入标注 51
3.2 经典的基础图形及用途 54
3.2.1 线图 54
3.2.2 直方图 59
3.2.3 箱线图和茎叶图 63
3.3 将图形组合起来 66
3.4 更多的高水平作图函数 69
3.5 更多的常用作图命令 72
第4章 R中参数的估计和检验 75
4.1 使用R进行点估计和区间估计 75
4.1.1 简单的点估计和区间估计 75
4.1.2 估计单侧置信区间 79
4.2 与正态总体有关的参数检验 83
4.3 列联表与独立性检验 87
4.4 几种检验数据分布的函数 89
4.5 对非正态总体的区间估计和检验 92
4.5.1 非正态总体的区间估计 92
4.5.2 非参数检验中的符号检验 94
4.5.3 非参数检验中的秩检验 96
第5章 R中的方差分析 99
5.1 方差分析模型的建立 99
5.2 单因素方差分析 100
5.2.1 单因素方差分析的数学思想与模型 101
5.2.2 检验样本是否满足方差分析的假设条件 102
5.2.3 构建单因素方差分析模型 105
5.3 多因素方差分析 108
5.3.1 多因素方差分析的数学思想与模型 108
5.3.2 不考虑交互作用的双因素方差分析 110
5.3.3 考虑交互作用的双因素方差分析 112
5.4 秩检验和协方差分析 114
5.4.1 对控制变量应用秩检验方法 114
5.4.2 协方差分析的假设与应用 116
第6章 R中的相关分析和回归分析 118
6.1 多种相关系数的度量和分析 118
6.1.1 简单相关系数的计算和检验 118
6.1.2 散布矩阵图和偏相关系数 121
6.1.3 典型相关分析 123
6.2 线性回归分析及其常规参数 125
6.2.1 对数据进行预处理 126
6.2.2 构建第一个回归模型 127
6.2.3 修正方程并检验残差 129
6.3 使用逐步回归筛选自变量 132
6.3.1 逐步回归的思想与分类 132
6.3.2 构建逐步回归模型 133
6.4 哑变量和逻辑回归 135
6.4.1 哑变量和逻辑回归的思想 135
6.4.2 向线性回归模型中纳入哑变量 137
第7章 更高级的数据可视化 140
7.1 基础图形的拓展与延伸 140
7.1.1 绘制分类散点图并添加图标 140
7.1.2 绘制含多种类别的密度分布图 143
7.1.3 复合条形图和堆栈条形图 146
7.2 有关多元分布函数的特殊图形 149
7.2.1 星图和脸谱图 150
7.2.2 轮廓图 153
7.2.3 调和曲线图 155
7.3 建立最简单的3D图形 157
7.4 如何让图形更美观 160
7.5 更多的绘图包和系统 162
第8章 R中的聚类分析和判别分析 164
8.1 几种聚类分析的异同 164
8.2 使用R实现KNN聚类 165
8.2.1 KNN算法的思想和模型 165
8.2.2 使用R实现KNN聚类 167
8.3 使用R实现系统聚类 170
8.3.1 系统聚类的思想和模型 170
8.3.2 使用R实现系统聚类 171
8.4 使用R实现快速聚类 174
8.4.1 快速聚类的思想和模型 174
8.4.2 使用R实现快速聚类 176
8.5 几种判别分析模型综述 178
8.5.1 距离判别模型 179
8.5.2 Fisher判别模型 182
第9章 R中的主成分分析和因子分析 186
9.1 主成分分析的实现与应用 186
9.1.1 主成分分析的模型假设和数据处理 186
9.1.2 构造一个主成分分析模型 189
9.1.3 计算主成分的综合得分 191
9.2 因子分析的初次构建与完善 193
9.2.1 构造一个简单的因子分析模型 194
9.2.2 计算因子得分并分析 196
9.3 对因子分析模型进行修正 198
9.3.1 修改因子分析模型中的因子个数 198
9.3.2 基于主成分法和主轴因子法进行因子分析 200
9.4 在降维分析的基础上进行回归分析和聚类分析 202
9.4.1 在降维分析的基础上进行回归分析 202
9.4.2 在降维分析的基础上进行聚类分析 206
第10章 R中的广义线性回归模型 209
10.1 一般的广义线性回归模型 209
10.1.1 使用二次函数拟合线性回归模型 209
10.1.2 拟合更多的广义线性模型 212
10.1.3 比较线性模型的优劣 214
10.2 Logistic线性回归模型 217
10.2.1 Logistic模型的原理与构建方法 217
10.2.2 Logistic模型的显著性检验和优势比 220
10.2.3 修正被警告的Logistic模型 221
10.3 泊松回归分析模型 224
10.3.1 拟合第一个泊松回归模型 224
10.3.2 泊松回归模型的过散布检验 228
10.4 广义线性模型的交叉验证 230
第11章 R中的时间序列模型 233
11.1 将数据转换为时间序列格式 233
11.1.1 使用ts()函数转换数据格式并绘制时间序列曲线 233
11.1.2 使用zoo()函数转换数据格式并绘制时间序列曲线 236
11.2 分解时间序列并检验时间序列的自相关性 239
11.2.1 使用经典方法分解时间序列 239
11.2.2 使用STL方法分解时间序列 241
11.3 探究时间序列的自相关性 243
11.3.1 使用月图和季度图探究自相关性 243
11.3.2 使用散点图探究自相关性 245
11.4 构建时间序列并预测 248
11.4.1 均值预测、单纯预测和漂移 248
11.4.2 不考虑长期趋势和季节波动的简单指数平滑 251
11.4.3 在指数平滑中加入长期趋势和季节波动 253
11.4.4 自回归移动平均模型 256
第12章 R中的最优化问题 260
12.1 最优化问题简述 260
12.2 黄金分割法 261
12.2.1 黄金分割法和局部最优解 262
12.2.2 使用R实现黄金分割法 264
12.3 牛顿最优化方法 266
12.3.1 牛顿法的算法原理 266
12.3.2 在一维情形下实现牛顿迭代法 268
12.3.3 在多维情形下实现牛顿迭代法 271
12.4 最快上升法 273
12.4.1 利用梯度求解上升最快的相邻点 273
12.4.2 构建最快上升法函数并检验 275
12.5 R中的最优化函数 277
第13章 使用R绘制地理信息图形 280
13.1 绘制世界、国家、省市地图 280
13.1.1 使用map()函数绘制地图 280
13.1.2 另一种绘制地图的方法 282
13.1.3 分省市绘制地图 285
13.2 向地图中添加颜色 289
13.2.1 向地图中添加颜色前的准备工作 289
13.2.2 在地图上添加颜色 291
13.3 向地图中添加标签和线条 293
13.3.1 向地图中添加标签前的准备工作 294
13.3.2 在地图上添加标签 296
13.3.3 在地图上添加线条 299
13.4 使用其他格式的文件优化地图 301
第14章 使用R构建支持向量机 306
14.1 构建一个简单的支持向量机 306
14.1.1 支持向量机的算法原理 306
14.1.2 构建一个简单的支持向量机 309
14.1.3 使用其他核函数构建支持向量机 312
14.2 优化支持向量机的参数 316
14.2.1 优化参数degree 316
14.2.2 优化参数cost 319
14.2.3 优化参数gamma 322
14.3 比较支持向量机与Logistic回归的优劣 326
14.4 比较支持向量机和KNN聚类算法的优劣 330
第15章 实现更高效的流程控制和高级循环 333
15.1 R中的流程控制 333
15.1.1 if语句的多种实现方法 333
15.1.2 ifelse语句与花括号的结合 335
15.1.3 适合多分支情况的switch语句 337
15.2 R中的for循环、while循环和repeat循环 340
15.2.1 R中的for循环和while循环 340
15.2.2 R中的repeat循环 342
15.3 apply家族中的循环函数 345
15.3.1 R中的apply()函数 345
15.3.2 R中的lapply()函数和sapply()函数 349
15.3.3 R中的tapply()函数 352
15.3.4 R中的mapply()函数 355
15.4 更多的高级循环函数 358
15.4.1 R中的replicate()函数和 sweep()函数 358
15.4.2 R中的aggregate()函数 361
第16章 R代码的调试与优化 365
16.1 R代码的常见信息与警告 365
16.1.1 R代码的正常信息与警告 365
16.1.2 R代码中的警告处理方法 367
16.2 R代码中的错误与错误处理方法 370
16.2.1 使用try()函数处理错误信息 370
16.2.2 将try()函数与循环相结合 372
16.3 调试R代码 374
16.3.1 查看调用栈或暂停代码 374
16.3.2 修改error选项 376
16.4 向量化编程方法 378
16.4.1 向量化编程思想 378
16.4.2 比较循环和向量的运行速度 379
第17章 构建电影评分预测模型 382
17.1 获取数据并探索 382
17.2 利用recommenderlab包处理数据 385
17.3 建立模型并评估 388
17.3.1 模型的选择与建立 388
17.3.2 模型之间的比较和评估 390
第18章 贝叶斯垃圾邮件过滤器模型 394
18.1 贝叶斯模型中的条件概率 394
18.2 复杂的数据预处理过程 396
18.2.1 利用for循环读入多封邮件正文 396
18.2.2 利用tm包进一步转换数据格式 398
18.2.3 将TDM转换成真正有用的数据框 400
18.3 利用occurrece值构造分类器 403
18.3.1 完成理论准备并处理测试邮件和普通邮件 403
18.3.2 创建一个函数用于比较概率 406
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《建筑施工企业统计》杨淑芝主编 2008
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《激光加工实训技能指导理实一体化教程 下》王秀军,徐永红主编;刘波,刘克生副主编 2017
- 《分析化学》陈怀侠主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《电子测量与仪器》人力资源和社会保障部教材办公室组织编写 2009
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《通信电子电路原理及仿真设计》叶建芳 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《电子应用技术项目教程 第3版》王彰云 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017