第1章 R语言概述 1
1.1认识R语言 1
1.1.1R语言的基本信息 1
1.1.2获取与安装R语言 2
1.1.3介绍R语言的编辑窗口 6
1.2认识R语言的编译环境 7
1.2.1认识R语言的编译器RStudio 7
1.2.2获取R语言的帮助 11
1.2.3了解R语言的工作空间 11
1.3使用R包 13
1.3.1认识R包 14
1.3.2安装与加载R包 14
1.3.3掌握常用的R包 14
1.4了解R包的内置数据集 16
1.5小结 19
课后习题 20
第2章 数据对象与数据读写 21
2.1查看数据类型 21
2.1.1基本数据类型 21
2.1.2查看与转换对象类型 22
2.2判断数据结构 24
2.2.1向量 24
2.2.2矩阵 30
2.2.3数组 36
2.2.4数据框 38
2.2.5列表 42
2.2.6数据结构的判别与转换 46
2.3读写不同数据源的数据 48
2.3.1从键盘导入数据 48
2.3.2读写带分隔符的文件 49
2.3.3读写Excel文件 50
2.3.4导入其他统计软件文件 51
2.3.5导入数据库数据 52
2.3.6导入网页数据 53
2.4小结 53
课后习题 54
第3章 数据集基本处理 56
3.1新增数据属性列 56
3.1.1访问数据框变量 56
3.1.2创建新变量 57
3.1.3重命名变量 58
3.2清洗数据 61
3.2.1处理缺失值 61
3.2.2处理日期变量 62
3.2.3数据排序 66
3.2.4合并数据集 68
3.3选取变量及数据 69
3.3.1选取变量 69
3.3.2删除变量 70
3.3.3使用subset函数选取数据 71
3.3.4随机抽样 71
3.4整合数据 74
3.4.1使用SQL语句操作数据 74
3.4.2汇总统计数据 75
3.4.3重塑数据 77
3.5处理字符数据 80
3.5.1正则表达式 81
3.5.2字符串处理函数 81
3.6小结 85
课后习题 85
第4章 函数与控制流 87
4.1使用常用函数及apply函数族处理数据 87
4.1.1掌握处理数据的常用函数 87
4.1.2使用apply函数族批量处理数据 93
4.2编写条件分支语句 97
4.2.1掌握if…else判断语句 97
4.2.2使用switch分支语句 99
4.3编写循环语句 99
4.3.1使用for循环语句 99
4.3.2掌握while循环语句 100
4.3.3使用repeat-break循环语句 100
4.4编写自定义函数 101
4.4.1掌握自定义函数的方法 101
4.4.2实现两个矩阵的乘积 103
4.5小结 104
课后习题 104
第5章 初级绘图 106
5.1绘制基础图形 106
5.1.1分析数据分布情况 107
5.1.2分析数据间的关系 112
5.1.3绘制其他图形 118
5.2修改图形参数 122
5.2.1修改颜色 123
5.2.2修改点符号与线条 128
5.2.3修改文本属性 134
5.2.4设置坐标轴 136
5.2.5添加图例 138
5.3绘制组合图形 140
5.3.1 par函数 140
5.3.2 layout函数 143
5.4保存图形 144
5.5小结 145
课后习题 145
第6章 高级绘图 148
6.1使用lattice包绘图 148
6.1.1lattice包绘图特色 148
6.1.2使用lattice包 155
6.2使用ggplot2包绘图 171
6.2.1 qplot函数 171
6.2.2理解ggplot2包的语言逻辑 174
6.2.3 ggplot绘图 174
6.3认识交互式绘图工具 186
6.3.1使用rCharts包生成网页动态图片 186
6.3.2利用googleVis包实现数据动态可视化 190
6.3.3利用htmlwidgets包实现绘图的网页化分享 190
6.3.4利用shiny包实现可交互的Web应用 195
6.4小结 203
课后习题 204
第7章 可视化数据挖掘工具Rattle 206
7.1了解并安装Rattle 206
7.1.1认识Rattle 206
7.1.2安装Rattle 207
7.1.3使用Rattle功能 207
7.2导入数据 208
7.2.1导入CSV数据 209
7.2.2导入ARFF数据 212
7.2.3导入ODBC数据 213
7.2.4 R Dataset——导入其他数据源 215
7.2.5导入RData File数据集 216
7.2.6导入Library数据 218
7.3探索数据 219
7.3.1数据总体概况 219
7.3.2数据分布探索 222
7.3.3相关性 223
7.3.4主成分 227
7.3.5交互图 228
7.4构建模型 230
7.4.1聚类分析 230
7.4.2关联规则 234
7.4.3决策树 236
7.4.4随机森林 238
7.5评估模型 241
7.5.1混淆矩阵 241
7.5.2风险图 241
7.5.3 ROC图及相关图表 241
7.5.4模型得分数据集 243
7.6小结 244
课后习题 244
参考文献 246