第1章 快速入门 1
1.1 R简介 1
1.1.1 编程语言 2
1.1.2 计算环境 2
1.1.3 社区 2
1.1.4 生态系统 3
1.2 对R的需求 3
1.3 R的安装 5
1.4 RStudio 7
1.4.1 RStudio的用户界面 8
1.4.2 RStudio服务器 13
1.5 入门示例 13
1.6 小结 15
第2章 基本对象 16
2.1 向量 17
2.1.1 数值向量 17
2.1.2 逻辑向量 19
2.1.3 字符向量 20
2.1.4 构建向量子集 21
2.1.5 命名向量 24
2.1.6 提取向量元素 26
2.1.7 识别向量类型 27
2.1.8 转换向量类型 27
2.1.9 数值向量的算术运算符 29
2.2 矩阵 30
2.2.1 创建一个矩阵 30
2.2.2 为行和列命名 31
2.2.3 构建矩阵子集 31
2.2.4 矩阵运算符的使用 33
2.3 数组 34
2.3.1 创建一个数组 35
2.3.2 构建数组子集 36
2.4 列表 37
2.4.1 创建一个列表 37
2.4.2 从列表中提取元素 38
2.4.3 构建列表子集 39
2.4.4 命名列表 40
2.4.5 赋值 40
2.4.6 其他函数 42
2.5 数据框 43
2.5.1 创建一个数据框 43
2.5.2 对行和列命名 44
2.5.3 构建数据框子集 45
2.5.4 赋值 49
2.5.5 因子 50
2.5.6 数据框中的实用函数 52
2.5.7 在硬盘上读写数据 53
2.6 函数 54
2.6.1 创建函数 54
2.6.2 调用函数 55
2.6.3 动态类型 55
2.6.4 泛化函数 56
2.6.5 函数参数的默认值 58
2.7 小结 59
第3章 工作空间管理 60
3.1 R的工作目录 60
3.1.1 在RStudio中创建R项目 61
3.1.2 绝对路径和相对路径的比较 62
3.1.3 管理项目文件 63
3.2 检查工作环境 64
3.2.1 检查现有符号 65
3.2.2 查看对象结构 66
3.2.3 删除符号 69
3.3 修改全局选项 70
3.3.1 修改输出位数 70
3.3.2 修改警告级别 72
3.4 管理扩展包库 73
3.4.1 认识扩展包 74
3.4.2 从CRAN中安装包 75
3.4.3 从CRAN中更新包 76
3.4.4 从在线库中安装包 76
3.4.5 使用包中的函数 77
3.4.6 屏蔽和同名冲突 81
3.4.7 检查是否已安装扩展包 82
3.5 小结 83
第4章 基本表达式 84
4.1 赋值表达式 84
4.1.1 其他赋值操作符 85
4.1.2 使用带反引号的非标准名称 88
4.2 条件表达式 91
4.2.1 使用if语句 91
4.2.2 使用if表达式 95
4.2.3 在if条件句中使用向量 98
4.2.4 使用向量化的if:ifelse 100
4.2.5 使用switch对值进行分支 101
4.3 循环表达式 102
4.3.1 使用for循环 103
4.3.2 使用while循环 109
4.4 小结 110
第5章 基本对象操作 111
5.1 使用原函数 111
5.1.1 检查对象类型 112
5.1.2 识别数据维度 116
5.2 使用逻辑函数 120
5.2.1 逻辑运算符 120
5.2.2 逻辑函数 122
5.2.3 处理缺失值 125
5.2.4 逻辑强制转换 127
5.3 使用数学函数 127
5.3.1 基础函数 127
5.3.2 取整函数 129
5.3.3 三角函数 129
5.3.4 双曲函数 130
5.3.5 最值函数 131
5.4 应用数值方法 134
5.4.1 根查找 134
5.4.2 微积分 137
5.5 使用统计函数 139
5.5.1 从向量中抽样 139
5.5.2 应用随机分布 140
5.5.3 计算描述性统计量 142
5.6 使用apply函数族 146
5.6.1 lapply 147
5.6.2 sapply 148
5.6.3 vapply 149
5.6.4 mapply 150
5.6.5 apply 151
5.7 小结 152
第6章 字符串的使用 153
6.1 字符串入门 153
6.1.1 打印文本 153
6.1.2 连接字符串 157
6.1.3 转换文本 158
6.1.4 格式化文本 163
6.2 格式化日期/时间 165
6.2.1 将文本解析为日期/时间 166
6.2.2 格式化日期/时间为字符串 169
6.3 使用正则表达式 171
6.3.1 寻找字符串模式 172
6.3.2 使用分组提取数据 174
6.3.3 以自定义的方式读取数据 176
6.4 小结 177
第7章 数据处理 178
7.1 读写数据 178
7.1.1 读写文件中的文本格式数据 178
7.1.2 读写Excel工作表 183
7.1.3 读写原生数据文件 185
7.1.4 加载内置数据集 188
7.2 数据可视化 191
7.2.1 创建散点图 191
7.2.2 创建折线图 197
7.2.3 创建柱状图 201
7.2.4 创建饼状图 203
7.2.5 创建直方图和密度图 203
7.2.6 创建箱线图 206
7.3 数据分析 207
7.3.1 拟合线性模型 207
7.3.2 拟合回归树 212
7.4 小结 215
第8章 R的内部机制 216
8.1 惰性求值 216
8.2 复制—修改机制 221
8.3 词法作用域 227
8.4 环境的工作方式 232
8.4.1 环境对象 232
8.4.2 创建并链接环境 233
8.4.3 链接环境 235
8.4.4 与函数相关的环境 240
8.5 小结 243
第9章 元编程 244
9.1 函数式编程 244
9.1.1 创建和使用闭包 244
9.1.2 使用高阶函数 249
9.2 基于语言的计算 255
9.2.1 捕获和修改表达式 256
9.2.2 执行表达式 263
9.2.3 非标准计算 267
9.3 小结 273
第10章 面向对象编程 274
10.1 面向对象编程简介 274
10.1.1 类和方法 275
10.1.2 继承 275
10.2 S3对象 276
10.2.1 泛型函数和方法分派 276
10.2.2 内置类和方法 279
10.2.3 为现有类定义泛型函数 287
10.2.4 定义新类并创建对象 288
10.3 S4对象系统 300
10.3.1 定义S4类 300
10.3.2 S4继承 306
10.3.3 定义S4泛型函数 307
10.3.4 多重分派 309
10.4 引用类(RC) 312
10.5 R6 314
10.6 小结 317
第11章 数据库操作 319
11.1 操作关系型数据库 319
11.1.1 创建一个SQLite数据库 320
11.1.2 访问表和表中字段 323
11.1.3 用SQL对关系型数据库进行查询 325
11.1.4 分块提取查询结果 335
11.1.5 出于一致性考虑的事务操作 336
11.1.6 将多个文件的数据存入一个数据库 342
11.2 操作非关系型数据库 345
11.2.1 MongoDB操作 346
11.2.2 使用Redis 362
11.3 小结 368
第12章 数据操作 369
12.1 使用内置函数操作数据框 369
12.1.1 使用内置函数操作数据框 370
12.1.2 使用reshape2重塑数据框 378
12.2 通过sqldf包使用SQL查询数据框 383
12.3 使用data.table包操作数据 387
12.3.1 使用键获取行 394
12.3.2 对数据分组汇总 396
12.3.3 重塑data.table 399
12.3.4 使用原地设置函数 401
12.3.5 data.table中的动态作用域 403
12.4 使用dplyr管道操作处理数据框 408
12.5 使用rlist包处理嵌套数据结构 416
12.6 小结 421
第13章 高性能计算 423
13.1 理解代码性能问题 423
13.2 代码的性能分析 432
13.2.1 用Rprof进行性能分析 432
13.2.2 用profvis进行性能分析 436
13.2.3 理解代码为什么会慢 438
13.3 提高代码性能 440
13.3.1 使用内置函数 440
13.3.2 使用向量化 443
13.3.3 使用字节码编译器 445
13.3.4 使用由Intel MKL支持的R 447
13.3.5 使用并行计算 447
13.3.6 使用Rcpp 457
13.4 小结 465
第14章 网页爬虫 467
14.1 查阅网页内容 467
14.2 使用CSS选择器从网页中提取数据 473
14.3 使用XPath选择器 476
14.4 分析HTML代码并提取数据 481
14.5 小结 489
第15章 效率提升 491
15.1 编写R Markdown文档 491
15.1.1 了解markdown 491
15.1.2 将R整合到markdown中 497
15.1.3 嵌入表格和图表 499
15.2 创建交互式应用程序 506
15.2.1 创建shiny应用程序 507
15.2.2 使用shinydashboard 511
15.3 小结 515
附录 术语表 516