Ⅰ 基础篇 3
第1章 获取和安装R 3
R版本 3
R的安装 3
WindoWs 4
Mac OS X 5
Linux和UNIX系统 5
第2章 R的用户界面 7
R的图形用户界面 7
Windows 8
Mac OS X 8
Linux和UNIX程序 9
R控制台 11
命令行编辑 13
批处理模式 14
在Excel中使用R 15
RStudio 17
其他运行R的方式 17
第3章 简短的示例 19
基本操作 19
函数 21
变量 22
数据结构简介 25
对象和类 28
模型和公式 30
图表 32
获得帮助 37
第4章 R包 39
R包概览 39
列示本地库中的R包 40
加载R包 42
在Windows和Linux系统下加载R包 42
在Mac OS X系统下加载R包 42
搜索R包资源库 43
搜索网络上的R包资源库 44
基于R界面搜寻和安装包 44
从其他资源库安装R包 47
定制R包 47
创建包目录 48
创建R包 49
Ⅱ 语言篇 53
第5章 R语言概览 53
表达式 53
对象 54
符号 54
函数 55
在赋值语句中,对象会被复制 56
R中一切皆为对象 57
特殊值 58
NA 58
Inf和-Inf 58
NaN 59
NULL 59
强制转换 59
R解释器 60
观察R是如何工作的 62
第6章 R语法 65
常量 65
数值向量 65
字符向量 67
符号 67
运算符 69
运算顺序 70
赋值操作 71
表达式 72
分离型表达式 72
括号 72
花括号 73
控制结构 74
条件语句 74
循环 75
访问数据结构 79
数据结构操作符 79
通过整数向量引用 79
通过逻辑向量引用 82
通过名字进行引用 83
R编程标准 84
第7章 R对象 86
基本对象类型 86
向量 89
列表 91
其他对象 91
矩阵 92
数组 92
因子 93
数据框 95
公式 96
时间序列 98
Shingle对象 99
日期和时间对象 100
连接对象 100
属性 101
类 104
第8章 符号和环境 106
符号 106
环境 107
全局环境 108
环境和函数 109
调用堆栈 109
在不同的环境中对函数求值 110
向环境中添加对象 113
异常 113
提示错误 114
捕获错误 115
第9章 函数 117
函数的关键字 117
参数 117
返回值 119
函数参数 119
匿名函数 120
函数的属性 122
参数顺序和具名实参 124
副作用 125
改变其他环境 125
输入/输出 126
图形 126
第10章 面向对象编程 127
R的面向对象编程概览 128
核心概念 128
实现的例子 129
R的面向对象编程:S4 135
类的定义 135
对象的新建 137
槽的存取 138
对象的操作 138
创建强制转换方法 138
方法 139
方法的管理 140
基本类型 141
更多的帮助 142
守旧派的OOP:S3 142
S3的类 143
S3方法 144
在S4的类中使用S3的类 145
查找隐藏的S3方法 145
Ⅲ 数据篇 149
第11章 数据的存取和编辑 149
在R中输入数据 149
用R命令输入数据 149
用图形界面输入数据 150
保存和读入R对象 153
用save保存对象 153
从外部文件导入数据 154
文本文件 155
其他软件 163
导出数据 164
从数据库获取数据 164
导出然后导入 165
数据库连接包 165
RODBC 166
DBI 177
TSDBI 181
从Hadoop中获取数据 182
第12章 准备数据 183
合并数据集 183
粘贴数据结构 184
通过共同字段合并数据 188
数据转换 189
变量重新赋值 190
转换函数 190
对对象的每个元素进行函数运算 191
数据分段 197
shingle 197
Cut 197
利用分组变量合并对象 198
子集 199
中括号索引的方式 199
subset函数 200
随机抽样 200
汇总函数 202
tapply与aggregate 202
用rowsum聚合表格 205
计数 206
数据修整 209
数据清洗 218
查找和删除重复数据 219
排序 219
Ⅳ 可视化篇 225
第13章 图形 225
RGraphics概述 225
散点图 226
时间序列 231
柱状图 233
饼图 238
分类数据绘图 239
三维数据 245
绘制分布图 252
箱线图 256
画图设备 259
自定义图形 260
绘图函数常见参数 260
图形参数 260
基本图形函数 271
第14章 Lattice绘图 280
历史 280
lattice包概述 281
lattice的工作原理 281
例子 281
使用lattice函数 284
定制面板函数 285
高级lattice函数 286
单一的网格作图 287
二元网格作图 312
三元图 321
其他图形 326
定制lattice图 328
lattice函数的常用参数 328
trellis.skeleton 329
指定如何绘制坐标轴 330
参数 331
plot.trellis 336
strip.default 337
simpleKey 338
低级函数 339
低级绘图函数 339
面板函数 340
第15章 ggplot2 341
一个简短的介绍 341
图形语法 345
一个更复杂的例子:医保数据 350
快速绘图 360
用ggplot2绘图 361
更多信息 365
Ⅴ 统计篇 369
第16章 数据分析 369
描述性统计 369
相关系数和协方差 372
主成分分析 375
因子分析 379
bootstrap重抽样 380
第17章 概率分布 382
正态分布 382
常见分布的参数 384
分布函数族 385
第18章 统计检验 389
连续型数据 390
基于正态分布的检验 390
不依赖分布的检验 405
离散数据 408
比例检验 408
二项式检验 409
列联表检验 410
列联表非参数检验 416
第19章 功效检验 417
实验设计示例 417
t检验实验设计 418
比例实验设计 419
方差分析设计 420
第20章 回归模型 422
简单的线性模型示例 422
拟合模型 424
指定模型的工具函数 425
获取模型信息 425
更新模型 431
lm函数的详述 432
最小二乘回归的假设 434
稳健回归和阻力回归 436
子集选取和Shrinkage回归 438
变量的逐步选取 438
岭回归 439
Lasso和最小角回归 440
弹性网络 442
主成分回归和偏最小二乘回归 442
非线性模型 443
广义线性模型 443
glmnet包 446
非线性最小二乘 449
生存模型 450
平滑 456
样条线 456
拟合多项式曲面 458
核平滑 459
回归的机器学习算法 460
回归树模型 462
MARS算法 473
神经网络 479
投影寻踪回归 483
广义可加模型 486
支持向量机 488
第21章 分类模型 490
线性分类模型 490
logistic回归 490
线性判别分析 495
对数线性模型 499
机器学习分类模型 500
k近邻 500
分类树模型 502
神经网络 506
支持向量机 507
随机森林 507
第22章 机器学习 509
购物篮分析 509
聚类 514
距离度量 514
聚类算法 515
第23章 时间序列分析 519
自相关函数 519
时间序列模型 520
Ⅵ 其他主题 527
第24章 优化R程序性能 527
R程序性能的测量 527
时间测定 527
性能分析 528
监控内存的使用 530
内存性能分析 531
优化你的R代码 531
使用向量操作 531
R中查找的性能 534
使用数据库查询大数据集 541
内存预分配 541
清理内存 541
大数据集的函数 543
加速R的其他方法 543
R字节码编译器 543
高性能的R版本 546
第25章 Bioconductor 551
例子 552
加载原始的表达数据 552
从GEO读取数据 557
匹配表型数据 559
分析表达数据 560
关键的Bioconductor包 564
数据结构 568
eSet 568
AssayData 570
AnnotatedDataFrame 571
MLAME 571
Bioconductor包使用的其他类 572
如何进一步学习 573
Bioconductor之外的资源 574
教程 574
课程 574
相关图书 575
第26章 R和Hadoop 576
R和Hadoop 576
Hadoop简介 577
RHadoop 582
Hadoop streaming 597
了解更多 600
一些其他的用R做并行计算的包 601
Segue 601
doMC 602
从哪里我们可以了解更多 602
参考文献 603
索引 606