第1章 开始使用R软件 1
安装 1
Crimson编辑器 2
Tinn-R 2
开始使用R软件 2
R的程序库和程序包 3
Epicalc程序包 4
更新程序包 4
Rprofile.site 4
在线帮助 5
R作为计算器 6
R命令的语法 6
R对象 7
字符或字符串对象 8
在命令行中加入注释 8
逻辑型:TRUE和FALSE 8
使用&(逻辑与)进行逻辑连接 9
使用|(逻辑或)进行逻辑连接 9
TRUE和FALSE的值 9
参考文献 10
练习 10
第2章 向量 11
历史记录和对象保存 11
连接对象 12
系统数字向量 12
通过一个索引向量来得到子集向量 13
使用下标向量选择一个子集 14
与批处理向量有关的函数 14
非数值向量 15
对向量中的元素排序 16
从已有的向量创建一个因子变量 16
缺失值 18
练习 19
第3章 数组、矩阵和表格 20
数组 20
将向量折叠起来放到数组中 20
使用下标提取元素、行、列和子矩阵 21
向量捆绑 21
数组转置 22
数组的基本统计分析 22
字符型数组 23
具有相同长度的两个向量的隐含数组 23
矩阵 24
表格 24
表格和数组的归纳 25
列表 26
练习 27
第4章 数据集 28
数组与数据框架的比较 28
从文本文件中获取数据框架 28
数据录入和分析 29
清空内存和读入数据 30
包含在Epicalc内的数据框架 30
读入数据 30
查看数据框架的内容 31
归纳数据框架的特征 31
Codebook函数 32
从数据框架中抽取子集 33
在数据框架中添加一个变量 34
从数据框架中删除变量 35
把数据框架调入搜索路径 35
使用Epicalc中的“use”命令 37
“.data”与命令zap()相抵触 38
练习 39
第5章 简单数据探索 40
使用Epicalc进行数据探索 40
点图 46
练习 47
第6章 日期和时间 49
与日期有关的计算函数 49
读入日期变量 51
处理时间变量 52
在同一个图形中显示两个变量 55
年龄和difftime 56
练习 58
第7章 暴发调查:时间的描述 59
快速浏览 59
病例的定义 60
暴露时间 60
发作时间 62
潜伏期 64
配对图 64
参考文献 66
练习 66
第8章 暴发调查:风险评估 67
缺失值的重新编码 67
风险的比较:危险度比和归因危险度 69
剂量—反应关系 70
练习 71
第9章 优势比、混杂和交互作用 72
优势和优势比 72
混杂及其机制 74
交互作用和修正效应 76
练习 77
第10章 基础数据管理 78
一个未经整理的数据集 78
识别重复的ID 78
缺失值 80
在数据集中替换数值 81
通过抽取或索引改变值 82
在数据框架里转换变量 82
使用Epicalc对数值编码 83
使用“label.var”对变量加标签 84
对分类变量作标签 86
增加一个新变量到数据框架里 87
单向表格的顺序 88
伸缩类别 89
小结 90
第11章 散点图与线性回归 91
例子:钩虫与失血 91
散点图 92
线性模型的组成 93
方差分析表,确定系数和调整确定系数 94
F检验 95
线性回归,拟合值和残差 95
检查残差的正态性 96
采用“regress.display”显示回归结果 97
最终结论 98
练习 98
第12章 分层线性回归 99
例:食盐对收缩压的影响 99
把缺失值编码为另一个类别 100
练习 105
第13章 曲线相关 106
例:随身携带的钱数和年龄的关系 106
二次模型中的最大值 109
分层曲线模型 110
从年龄到年龄组 111
用分类自变量建模 112
练习 113
第14章 广义线性模型 114
从线性模型到广义线性模型 114
模型的属性 115
模型归纳的属性 116
协方差矩阵 116
标准误、t值和95%可信区间的计算 117
广义线性模型glm的其他部分 118
参考文献 119
练习 119
第15章 Logistic回归 120
二分类结果的分布 120
二元自变量的Logistic回归 123
交互作用 125
自变量的逐步选择 126
优势比的解释 127
其他数据格式 128
多于2层的数据 129
改变参照水平 132
参考文献 132
练习 133
第16章 配对病例对照研究 134
1∶n配对 136
1∶1配对的Logistic回归分析 137
条件Logistic回归 139
练习 140
第17章 多项分类Logistic回归 141
作表格 141
采用R软件进行多项分类的Logistic回归 142
显示多项分类Logistic回归结果 144
参照组的选择 146
练习 146
第18章 有序分类Logistic回归 148
有序分类因素 148
使用多项分类Logistic回归 149
有序分类模型 150
“ordinal.or.display”函数 151
参考文献 151
练习 152
第19章 Poisson和负二项回归 153
Poisson分布 153
Poisson回归 153
Poisson回归模型的优点 153
例子:Montana冶炼厂研究 154
按年龄和时期划分发病率 155
用Poisson回归建模 156
Poisson拟合优度检验 156
线性剂量反应关系 157
发病密度(ID) 158
发病密度比(IDR) 159
用“idr.display”命令得到IDR的95%的可信区间(CI) 159
负二项回归 160
参考文献 162
练习 162
第20章 多水平模型简介 163
从分层分析到随机效应模型 163
例子:畸齿矫正测量 164
随机截距模型 165
模型的属性和作图 166
具有随机斜率的模型 168
Ime4程序包的注解 172
练习 172
第21章 生存分析 174
例:结婚年龄 174
R软件中的生存对象 177
寿命表 178
Kaplan-Meier曲线 179
累计风险率 180
生存曲线间的统计学比较 181
分层比较 181
参考文献 182
练习 182
第22章 Cox回归 183
Cox比例风险模型 183
比例风险假定的检验 184
风险比率的时间趋势 185
分层Cox回归 187
参考文献 190
练习 190
第23章 样本含量的估计 191
计算样本含量的函数 191
现场调查 191
两个率的比较 193
病例对照研究中p1、p2和比值比的关系 195
队列研究和随机化对照试验 196
横断面研究:检验一个假设 196
两个均数的比较 197
确保质量的抽样 198
两个率比较的功效 199
两个均数比较的功效 200
练习 201
第24章 文件 202
开始交互式分析 202
读入数据文件 202
Crimson编辑器 203
Tinn-R 203
编辑命令文件 204
控制流 205
在命令文件的中间断开 205
仅运行命令文件的一部分 205
在命令文件里绕过一些行 206
保存结果文本 206
保存图形 207
第25章 处理大型数据集的策略 208
清除R内存 208
模拟一个大型数据集 208
描述变量的子集 209
仅保留一个子样本 209
剔除数据 210
第26章 处理有关态度方面的数据 211
“Attitudes”数据集 211
“tableStack”用于逻辑型和因子变量 212
克朗巴赫α 213
归纳处理态度数据集的基本策略 216
第27章 为撰写论文准备表格 217
“tableStack”的概念 217
“tableStack”举例 218
更多的例子 219
把“tableStack”得到的结果放入论文中 220
Epicalc函数 221
Epicalc数据集 223
练习参考答案 224