1绪言 1
1.1为什么遗传学重要 1
1.2现代遗传学简明史 1
1.2.1紧跟遗传学思想 1
1.2.2孟德尔、达尔文以及遗传的波-粒辩论 2
1.2.3分子生物学的中心法则 2
1.2.4 DNA和遗传密码 2
1.2.5基因组学时代的来临 2
1.2.6后基因组时代 3
1.3复杂疾病研究如何融入遗传学 3
1.4最后感想 3
参考文献 4
2“统计学101”——人类复杂疾病遗传学的初级指南 5
引言 5
2.1数集理论基础 5
2.2遗传学分析中的概率理论 6
2.2.1条件概率 6
2.2.2独立性 6
2.3遗传学分析中的变量、参数和分布 7
2.3.1离散均匀分布 8
2.3.2正态分布 8
2.3.3卡方分布 9
2.3.4二项分布 9
2.4最大似然估计 10
2.5假设检验为结果提供置信水平 11
2.5.1 p值 11
2.5.2似然比、似然比检验统计量,以及优势对数计分法 12
2.5.3效能 13
2.6总结 14
参考文献 14
3分离性状的连锁分析 16
引言 16
3.1连锁 16
3.2疾病表型的连锁分析 19
3.3多位点连锁分析 21
3.4遗传模式判断错误的后果? 22
3.5血缘同一性的非参数连锁分析 23
3.6 LOD值的意义 24
3.7复杂疾病连锁分析中的遗传异质性 24
3.8连锁分析在全基因组关联研究时代的价值 25
参考文献 26
互联网信息 27
4复杂疾病遗传中的流行病学因素 28
引言 28
4.1关联研究的实施 28
4.1.1管理 28
4.1.2设计选择 29
4.1.3标记选择 29
4.1.4样本选择 30
4.1.5样本大小 31
4.1.6随机误差 31
4.1.7偏倚 31
4.1.8暴露的变化 32
4.1.9质控 32
4.2关联研究的解释 32
4.2.1理解因果 32
4.2.2因果关系,修饰效应,混杂 33
4.3大规模数据库 34
4.4整合的“取代的”研究 36
4.5结语 36
参考文献 37
互联网信息 38
5复杂表型的方差组分分析方法 39
引言 39
5.1什么是方差组分分析方法? 39
5.2估计遗传率 40
5.3环境共同效应的处理 41
5.4采用测定的环境参数作为协变量 42
5.5协变量选择对方差组分分析的影响 42
5.6使用易感性阈值模型 43
5.7连锁分析与方差组分的应用 44
5.8对研究选择进行确认的重要性 45
5.9非正态性的处理 45
5.10多重分析与基因多效性 46
5.11数量性状的关联分析 47
5.12在方差组分分析框架下的基因与基因、基因与环境的相互作用 47
5.13鉴定潜在的功能突变体 49
5.14小结与结论 50
参考文献 50
6遗传关联研究中的多重检验和效能计算 52
引言 52
6.1多重检验导致Ⅰ型错误的发生 52
6.2三种主要的多重检验校正方法 53
6.2.1控制总Ⅰ型错误率 53
6.2.2贝叶斯理论(Bayesian perspective) 54
6.2.3错误发现率 55
6.3成功有效的研究需要进行计算统计效能 59
6.3.1效能计算举例 59
6.3.2效能与样本量的关系 61
6.3.3间接关联的效能统计 62
6.3.4遗传研究中实际的效能统计 62
6.4致谢 63
参考文献 63
互联网信息 64
7遗传关联分析 65
引言 65
7.1具有显著效应的遗传相关性 66
7.2寻找直接相关性 66
7.2.1病例-对照研究 66
7.2.2病例-对照研究的统计学分析 66
7.2.3统计学分析范例 67
7.2.4数量计量的使用 69
7.3寻找间接相关性 70
7.3.1连锁不平衡法 70
7.3.2多标记及单体型的分析 71
7.3.3与疾病相关的基因间的交互作用 71
7.4应对分析中的问题 72
7.4.1质量控制 72
7.4.2哈-温平衡 72
7.4.3基因型缺失 73
7.4.4群体分层 74
7.5关联研究的缺点和问题 74
7.5.1假阳性结果 75
7.5.2重复实验效能的缺乏 75
7.5.3研究之间的异质性 75
7.5.4研究内的异质性 75
7.6结论 76
参考文献 76
8全基因组关联研究GWAS 78
引言 78
8.1 GWAS基于常见疾病-常见变异的假说 78
8.2标签SNP(tag SNP)与连锁不平衡(LD)是GWAS的基础 79
8.2.1标签SNP(tag SNP) 79
8.2.2连锁不平衡(LD) 79
8.2.3始祖突变与单倍型 81
8.3 GWAS研究中使用的芯片平台 82
8.4怎样做GWAS分析 82
8.4.1数据处理 82
8.4.2质控 83
8.4.3群体分层 85
8.4.4群体分层的校正 86
8.5 GWAS中的数据分析方法 87
8.6单倍型分析有助于定位功能变异 88
8.6.1鉴定单倍型 88
8.6.2 E-M算法 88
8.6.3单倍型模块 90
8.7 GWAS产生的一些关键结果 90
8.7.1老年性黄斑变性 90
8.7.2 Wellcome病例对照研究信托基金会(WTCCC) 90
8.7.3 1型糖尿病 90
8.8我的研究结果是阴性的——帮帮我 91
8.9其他的策略也很重要 91
8.9.1拷贝数变异 91
8.9.2少见变异 91
8.10结论 92
参考文献 92
互联网信息 95
9连锁不平衡、HapMap及插补介绍 96
引言 96
9.1一些基本LD统计学知识 96
9.1.1 LD统计量D′ 96
9.1.2 LD统计量r2 97
9.2利用国际单体型计划定位LD区域 97
9.3从标签到填补 99
9.4结论 100
参考文献 100
互联网信息 101
10全基因组关联研究的Meta分析 102
引言 102
10.1处理基因型数据缺失方面的输入软件 102
10.1.1数据输入的准确性及质量 103
10.1.2卡方校正 105
10.1.3将不确定的数据整合到Meta分析中 107
10.2 Meta分析准备工作 107
附录 109
参考文献 111
互联网信息 112
11基因-环境相互作用与复杂疾病 113
引言 113
11.1在遗传流行病学中基因-环境交互作用意味着什么 114
11.2常见疾病中存在基因-环境交互作用的证据 115
11.3从不同角度看基因-环境交互作用 115
11.3.1遗传角度 117
11.3.2公共卫生学角度 117
11.4为什么研究基因-环境交互作用? 117
11.5研究设计 120
11.5.1横断面病例-对照研究 120
11.5.2单纯病例研究设计 121
11.5.3前瞻性队列研究设计 121
11.6基因-环境交互作用研究中的统计效能和样本量 122
11.7结果的重复性和Meta分析 124
11.8候选基因与全基因组研究 124
11.9概括与结论 125
参考文献 126
互联网信息 128
12基于家系的遗传学关联分析 129
引言 129
12.1为什么要开展基于家系的关联研究? 129
12.2早期基于家系的关联研究与病例-对照研究 131
12.3传递不平衡检验是一种连锁分析 132
12.4传递不平衡检验是一种关联和连锁分析 133
12.5基于家系的关联分析具有广泛的应用范围 135
12.5.1用于迟发型疾病的分析 135
12.5.2用于一般核心家系的关联和连锁分析 135
12.5.3用单体型进行分析 136
12.5.4对连续数量性状的关联研究 137
12.5.5 X连锁遗传的关联研究 137
12.5.6对父母起源和母源效应的研究 138
12.5.7基因间和基因与环境间相互作用的研究 138
12.6结语 139
致谢 139
参考文献 140
互联网信息 143
13拷贝数变异与人类常见疾病 144
引言 144
13.1人类基因组中的拷贝数变异 144
13.2结构变异的形成机制 145
13.3拷贝数变异对基因表达的影响 146
13.4 CNV的群体特征 146
13.5人类常见疾病的遗传结构:基于SNP-和CN V-的GWAS 147
13.6 CNV的研究是怎样改变我们对复杂疾病遗传结构认识的? 148
13.7 CNV检测技术进展及在复杂疾病研究中的应用 150
13.8结语 151
参考文献 151
互联网信息 158
14肿瘤基因组学 159
引言 159
14.1肿瘤的遗传基础 159
14.2肿瘤中基因组学以及基因改变研究 162
14.2.1肿瘤中拷贝数变异分析 162
14.2.2基因组重排的发现 162
14.2.3肿瘤中的体细胞突变 164
14.2.4肿瘤中的常见变异 166
14.2.5肿瘤中的表观遗传改变 167
14.3肿瘤转录组改变 171
14.3.1研究转录基因组改变的方法 171
14.4候选癌基因的优选 172
14.4.1癌基因筛选 172
14.4.2癌基因的计算优选 173
14.5不同类型肿瘤基因组学数据的整合 174
14.5.1研究方法 174
14.5.2肿瘤基因组学整合研究计划及资料库 175
14.6小结 177
致谢 177
参考文献 177
互联网信息 188
15序列变异影响信使RNA前体剪接并导致(复杂)疾病的机制:不局限于遗传密码 190
引言 190
15.1剪接的发生过程 191
15.1.1为定位剪接位点,剪接增强子和沉默子是必需的 193
15.2剪接失调导致疾病 196
15.3剪接突变不直接参与剪接位点的构成 199
15.3.1 MCAD中SRE突变:单倍型的重要性 202
15.3.2 CFTR 9号外显子的SRE突变和错误剪接 202
15.3.3 SMN1/2,剪接和脊髓肌萎缩 203
15.3.4外显子跳跃和脆弱性 204
15.4剪接调节蛋白和剪接体成分中的常见遗传变异能导致亚最佳剪接 204
15.5环境影响剪接 205
15.6 In Silico评估工具用于评估剪接效应 207
15.7结论 208
参考文献 209
互联网信息 214
16高通量基因分型的实验室研究方法 215
引言 215
16.1为什么要选用SNP? 216
16.2候选基因有用吗? 217
16.3连锁区域可以通过高通量SNP基因分型进行精确定位 219
16.4 GWAS及其相关基因分型 220
16.5 SNP数据需要做好质量控制 222
16.6下一代测序技术将带来基因分型的革命性变化 225
16.7小结和结论 226
致谢 226
参考文献 227
互联网信息 229
17全基因组关联研究的基因集分析和网络分析 230
引言 230
17.1基因集分析和基因网络分析 232
17.1.1将遗传关联定位到基因 234
17.1.2 GWAS的GSA和网络分析:到更深处捕捞更小的鱼 235
17.1.3 GSA的应用 237
17.1.4网络和上位分析的应用 238
17.1.5 GWAS联合和网络与eQTL分析 238
17.2挑战与前景 239
参考文献 240
互联网信息 244