第一章 概述 1
第一节 分子生物学技术及基因、基因组科学发展历史简介 1
第二节 基因芯片技术简介 3
一、基因芯片的基本概念 4
二、基因芯片技术的产生和发展 4
三、基因芯片的应用领域 6
第三节 生物信息学与基因芯片的数据挖掘 7
一、生物信息学的兴起 7
二、基因芯片的数据挖掘 8
参考文献 9
第二章 微阵列基因芯片实验技术 11
第一节 基因芯片的价值和分类 11
一、基因芯片的价值 11
二、基因芯片的分类 12
一、基片的类型和性质 15
第二节 基片的制备 15
二、玻璃基片表面的修饰方法 17
第三节 点样探针的制备 18
一、cDNA探针的制备 19
二、基因组DNA探针 19
三、寡核苷酸探针 19
四、独特的PM-MM探针设计 20
一、芯片点样仪和点样方式 22
第四节 基因芯片点样 22
二、点样后处理 27
三、基因芯片的质量标准 28
第五节 原位合成及纳米结构的基因芯片制备 28
一、原位合成法制作基因芯片 28
二、纳米结构的基因芯片制备 31
第六节 表达谱基因芯片的检测方法 34
一、样本选择、处理和RNA的分离 35
二、mRNA样本标记 35
三、芯片杂交 38
参考文献 39
第三章 统计学基础 41
第一节 统计学的基本概念 41
一、总体与样本 41
二、资料的统计描述 42
三、随机变量、概率与分布 43
四、统计量 45
第二节 假设检验 46
一、假设检验的基本原理 46
二、假设检验的步骤 47
三、假设检验的基本方法 47
第三节 方差分析 54
一、完全随机设计资料的方差分析 54
二、随机区组设计资料的方差分析 55
三、多个样本均数间的多重比较 57
第四节 聚类分析与判别分析简介 57
一、聚类分析 58
二、判别分析 59
参考文献 61
第四章 实验设计 62
第一节 样品配对模式 62
一、基因芯片实验的分类 62
二、样品配对方案概述 64
三、样品配对模式的选择 66
第二节 样品的重复及合并 69
一、实验误差的来源及重复样品的使用 69
二、样品重复数量的确定 70
三、样品合并 70
第三节 总结 72
参考文献 72
第五章 基因芯片图像的采集和处理 74
第一节 基因芯片图像的采集 74
一、激光共聚焦扫描仪 74
二、CCD扫描仪 78
三、扫描仪的技术指标 79
第二节 基因芯片图像的处理 81
一、划格 83
二、分割 84
三、信息提取 87
四、质量评估 88
第三节 一些芯片扫描仪和芯片图像处理软件的介绍 88
一、激光共聚焦扫描仪 90
二、激光非共聚焦扫描仪 91
三、CCD基因芯片检测仪 92
参考文献 96
第六章 数据的预处理和归一化 98
第一节 数据的预处理 98
一、背景的校正 98
二、弱信号的处理 99
三、数据的对数转换 101
四、重复数据的合并 102
五、缺失数据的处理 103
第二节 数据的归一化 104
一、cDNA芯片数据的归一化 105
二、Affymix芯片数据的归一化 115
参考文献 118
第七章 差异表达基因分析 120
第一节 差异表达基因的挑选 120
一、倍数法 120
二、Z值法 121
三、重复实验的判别方法 121
四、其他方法 124
五、总结 125
第二节 研究差异表达基因的意义 126
一、在基因组研究中的作用 126
二、在药物研究中的作用 127
三、在医学基础研究中的作用 129
参考文献 131
第八章 芯片数据的可靠性分析 133
第一节 数据的评价 133
一、差异表达基因的可靠性 133
二、芯片数据重复性评价 139
第二节 误差来源分析 142
一、生物学差异来源 142
二、实验系统误差 144
第三节 基因芯片的质控体系 149
一、直接点样的基因芯片的质控体系 149
二、Affymetrix的寡核苷酸芯片质控体系及其产品质量评估 151
第四节 信号线性扩增技术及其评估 154
一、信号线性扩增技术 154
二、信号扩增方法的可靠性评价 154
参考文献 161
一、欧氏距离 162
第一节 相似性(或距离)的度量 162
第九章 聚类分析和可视化 162
二、马氏距离 163
三、Chebychev距离 164
四、Mahalanobis距离 164
五、Minkowski距离 164
六、平均点积 164
七、向量间的角度 165
八、协方差 165
九、Pearson相关距离 165
十、Spearman秩相关 166
十一、互信息 166
十二、Kendall's Tau 167
第二节 聚类算法 167
一、系统聚类 168
二、分割聚类 172
二、区组聚类 177
第三节 二维聚类 177
一、耦联二维聚类 177
第四节 主成分、SVD和基因修剪 178
一、主成分 178
二、奇异值分解 178
三、基因修剪 179
参考文献 179
第十章 微阵列实验中的分类方法 181
第一节 概述 182
一、利用基因表达谱数据进行生物样本分类 183
二、分类的背景 183
三、基因表达谱数据 184
第二节 不同分类方法的概述 184
一、分类及统计决策论 184
二、费歇线性判别分析 186
三、线性判别和二次判别分析 186
五、最近邻分类器 188
四、线性判别分析的扩展 188
六、决策树 190
七、BP神经网络分类法 194
八、支持向量机 197
九、Parzen窗 204
第三节 分类中的一般问题 205
一、特征选取 205
二、标准化和距离函数 206
三、缺失值填充 207
四、多分类问题 208
第四节 性能评价 209
一、偏差、方差和误差率 209
二、再置换估计 210
三、倍数交叉验证法 210
四、解靴带估计 210
一、基因表达谱数据 211
第五节 实例分析 211
二、数据预处理 212
三、支持向量机软件应用 213
参考文献 216
第十一章 微阵列技术的标准化 218
第一节 MIAME规则 218
一、MIAME规则的具体内容 219
二、MIAME表单 221
三、MIAME的目前与将来 222
第二节 Affimetrix芯片系统与MIAME规则 223
一、遵循MIAME规则 224
二、Affimetrix实验的MIAME表单 225
三、Affimetrix的RNA抽提、清洗、标记和杂交规范 225
参考文献 227
第一节 单一基因的注释 228
一、一般的注释 228
第十二章 基因芯片数据的基因注释和功能分析 228
二、关于疾病的信息 233
三、蛋白质家族的信息 234
第二节 转录因子调节的分析 235
一、Transfac数据库 236
二、转录因子研究中的统计学检验 238
第三节 Gene Ontology数据库中基因功能分类的分析 240
一、Gene Ontology数据库 240
二、GO数据库相关分析的工具 241
第四节 生物学通路和生物学相互作用的分析 243
一、生物学通路中的基因分析 244
二、生物学网络中的基因分析 249
三、基因芯片数据中使用者自己定义的基因集的分析 250
参考文献 251
第十三章 系统生物学及基因调控网络 252
第一节 系统生物学简介 252
一、基因转录过程简介 253
第二节 基因转录调控网络的构成 253
二、研究转录因子及其调控基因的实验方法 254
三、基因调控网络与图形 254
第三节 用高斯图形模型推导基因调控网络 257
第四节 贝叶斯网络模型在基因芯片数据中的应用 259
一、贝叶斯网络简介 259
二、学习贝叶斯网络 261
三、贝叶斯网络方法在基因芯片数据方面的应用 262
第五节 从时间序列数据中推导基因调控网络 266
一、基因调控网络模型的“事件模型” 266
二、关于基因调控网络的“动态概率模型” 268
第六节 通过基因扰动来推导基因调控网络的反义工程方法 270
第七节 结论 271
参考文献 272
第十四章 基因芯片技术的应用——从基因筛选到临床诊断 274
第一节 基因表达谱研究与临床肿瘤学 274
一、确定肿瘤亚型 275
二、识别肿瘤的组织来源 276
三、预后分析 276
四、存在问题 277
第二节 微矩阵芯片和遗传多态性 278
一、单核苷酸多态性简介 278
二、基因多态性与疾病易感性 279
三、基因多态性作为遗传标记的应用 279
四、基因多态性与个性化用药 280
五、基因多态性和基因芯片检测技术 281
第三节 微矩阵和基因拷贝数变化 282
一、cDNA阵列CGH 283
二、基因组阵列CGH 283
第四节 微矩阵和感染性疾病 284
一、微生物的鉴定和分型 285
二、耐药性研究 286
三、致病机理研究 287
一、微矩阵芯片和DNA甲基化分析 288
第五节 微矩阵芯片的其他应用 288
二、转录因子结合位点分布 290
三、展望 291
参考文献 292
第十五章 主要数据分析软件的介绍 295
第一节 分析软件在基因芯片技术中的地位 295
第二节 主要图像和数据处理软件 296
一、基因芯片图像分析软件GenePix Pro 296
二、Affymetrix GCOS系统 297
三、Cluster和TreeView程序 298
四、GeneSpring 300
五、SpotFire DecisionSuite 300
六、SAM和PAM 302
七、R平台及生物导体 303
第三节 基因表达谱公共数据库 304
一、NCBI-Gene Expression Omnibus(GEO)基因表达数据专用库 304
八、MATLAB生物信息工具箱 304
二、EBI ArrayExpress和SMD 307
三、微阵列数据库的建立和管理 307
第四节 基因注释数据库的访问 308
一、斯坦福大学SMD/SOURCE 309
二、UCSC基因组浏览器 309
三、mySQL客户 310
参考文献 311
一、系统生物学的启动 312
第十六章 展望 312
第一节 后基因组研究的趋势——系统生物学 312
二、系统生物学的发展趋势 313
第二节 后基因组应用研究发展的趋势——基因组医学 314
第三节 基因芯片技术在系统生物学和基因组医学中的地位 316
一、基因芯片及数据挖掘在基础研究中的地位 316
二、基因芯片技术在基因组医学分子诊断中的应用趋势 316
参考文献 318