第1章 作物品种试验的理论基础 1
1.1 多年多点品种试验的遗传力 2
1.2 提高作物品种试验效率的方法探讨 4
1.2.1 提高遗传方差分量的比率 4
1.2.2 增加试验年份 4
1.2.3 增加试验点数量 5
1.2.4 增加单点试验的重复次数 5
1.2.5 减少试验误差 5
1.2.6 利用可重复的基因型与试点互作效应 6
1.3 遗传力的各种类型与解释 6
1.3.1 无重复的多年多点品种试验中数据 6
1.3.2 一年多点试验数据 6
1.3.3 多年单点试验数据 7
1.3.4 单点试验数据 7
1.4 基因型—环境数据的遗传力估计 8
1.4.1 有重复的基因型—环境数据的遗传力估计 8
1.4.2 基因型—环境的平均值两向表 10
1.4.3 无重复品种试验的基因型—环境两向表 11
1.4.4 基于多年有重复试验的基因型—试点平均值两向表 11
1.5 遗传力和目标区域的亚区划分 11
1.5.1 遗传力和方差分量分析 11
1.5.2 遗传力和目标区域亚区划分 12
1.5.3 如何划分目标区域 13
1.5.4 不同目标区域的整合 13
1.6 以各基因型的遗传力为收敛因子 14
1.7 方差分量和遗传力估计 14
1.7.1 均方、期望均方和方差分量 14
1.7.2 遗传力估计实例 15
1.8 总结 19
第2章 品种试验数据和分析方法综述 21
2.1 品种试验数据的层次 21
2.1.1 品种试验数据的3个层次 21
2.1.2 性状的3种类型 21
2.1.3 品种试验数据分析的层次 22
2.2 单点试验数据和分析 22
2.2.1 单点试验数据 22
2.2.2 数据分析的目标 22
2.2.3 数据分析途径与技术 22
2.3 一年试验数据和分析 23
2.3.1 一年多点试验数据 23
2.3.2 数据分析的目标 24
2.3.3 方法与技术 24
2.4 多年试验数据和分析 25
2.4.1 多年品种试验数据 25
2.4.2 数据分析的目的 25
2.4.3 方法与技术 25
2.5 多性状决策 26
2.5.1 数据分析的目的 26
2.5.2 方法与技术 27
第3章 双标图分析介绍 28
3.1 双标图与矩阵乘法 29
3.2 基于双标图内积特征的各种视图 31
3.2.1 矩阵元素的符号和数值展示 31
3.2.2 在行内对诸列排序 32
3.2.3 列内对诸行排序 32
3.2.4 两行比较 32
3.2.5 两列比较 34
3.2.6 找出各列中数值最大的行 34
3.2.7 找出各行中数值最大的列 35
3.3 从两向数据构建双标图的步骤 36
3.3.1 奇异值分解和主成分分析 36
3.3.2 奇异值分配 39
3.3.3 重新定标后的行和列得分 40
3.3.4 双标图的垂直或水平翻转 41
3.3.5 双标图的旋转 43
3.3.6 行和列得分与双标图模式 43
3.4 双标图分析的应用 44
第4章 双标图分析的数据中心化 45
4.1 数据中心化的5种类型 46
4.1.1 未中心化数据 46
4.1.2 总均值中心化数据 47
4.1.3 环境中心化数据 48
4.1.4 双向中心化数据 50
4.1.5 基因型中心化数据 51
4.2 各种双标图对基因型评价的适用性 53
4.2.1 基于未中心化数据的双标图 53
4.2.2 基于总均值中心化数据的双标图 54
4.2.3 基于环境中心化数据的双标图 54
4.2.4 双向中心化数据的双标图 55
4.2.5 基于基因型中心化的双标图 55
4.2.6 GGE双标图是唯一适用于基因型评价的双标图 55
4.3 不同双标图对试验环境评价的适用性 56
4.3.1 基于未中心化数据的双标图 56
4.3.2 基于总均值中心化数据的双标图 56
4.3.3 基于环境中心化数据的双标图 57
4.3.4 基于双向中心化数据的双标图 57
4.4 GGE双标图的特性 59
4.4.1 “G+GE”是数量遗传学的基本概念 59
4.4.2 基因型间的GGE距离等同于其欧氏距离 60
4.4.3 环境向量的长度与其标准差成比例 60
4.4.4 环境向量夹角的余弦值近似于其相关系数 61
4.5 其他类型双标图的应用 61
4.5.1 用基于未中心化数据的双标图研究QTL效应与环境的互作 62
4.5.2 基因表达数据的GE双标图分析 63
4.5.3 EGE双标图应用于适宜生产区域的筛选 65
4.6 不同数据中心化双标图的生成 65
4.6.1 方差分析表 65
4.6.2 基于不同数据中心化方法的双标图生成 65
4.6.3 基于基因型中心化数据生成EGE双标图 66
4.6.4 双标图的“谁赢在哪里”功能图 66
4.6.5 双标图的环境向量功能图 66
4.6.6 试验环境间相关分析 66
4.6.7 在双标图中剔除敏感度差的基因 66
第5章 GGE双标图分析的数据定标和权重分配 67
5.1 间接选择理论与GGE双标图在评价试验环境上的联系 67
5.2 作物品种试验的统计特征参数 69
5.3 GGE双标图分析的数据定标方法 70
5.3.1 未定标的GGE双标图 70
5.3.2 SD定标的GGE双标图 71
5.3.3 SE定标的GGE双标图 72
5.3.4 SD定标和h加权的GGE双标图 72
5.3.5 h加权的GGE双标图 73
5.3.6 环境均值定标和h加权的GCE双标图 73
5.3.7 环境最大值定标和h加权的GGE双标图 75
5.4 基于因子分析的GGE双标图 76
5.5 GGE双标图分析的适宜数据定标方法 77
5.5.1 适用于试验环境评价的定标方法 77
5.5.2 适合于基因型评价的定标方法 78
5.6 双标图分析中如何进行数据定标 79
第6章 双标图分析的常见问题 80
6.1 常见问题解答 80
6.1.1 PC1和PC2代表什么? 80
6.1.2 PC1和PC2的单位是什么? 81
6.1.3 双标图分析前需要做什么准备? 81
6.1.4 双标图可以充分展示两向表中的模式吗? 81
6.1.5 如果只需要第一个主成分怎么办? 82
6.1.6 如果双标图未充分展示数据怎么办? 82
6.1.7 如果数据集中有缺值怎么办? 86
6.1.8 双标图中两个基因型间的差异在统计学上显著吗? 87
6.1.9 两个环境间的相关性在统计学上显著吗? 90
6.1.10 双标图中的互作模式在统计学上显著吗? 91
6.1.11 GGE双标图和AMMI“双标图”:哪个更好? 91
6.1.12 FA双标图优于GGE双标图吗? 93
6.2 双标图解释中的常见错误 94
6.2.1 “PC1得分代表基因型主效应” 94
6.2.2 “GGE双标图可以展示基因型间的相关性” 94
6.2.3 “GGE双标图展示基因型—环境的相关性” 94
6.2.4 双标图中未标注数据中心化和定标方法 94
6.2.5 双标图不按比例绘制 95
6.2.6 基于多年平均的基因型与试点两向表的GGL双标图 95
6.2.7 基于PC1和PC2以外的主成分构建的双标图 95
6.2.8 “GE双标图可以与GGE双标图作类似的解释” 95
第7章 单点试验数据分析 96
7.1 单点试验数据分析的目的与步骤 96
7.2 品种试验的鉴别力和精确度 97
7.3 检查和纠正人为误差 99
7.3.1 使用简单的遗传性状检测人为误差 99
7.3.2 用基因型—重复双标图检查数据的录入错误 99
7.3.3 用基因型—重复双标图检查其他人为错误 100
7.4 用空间分析校正田间趋势和差异 101
7.4.1 通过田间设计和空间分析控制田间差异 101
7.4.2 空间分析模型 102
7.4.3 实例分析一:2008年加拿大魁北克省普林斯维尔试点的燕麦品种试验 104
7.4.4 实例分析二:2011年安大略省渥太华点的燕麦品种试验 110
7.4.5 实例分析三:不需要空间校正的数据集 112
7.4.6 实例分析四:空间校正不能改良的数据集 114
7.5 单点试验分析小结 115
7.6 单点试验数据分析的操作 116
7.6.1 用GGEbiplot软件分析单点试验数据 116
7.6.2 如何生成关于基因型与重复的双标图 116
7.6.3 GGEbiplot的方差分析和空间分析功能 118
7.6.4 如何分析基于设计的试验数据 120
7.6.5 如何进行空间变异校正 120
7.6.6 如何生成两个变量的散点图 120
7.6.7 如何生成多性状双标图 121
第8章 基因型—环境两向表数据分析 122
8.1 单年试验基因型—环境数据分析的目的 122
8.2 分析高遗传力性状以检查人为错误 124
8.3 单点试验的基本统计量 127
8.4 多点试验联合方差分析 128
8.5 品种生态区划分 129
8.5.1 GGE双标图的试点向量功能图 130
8.5.2 GGE双标图的“谁赢在哪里”功能图 131
8.6 基因型评价 133
8.6.1 广适性基因型鉴别 133
8.6.2 鉴别特殊适应性品种 138
8.7 试点评价 142
8.7.1 一套试点的筛选 142
8.7.2 核心试点的筛选 143
8.7.3 试点评价应在品种生态区内进行 144
8.8 试点的数目:太多还是太少? 147
8.9 如何实施双标图分析和传统的数据分析 148
8.9.1 用GGE双标图读取数据形成双标图的步骤 148
8.9.2 生成GGE双标图的“环境向量”功能图 150
8.9.3 GGE双标图“谁赢在哪里”功能图的产生 150
8.9.4 GGE双标图“丰产性与不稳定性”功能图的生成 150
8.9.5 GGE双标图“理想品种”功能图的生成 151
8.9.6 GGE双标图“代表性与鉴别力”功能图的生成 151
8.9.7 GGE双标图“理想试点”功能图的生成 151
8.9.8 关于两个变量的散点图的生成 151
8.9.9 如何估计最适试点数目 152
第9章 基因型—性状数据分析与决策 153
9.1 “基因型—性状”双标图模型 154
9.2 单点试验“基因型—性状”数据的双标图分析 154
9.3 整套试验的基因型—性状数据的双标图分析 158
9.4 基于品种生态区内多点试验基因型—性状均值的双标图 159
9.4.1 北部品种生态区试点的基因型—性状双标图 159
9.4.2 南部品种生态区试点的基因型—性状双标图 162
9.5 基于多性状的基因型评价 164
9.5.1 多性状选择的三大策略 164
9.5.2 基于单性状淘汰的指数选择:北部品种生态区 165
9.5.3 基于单性状淘汰的指数选择:南部品种生态区 168
9.6 基于基因型—性状数据配制新杂交组合 170
9.7 “基因型—性状”数据分析的操作方法 171
9.7.1 如何生成“基因型—性状”双标图 171
9.7.2 如何应用“单性状淘汰后的指数选择”策略 172
9.7.3 如何基于基因型—性状数据规划新组合配制? 176
9.7.4 如何决定育种目标的权重? 177
第10章 性状关联与环境两向表数据分析 178
10.1 利用ABE双标图分析不同环境中性状间的相关性 178
10.2 利用ABE双标图分析不同环境中目标性状与解释性状的相关性 183
10.3 利用QQE双标图分析不同环境中分子标记与性状的相关性 184
10.4 如何生成ABE双标图 186
10.4.1 如何生成Ⅰ型ABE双标图? 186
10.4.2 如何生成Ⅱ型ABE双标图? 187
10.4.3 如何生成QQE双标图? 188
第11章 试点与性状两向表数据分析 189
11.1 基于所有基因型的试点—性状数据 189
11.2 基于单个基因型的试点—性状数据 192
11.3 可重复的性状间环境相关 194
11.4 如何实现这些分析? 195
第12章 多年试验数据的品种生态区分析 197
12.1 什么是品种生态区? 197
12.2 利用多年数据分析品种生态区的策略 198
12.3 第一种方法:逐年分析,多年总结 199
12.3.1 2008年的试点分组 199
12.3.2 2009年的试点分组 201
12.3.3 2010年的试点分组 202
12.3.4 2011年的试点分组 203
12.3.5 对试点分组模式的多年总结 205
12.4 第二种方法:多年数据同步分析 205
12.5 品种生态区分析和目标区域分类 207
12.5.1 Ⅰ型:目标环境由多个品种生态区组成 207
12.5.2 Ⅱ型:目标环境为单一的简单品种生态区 207
12.5.3 Ⅲ型:目标环境为单一的决定于GY的复杂品种生态区 208
12.5.4 Ⅳ型:目标环境为单一的决定于GLY的复杂品种生态区 208
12.5.5 Ⅴ型:目标环境的GE是可变的 208
12.5.6 品种生态区的大小与复杂性 208
12.6 品种生态区分析中的常见问题 209
12.6.1 品种生态区分析的两种方法哪一个最好? 209
12.6.2 双标图的哪种功能图最适用于品种生态区划分? 209
12.6.3 每年都需要进行品种生态区分析吗? 209
12.6.4 品种试验应当在品种生态区内还是跨品种生态区实施? 210
12.6.5 一个基因型有可能适应于多个品种生态区吗? 210
12.6.6 可靠的品种生态区分析需要多少年的数据? 210
12.6.7 联合方差分析能告诉我们什么? 210
12.6.8 如何验证品种生态区划分的有效性? 211
12.6.9 “谁赢在哪里”模式和“谁输在哪里”模式 211
12.6.10 基因型评价可以使用其他品种生态区的数据吗? 211
12.7 如何实现品种生态区分析? 212
12.7.1 基于多年数据生成单年GGL双标图 213
12.7.2 基于多年数据生成GGE双标图 214
12.7.3 生成GGE双标图“谁输在哪里”功能图 214
12.8 基于GGL+GGE的品种生态区分析 215
12.8.1 基于多年数据生成GGL+GGE双标图 215
12.8.2 用GGS+GGE双标图概括GGE双标图中的基因型与亚区互作模式 216
第13章 基于多年品种试验数据的试验点评价 218
13.1 与试点评价相关的概念、定义和术语 218
13.1.1 目标环境的总体(PTE) 218
13.1.2 平均环境和平均环境轴 219
13.1.3 试验环境或试点的代表性 219
13.1.4 试验环境或试点的鉴别力 219
13.1.5 代表性和鉴别力的综合指数 219
13.1.6 用于选择基因型主效的理想试点 220
13.1.7 用于剔除不稳定基因型的试验点 220
13.1.8 应当淘汰的试验点 220
13.1.9 代表性和特异性 220
13.2 基于GGE双标图的试验点评价 221
13.2.1 显示试验环境代表性和鉴别力的GGE双标图功能图 222
13.2.2 展示环境选择G并规避GE能力的双标图功能图 224
13.3 对北部品种生态区中单个试验点的评价 225
13.3.1 NB(哈特兰,新不伦瑞克省) 226
13.3.2 ON1(新利斯卡德,安大略省) 226
13.3.3 PE(哈灵顿,爱德华王子岛) 226
13.3.4 QC1(诺曼丁,魁北克省) 228
13.3.5 QC4(普林斯维尔,魁北克) 228
13.4 南部品种生态区中单个试验点的评价 229
13.4.1 ON2(伊根维尔,安大略省) 233
13.4.2 ON3(渥太华,安大略省) 233
13.4.3 ON4(帕墨斯顿,安大略省) 234
13.4.4 ON5(圣玛丽斯,安大略省) 235
13.4.5 ON6(奈恩,安大略省) 236
13.5 试验点评价的操作方法 237
13.5.1 统计参数的生成 237
13.5.2 GGE双标图之代表性和鉴别力功能图的生成 238
13.5.3 突出单个试点的GGE双标图的生成 238
13.5.4 “格式”菜单中的其他功能 239
13.5.5 用符号标记基因型 239
第14章 基于多年品种试验数据的基因型评价 242
14.1 利用当年数据进行基因型评价 243
14.1.1 北部品种生态区 243
14.1.2 南部品种生态区 248
14.2 基于多年数据的平衡子集的基因型评价 253
14.2.1 北部品种生态区 253
14.2.2 南部品种生态区 254
14.3 基于多年试验全部数据的基因型评价 255
14.3.1 北部品种生态区 255
14.3.2 南部品种生态区 257
14.4 基因型评价中的“稳定性分析”探讨 259
14.4.1 稳定性指数的作用及应用方法 259
14.4.2 基因型—环境互作在品种评价中的应用 260
14.4.3 稳定性基因存在吗? 261
14.5 关于基因型评价中应用固定模型与混合模型的讨论 261
14.6 如何实现基于多年数据的基因型评价 263
14.6.1 如何实现基因型的平均值和不稳定性的可视化 263
14.6.2 如何依据LSD定标的平均值进行基因型评价 263
14.6.3 如何基于平均值和不稳定性对基因型排序 263
14.6.4 如何利用原始数据中的平衡子集生成GGE双标图 264
第15章 农作物品种试验关联性数据库的构建与应用 265
15.1 从数据库中提取数据 265
15.1.1 选择研究项目 267
15.1.2 选择年份 267
15.1.3 选择试点 267
15.1.4 选择性状 267
15.1.5 选择基因型 268
15.1.6 查询数据的保存 269
15.2 COOL数据库结构 271
15.2.1 COOL数据库的表及其相互关系 271
15.2.2 数据统一的机理 273
15.3 将原始数据输入数据库 273
15.4 编辑数据库的表 276
第16章 作物品种试验和育种圃的试验设计 278
16.1 多点品种试验的试验设计 278
16.1.1 完全随机区组设计 279
16.1.2 不完全区组设计 282
16.1.3 增广设计 284
16.1.4 行列设计 284
16.2 重复数不相等的试验设计 284
16.3 育种圃试验的非随机化设计 288
16.4 育种材料早代处理模块 291
16.4.1 育种材料世代升级的设计 291
16.4.2 育种品系在不同数量的小区或盆钵中进行种子扩繁的计划 293
16.4.3 新杂交组合命名 294
16.4.4 参加多点试验的育种品系重命名 296
第17章 GGE双标图的模块与功能 299
17.1 三个主要功能组 299
17.1.1 试验设计和数据分析 300
17.1.2 导入或编辑COOL关联性数据库 300
17.1.3 从COOL关联性数据库中提取数据 300
17.2 GGE双标图分析的数据准备 300
17.2.1 数据文件类型 300
17.2.2 数据格式 300
17.3 两维数据操作 301
17.3.1 试验对象与试验主体的角色转换 301
17.3.2 缺值填充 301
17.3.3 变量推导 302
17.3.4 删除含缺值的基因型或环境来形成平衡子集并生成双标图 302
17.3.5 删除含缺值的基因型或环境来形成部分平衡子集并生成双标图 302
17.3.6 删除任意基因型或环境来形成子集并生成双标图 302
17.3.7 双列杂交数据分析功能 302
17.3.8 依据基因型在双标图中的位置进行删除 303
17.3.9 依据试验环境在双标图中的位置分级 303
17.3.10 试验环境符号转换 303
17.3.11 返回前一个数据子集 303
17.3.12 返回原始两向表双标图 304
17.4 四维数据操作 304
17.4.1 任意性状的基因型—年份双标图 304
17.4.2 任意性状的基因型—试点双标图 304
17.4.3 任意性状的基因型—环境双标图 304
17.4.4 基因型—性状双标图 305
17.4.5 性状关联—环境双标图(ABE双标图) 305
17.4.6 年份—性状双标图 305
17.4.7 试点—性状双标图 305
17.4.8 环境—性状双标图 305
17.4.9 表型—性状双标图 305
17.4.10 基因型对环境—性状组合的双标图 305
17.4.11 任意性状的年份—试点双标图 305
17.5 双标图的模型选择 306
17.5.1 数据转换 306
17.5.2 数据定标和加权 306
17.5.3 数据中心化 307
17.5.4 奇异值分配 307
17.6 双标图的各种功能图菜单 307
17.6.1 探究某个试验对象(通常是品种) 308
17.6.2 探究某个试验环境 308
17.6.3 试验环境间相关性 308
17.6.4 基因型的相似性 308
17.6.5 同心圆 308
17.6.6 基因型的两两比较 308
17.6.7 两个试验环境的综合 309
17.6.8 基因型与环境的关系 309
17.6.9 “谁赢在哪里”功能图 309
17.6.10 平均值与不稳定性功能图 309
17.6.11 鉴别力和代表性功能图 309
17.6.12 基于理想试点的试点排序 309
17.6.13 基于理想基因型的基因型排序 309
17.6.14 基于某基因型(或环境)对基因型(或环境)排序 309
17.6.15 双标图翻转 310
17.6.16 双标图旋转 310
17.6.17 显示环境间的线性映射图 310
17.6.18 显示基因型间的线性映射图 310
17.7 改变双标图的外观 310
17.7.1 双标图标题 311
17.7.2 双标图大小 311
17.7.3 单个标志格式化 311
17.7.4 改变配色方案 311
17.7.5 改变标签颜色 311
17.7.6 改变基因型或环境的大小写 311
17.7.7 改变字体 311
17.8 改变基因型和环境的视图 312
17.8.1 清除双标图背景的噪音 312
17.8.2 清除投影线 312
17.8.3 显示原始名称 312
17.8.4 添加或清除符号 312
17.8.5 图标数字化视图 313
17.8.6 用户自由定义图标名称 313
17.8.7 显示最后N个字母 313
17.8.8 显示前面N个字母 313
17.8.9 隐藏前面N个字母 313
17.8.10 隐藏最后N个字母 313
17.8.11 同时显示基因型和环境 313
17.8.12 只显示基因型 313
17.8.13 只显示环境 313
17.8.14 显示或隐藏标题 313
17.8.15 显示或隐藏轮廓线 313
17.8.16 显示或隐藏数据来源 313
17.9 图像输出 314
17.9.1 复制图像到剪贴板 314
17.9.2 打印图像 314
17.10 自动数值输出 314
17.10.1 试验环境的汇总性统计量 315
17.10.2 原始数据的方差分析表 315
17.10.3 定标数据的方差分析表 315
17.10.4 定标数据的汇总性统计量 315
17.10.5 基因型的多重比较 315
17.10.6 数据中心化和定标后的两向数据表 316
17.10.7 用估计值填充缺值后的两向表 316
17.10.8 前6个主成分分别解释的信息量 316
17.10.9 双标图预测的基因型平均值和不稳定性 316
17.10.10 基因型到“理想”基因型的距离 316
17.10.11 环境的鉴别力和代表性指标 316
17.10.12 环境到“理想”试验环境的距离 316
17.10.13 空间分析结果输出 316
17.11 用户请求的数值输出 317
17.11.1 原始两向表 317
17.11.2 当前用于SVD的数据子集 317
17.11.3 中心化和定标前的现有数据子集 317
17.11.4 预测值 317
17.11.5 特征向量 318
17.11.6 双标图坐标轴 318
17.11.7 环境间的相关矩阵 318
17.11.8 所有环境间的距离矩阵 318
17.11.9 各环境的向量长度 318
17.11.10 多重比较 318
17.12 常规统计分析 318
17.12.1 自动运行的分析 318
17.12.2 方差分析和空间分析 318
17.12.3 关联分析 319
17.13 基于多性状的基因型评价 319
17.13.1 相对于最好品系的多性状决策 320
17.13.2 相对于对照品种的多性状决策 320
17.13.3 配组形成新杂交组合 320
17.14 三维双标图模块 320
17.15 数据散点图 322
第18章 结论 323
18.1 如何评价作物品种试验的有效性 323
18.2 多环境品种试验数据分析的要点 323
18.3 单点试验数据分析的要点 324
18.4 多性状数据分析的要点 324
18.5 数据管理和分析工具 325
参考文献 326