第1章 绪论 1
1.1 高性能并行仿真技术 1
1.1.1 现代仿真技术对高性能的计算需求 1
1.1.2 并行计算平台的性能优势 2
1.1.3 基于并行计算平台加速高性能仿真程序 3
1.2 SAR成像处理概述 4
1.2.1 SAR简介 4
1.2.2 SAR成像算法 7
1.3 并行计算基础 9
1.3.1 并行体系结构 10
1.3.2 并行编程模型 14
1.3.3 并行优化算法 20
1.4 SAR成像并行仿真 22
1.4.1 SAR成像并行算法 22
1.4.2 工作站机群体系结构 23
1.4.3 并行化关键技术 24
1.5 小结 26
第2章 雷达对抗信号级仿真的并发性 27
2.1 并发性特点 27
2.1.1 矢量信号并发性 27
2.1.2 仿真流程并发性 28
2.1.3 数据区域并发性 29
2.2 并行计算分解 31
2.2.1 并行分类 31
2.2.2 任务并行 32
2.2.3 数据并行 33
2.2.4 流水线并行 34
2.3 SAR成像算法的并发性 35
2.3.1 SAR实测数据的存储访问特点 35
2.3.2 基于实测数据的R-D算法并发性 36
2.4 小结 37
第3章 并行计算平台和仿真程序的适用性 39
3.1 问题的提出 39
3.2 高性能仿真程序的特性 41
3.3 并行计算平台的性能指标 42
3.4 并行优化目标要素 43
3.5 平台和程序的适用性 44
3.5.1 确定平台的适用性 45
3.5.2 确定程序的适用性 51
3.6 小结 55
第4章 基于程序特性的并行模式选择技术 56
4.1 问题的提出 56
4.2 选择并行化区域 57
4.2.1 时间开销比重因素 57
4.2.2 并行化特性因素 60
4.3 确定并行粒度 63
4.3.1 控制并行粒度的基本准则 63
4.3.2 R-D算法的并行粒度 65
4.4 确定映射层次 69
4.4.1 确定映射层次的方法 70
4.4.2 R-D算法的映射层次 72
4.5 确定控制模式 73
4.5.1 控制模式分类 73
4.5.2 R-D算法的控制模式 75
4.6 小结 76
第5章 面向性能的并行优化技术 77
5.1 访存延迟避免技术 78
5.1.1 问题的提出 78
5.1.2 访存开销优化技术 79
5.1.3 R-D算法的访存开销优化技术 80
5.2 通信延迟避免技术 84
5.2.1 问题的提出 84
5.2.2 通信开销优化技术 84
5.2.3 R-D算法的通信开销优化技术 87
5.3 延迟隐藏技术 94
5.3.1 问题的提出 94
5.3.2 延迟隐藏优化技术 95
5.3.3 R-D算法的延迟隐藏优化技术 100
5.4 小结 102
第6章 SAR成像并行软件设计与实现 104
6.1 软件说明 104
6.1.1 单机版本 106
6.1.2 多机版本 106
6.2 软件设计 109
6.2.1 线程安全队列 109
6.2.2 单机版本 111
6.2.3 多机版本 114
6.3 运行界面及输出图像 130
6.4 小结 131
第7章 SAR成像并行软件实验评测 133
7.1 加速比 134
7.1.1 加速比定律 134
7.1.2 实验评测 136
7.2 可扩展性 139
7.2.1 可扩展性定律 139
7.2.2 实验评测 140
7.3 各功能段优化情况 142
7.3.1 功能代码段优化理论 142
7.3.2 实验评测 151
7.4 CPU和内存使用率 153
7.4.1 指标说明 153
7.4.2 实验评测 154
7.5 网络带宽利用率 160
7.5.1 指标说明 160
7.5.2 实验评测 160
7.6 访存局部性 162
7.6.1 存储重用理论 162
7.6.2 实验评测 165
7.7 其他测试 168
7.7.1 文件读取耗时测试 168
7.7.2 MPI线程模式测试 169
7.8 小结 170
参考文献 171