第一章 绪论 1
1.1 并行处理的概念 2
1.1.1 并行性的概念 2
1.1.2 并行等级的划分 2
1.1.3 实现并行处理的各种技术途径 3
1.2 并行处理的基础 4
1.2.1 并行处理的目的和效果 4
1.2.2 并行处理的应用和实现 6
1.2.3 并行计算模型和图形表示 9
1.2.4 并行算法的构成 11
1.2.5 处理机的分配 12
1.3.1 并行处理机系统构成分类 13
1.2.6 同步和通信 13
1.3 并行处理机的系统构成方式 13
1.3.2 处理单位 14
1.3.3 结构 16
1.3.4 处理方式 17
1.3.5 控制方式 18
1.3.6 连接方式 19
1.3.7 互连网络结构 20
1.3.8 通信方式 21
1.3.9 并行度 22
第二章 处理机 23
2.1 概述 23
2.2 应用对选择处理机的影响 24
2.3 微程序技术 25
2.3.1 微程序技术的发展 25
2.3.2 微程序技术中的一些基本概念 26
2.3.3 微程序设计技术 28
2.4 指令与寻址 34
2.4.1 指令系统 34
2.4.2 指令格式 34
2.4.3 寻址方式 36
2.4.4 指令系统举例 39
2.4.5 指令系统的改进 46
2.5 复杂指令集计算机(CISC) 46
2.6.1 RISC提出的背景 51
2.6 精简指令集计算机(RISC) 51
2.6.2 RISC的发展 52
2.6.3 RISC的特征 53
2.6.4 RISC的指令系统 54
2.6.5 RISC的构成技术 59
第三章 存储系统 63
3.1 存储系统的层次结构技术 63
3.1.1 存储器的层次结构 63
3.1.2 程序的局部性 63
3.1.3 层次存储器的设计准则 63
3.2 虚拟存储器技术 65
3.2.1 虚拟存储器概念 65
3.2.2 分页存储管理 65
3.2.3 分段存储管理 70
3.2.4 段页式存储管理 71
3.2.5 虚拟存储管理中的替换算法 72
3.2.6 影响主存命中率的因素 74
3.3 高速缓冲存储器(Cache) 77
3.3.1 高速缓存的基本结构 77
3.3.2 高速缓存的地址映象与变换 77
3.3.3 高速缓存的替换算法 83
3.3.4 高速缓存的一致性 85
3.3.5 高速缓存的优化 91
第四章 流水线技术 98
4.1 流水线方式的基本原理 98
4.1.1 流水线方式的分类 98
4.1.2 线性流水线技术 99
4.1.3 非线性流水线技术 102
4.1.4 流水线的相关处理 110
4.2 超标量流水线和超流水线 116
4.2.1 超标量流水线 116
4.2.2 超流水线技术 118
4.2.3 超流水线超标量处理技术 119
4.2.4 性能分析 119
4.3 VLIW方式 120
4.3.1 VLIW方式的基本工作原理 120
4.3.2 VLIW方式的特征 122
4.3.3 VLIW处理机的工作方式 123
4.3.4 VLIW的优化编译 126
5.1 互连网络的分类 131
第五章 互连网络 131
5.2 互连网络的互连函数和结构参数 132
5.2.1 互连函数 132
5.2.2 互连网络的结构参数 136
5.3 静态互连网络 137
5.3.1 线性阵列 138
5.3.2 环网和带弦环网 138
5.3.3 全连接网 139
5.3.4 循环移数网 139
5.3.5 星形网络 139
5.3.6 网格形网络 140
5.3.7 树形网 141
5.3.8 立方体网络 143
5.3.9 Paradhan网 146
5.3.10 总线 146
5.4 动态互连网络 148
5.4.1 单级互连网络 149
5.4.2 多级互连网络 152
5.5 互连网络中开关元件的设计与实现 170
5.5.1 2×2交换开关的设计与实现 170
5.5.2 4×4交叉开关的设计与实现 176
第六章 向量计算机 181
6.1 向量处理和向量指令 181
6.1.1 向量处理 181
6.1.2 向量指令 181
6.2 向量计算机的结构 183
6.2.1 存储器-存储器结构的向量计算机 184
6.2.2 寄存器-寄存器向量流水线结构 187
6.2.3 中间寄存器 189
6.3 向量计算机的数据结构 192
6.4 向量循环和链接 196
6.4.1 链接 196
6.4.2 向量循环 198
6.5 流水线网络 199
6.5.1 流水线网络模型 199
6.5.2 建立流水线网络的过程 199
6.6 向量处理机举例 201
6.6.1 向量协处理器 201
6.6.2 向量巨型计算机 203
6.7 向量计算机系统结构的设计准则 208
第七章 共享存储器型多处理机系统 210
7.1 基本模型 210
7.1.1 系统结构模型 210
7.1.2 PRAM模型 211
7.1.3 存储器的一般模型 212
7.2 UMA型多处理机系统 214
7.2.1 总线连接型多处理机系统 214
7.2.2 交叉开关型UMA多处理机系统 246
7.2.3 多级互连网络型UMA多处理机系统 248
7.3 NUMA型多处理机系统 270
7.3.1 单总线连接型NUMA系统 272
7.3.2 群结构的NUMA多处理机系统 276
7.3.3 层次总线型NUMA多处理机系统 284
7.4 COMA多处理机系统 288
第八章 分布存储器型多计算机系统 290
8.1 分布存储器型多计算机系统的模型 290
8.2 多计算机系统的消息格式 291
8.3 同步方式 291
8.4 寻径方式 292
8.4.1 维序寻径 293
8.4.2 自适应寻径 294
8.4.3 单播、选播、广播、会议通信模式 295
8.5 多计算机互连网 296
8.5.1 多计算机互连网的构成法 296
8.5.2 通信距离和中继量 298
8.5.3 中继规则 299
8.5.4 可靠性 300
8.5.5 互连网络的互连方式 300
8.5.6 互连线路 309
8.6 并行处理方式 311
8.6.1 数据分割解法 311
8.6.2 处理分割方式 314
8.7 二叉树网计算机Coral 68k 316
8.7.1 系统构成 316
8.7.2 处理机 316
8.7.3 程序方式 317
8.7.4 处理机消息 318
9.1.1 冯-诺依曼结构 321
第九章 阵列并行计算机 321
9.1 超并行计算机系统的发展 321
9.1.2 SIMD阵列机模型 322
9.1.3 网格体系结构 323
9.1.4 并行处理术语 324
9.2 脉动阵列 325
9.2.1 脉动阵列的结构和特征 325
9.2.2 在脉动阵列上实现的算法举例 326
9.2.3 脉动数据结构 327
9.3 细胞自动机 332
9.3.1 细胞自动机 332
9.3.2 点灯问题 334
9.4.1 一维广播阵列机 338
9.4 带全局总线的网格阵列机 338
9.4.2 二维广播阵列机 339
9.4.3 全局总线在脉动阵列上的应用 341
9.4.4 全局总线的省略问题 343
9.5 锥形阵列机 343
9.5.1 二维锥形阵列机 343
9.5.2 锥形阵列机及算法举例 345
9.6 树网阵列机 346
9.6.1 树网阵列机 346
9.6.2 基本运算 347
9.6.3 MOT上的算法 348
9.7 排序阵列机 350
9.7.1 排序网络 351
9.7.2 排序网的构成方法 352
9.7.3 双调排序网 354
9.7.4 Batcher的奇偶归并排序网络 360
9.8 洗牌交换阵列机 364
9.8.1 洗牌交换网络 364
9.8.2 多项式求解 366
9.8.3 洗牌交换阵列机上的排序 367
9.9 超立方体阵列机 369
9.9.1 超立方体结构 369
9.9.2 超立方体阵列机算法 372
9.10 阵列计算机举例 376
9.10.1 AAP-2的硬件结构 376
9.10.2 AAP-2的软件 381
第十章 数据流计算机 384
10.1 数据流驱动的概念 384
10.2 数据流语言与数据流程序图 385
10.2.1 数据流语言 385
10.2.2 数据流程序图 390
10.3 数据流计算机结构 396
10.3.1 静态数据流计算机 397
10.3.2 动态数据流计算机结构 402
10.3.3 其他类型的数据流计算机 406
10.3.4 数据流计算机的设计标准 410
10.4 数据流计算机的评价 411
主要参考文献 413