第一章 计算机系统结构的相关概念 1
1.1 系统结构的有关术语 1
1.1.1 计算机系统的层次结构 1
1.1.2 计算机系统结构 2
1.1.3 计算机组成和计算机实现 3
1.1.4 计算机系统结构的分类 4
1.2 系统结构发展的影响因素 6
1.2.1 存储程序计算机系统结构及其发展 6
1.2.2 软件对系统结构的影响 7
1.2.3 应用对系统结构的影响 9
1.2.4 器件对系统结构的影响 9
1.2.5 系统结构的生命周期 10
1.3 定量分析技术 11
1.3.1 系统设计的定量原理 11
1.3.2 性能评价标准 14
1.3.3 成本与价格 18
1.4 系统结构中并行性的发展 19
1.4.1 并行性的概念 19
1.4.3 单机系统中并行性的发展 20
1.4.2 提高并行性的技术途径 20
1.4.4 多机系统中并行性的发展 21
小结 22
习题 22
第二章 时间并行技术 25
2.1 流水线技术 25
2.1.1 流水线的基本概念 25
2.1.2 流水线的表示方法 27
2.1.3 流水线的特点 28
2.2.1 流水线的吞吐率 29
2.2 流水线的性能指标 29
2.2.2 流水线的加速比 32
2.2.3 流水线的效率 33
2.2.4 流水线的量佳段数 34
2.3 流水线的结构相关和数据相关 38
2.3.1 流水线的结构相关 38
2.3.2 流水线的数据相关 39
2.4 流水线的控制相关 43
2.4.1 控制相关的概念 43
2.4.2 条件分支对流水线的影响 43
2.4.3 静态分支技术 44
2.4.4 动态分支预测技术 49
2.4.5 流水线处理机的中断处理 52
小结 52
习题 53
第三章 指令级并行技术 55
3.1 指令级并行的概念 55
3.1.1 并行性的有关术语 55
3.2 数据相关及其处理技术 57
3.2.1 数据相关类型 57
3.1.2 多指令流出:指令级并行度 57
3.2.2 寄存器重命名 58
3.2.3 静态指令调度 59
3.2.4 动态指令调度 61
3.3 超标量流水处理机 62
3.3.1 超标量流水线的发射策略 62
3.3.2 典型处理机结构 66
3.3.3 超标量流水处理机性能 70
3.4 超流水线处理机 71
3.4.1 超流水线处理机时空图 71
3.4.2 典型处理机结构 72
3.4.3 超流水线处理机性能 74
3.5 超标量超流水线处理机 75
3.5.1 指令执行时空图 75
3.5.2 典型处理机结构 75
3.5.3 超标量超流水线处理机性能 78
3.6 超长指令字处理机 78
3.6.1 VLIW处理机的特点 78
3.6.2 VLIW处理机的结构模型 79
3.6.3 典型处理机结构 80
小结 82
习题 83
第四章 向量流水处理机 86
4.1 向量处理的基本概念 86
4.1.1 向量处理 86
4.1.2 向量处理方法 87
4.2 向量流水处理机的结构 89
4.2.1 存储器-存储器结构 89
4.2.2 寄存器-寄存器结构 92
4.3 提高向量流水处理机性能的方法 94
4.3.1 多功能部件的并行操作 94
4.3.2 链接技术 95
4.3.3 分段开采技术 96
4.3.4 采用多处理机系统结构 97
4.4 向量处理机的性能评估 98
4.4.1 一条向量指令的执行时间 98
4.4.2 一组向量操作的执行时间 99
4.4.3 分段开采时一组向量操作的总执行时间 100
4.4.4 最大性能R∞和半性能向量长度n1/2 101
4.5 新型向量处理机 102
4.5.1 CRAY Y-MP,C90 102
4.5.2 NECSX-X系列 104
小结 105
习题 105
第五章 互连网络 108
5.1 互连网络的相关概念 108
5.1.1 互连网络的功能和特征 108
5.1.2 互连网络的描述工具 109
5.1.3 互连网络的选择性参数 112
5.2 互连网络的结构 113
5.2.1 静态互连网络 113
5.2.2 动态互连网络 116
5.3.1 路由选择方法 122
5.3 互连网络的路由选择和信息传递方式 122
5.3.2 信息传递方式 125
5.3.3 死锁与虚拟通道 127
5.4 流量控制策略和通信模式 129
5.4.1 流量控制策略 129
5.4.2 通信模式 130
小结 131
习题 131
6.1.1 阵列处理机的操作模型 134
第六章 阵列处理机 134
6.1 阵列处理机的操作模型和特点 134
6.1.2 阵列处理机的特点 135
6.2 阵列处理机的基本结构 135
6.2.1 分布式存储器的阵列机 135
6.2.2 共享存储器的阵列机 136
6.3 阵列处理机实例 137
6.3.1 IlliacⅣ阵列处理机 137
6.3.2 MP-1阵列处理机 141
6.4.1 SIMD系统结构与并行算法的关系 144
6.4 阵列机的并行算法 144
6.4.2 算法举例 145
小结 148
习题 149
第七章 多处理机 151
7.1 多处理机的一般模型、特点和分类 151
7.1.1 多处理机的一般模型 151
7.1.2 多处理机的特点 152
7.1.3 多处理机的分类 153
7.2.1 Cache不一致性的由来 155
7.2 多处理机的Cache一致性 155
7.2.2 监听协议法 156
7.2.3 目录表协议法 157
7.3 多处理机实例 159
7.3.1 大规模并行处理机Cray T3D 159
7.3.2 共享存储型多处理机Origin 2000 162
7.3.3 容错计算机系统Stratus 165
7.3.4 计算机机群IBM SP2 168
7.4 多处理机中程序并行性的开发 173
7.4.1 程序并行性的分析 173
7.4.2 并行程序设计 176
小结 178
习题 179
第八章 课程设计实验 182
8.1 TEC-4计算机组成实验系统 182
8.1.1 TEC-4计算机组成实验系统的特点 182
8.1.2 电源和时序发生器 183
8.1.3 数据通路 183
8.1.4 指令系统 187
8.1.5 控制器和控制台 188
8.2.1 数学目的、任务与实验设备 190
8.1.6 用户自选器件实验区 190
8.2 微程序控制的流水计算机模型设计调试 190
8.2.2 设计要求 191
8.2.3 微程序控制器的设计与调试 192
8.3 硬联线控制的流水计算机模型设计与调试 194
8.3.1 数学目的、任务与实验设备 194
8.3.2 设计与调试要求 195
附录 196
参考文献 197