第1章 引言 1
1.1高性能计算机的应用 1
1.2高效能计算机的技术挑战 2
1.3高效能计算机 4
1.4本书的组织 6
第2章 自适应功耗管理技术 7
2.1概述 7
2.2相关研究 7
2.2.1 CPU功耗控制 8
2.2.2 CPU工作频率控制策略 8
2.2.3冷却技术 10
2.2.4系统级节能技术 11
2.3自适应功耗管理 11
2.3.1框架结构 12
2.3.2基于自适应功耗管理的作业调度 14
2.3.3性能评测 17
2.4机群功耗管理软件的实现 21
2.4.1软件流程 21
2.4.2功耗限制 22
2.4.3节点任务调度 24
2.5应用效果 25
2.6小结 26
第3章 自主管理技术 27
3.1概述 27
3.2相关研究 27
3.2.1自主计算模型 27
3.2.2自主计算体系结构 29
3.2.3自主元素 29
3.2.4自主计算系统 30
3.3分布式层次化自主管理 31
3.3.1自主管理系统框架 31
3.3.2自主管理元素 32
3.3.3逻辑分区 33
3.3.4选举 35
3.3.5告警关联推理 37
3.4机群自主管理软件的实现 38
3.4.1 Gridview架构 39
3.4.2基于485总线的全局信息融合机制 40
3.4.3统一监控管理策略 41
3.4.4本地事件关联分析机制 42
3.5小结 43
第4章 应用加速技术 44
4.1概述 44
4.2相关研究 44
4.2.1构成方式 44
4.2.2 Cray XD1系统 46
4.2.3 SGI Altix系统 46
4.2.4东京工业大学Tich系统 48
4.3高性能计算机应用加速部件 48
4.4 BLAS加速的研究 50
4.4.1 BLAS简介 50
4.4.2 1/O的设计 50
4.4.3运算供数的设计 51
4.4.4运算器设计 53
4.4.5乘加器的操作原理 54
4.4.6整机加速效果的预测 54
4.5面向网络安全的应用加速卡 56
4.5.1逻辑结构 57
4.5.2数据预处理模块 58
4.5.3规则过滤模块 62
4.5.4硬件实现 70
4.5.5性能评价 70
4.6小结 72
第5章 高密度节点技术 74
5.1相关研究 74
5.1.1高性能计算机节点 74
5.1.2对称多处理机系统 74
5.1.3大规模并行处理机系统 75
5.1.4分布式共享存储多处理机系统 76
5.1.5机群系统 77
5.1.6刀片服务器 78
5.2高密度节点的设计原则 78
5.3高密度节点的实现 79
5.3.1总体结构 79
5.3.2刀片模块 80
5.3.3管理模块 82
5.3.4监控子卡 83
5.3.5交换模块 83
5.3.6 1/O模块 84
5.3.7散热分析 85
5.4支持虚拟化的网卡研究 87
5.5高密度计算节点对比分析 89
5.6小结 91
第6章 网络内存技术 92
6.1网络内存系统相关研究 92
6.1.1相关研究系统 92
6.1.2相关技术 93
6.1.3现有网络内存系统存在的问题 95
6.2网络内存研究内容 96
6.2.1系统结构 96
6.2.2客户端实现形式 96
6.2.3动态内存资源管理 97
6.2.4可靠性 98
6.2.5性能优化 99
6.3网络内存系统设计与实现 100
6.3.1网络内存系统设计 100
6.3.2 NMS客户端设计与实现 105
6.3.3服务端设计与实现 108
6.3.4实验及评价 110
6.4网络内存性能优化 120
6.4.1预取技术 120
6.4.2主动内存 121
6.4.3二级缓存管理 122
6.4.4实验及评价 125
6.5小结 129
第7章 事件流应用技术 131
7.1概述 131
7.2相关技术研究 131
7.2.1数据流研究 131
7.2.2决策支持系统 132
7.2.3数据密集的超级计算 133
7.2.4时间序列数据 134
7.2.5事件流的特征 134
7.3事件流应用技术 135
7.3.1 DBroker 135
7.3.2并行查询处理 138
7.3.3负载特征分析 140
7.3.4并发查询调度 143
7.4基于网络监控应用的事件流应用系统的设计与实现 145
7.4.1系统的数据特征分析 145
7.4.2基于信息熵聚类的查询特征分析 150
7.4.3基于分段的资源共享模型并发查询调度 156
7.4.4并行查询引擎的设计与实现 160
7.5小结 163
第8章 并行模拟技术 164
8.1概述 164
8.2背景及相关研究 164
8.2.1高性能计算机的模拟 164
8.2.2部件模拟关键技术 166
8.2.3并行模拟关键技术 170
8.2.4模拟器平台 175
8.3并行模拟器关键技术 180
8.3.1并行模拟器体系结构 180
8.3.2基于阻塞/唤醒机制的同步机制 181
8.3.3锁避免调度技术 182
8.3.4高性能通信技术 185
8.3.5多线程缓冲区优化 187
8.3.6超步执行技术 188
8.3.7性能评价 190
8.4细粒度模拟下的动态负载平衡技术 197
8.4.1动态负载平衡的重要性 197
8.4.2细粒度模拟负载特征分析 198
8.4.3迁移机制的设计 200
8.4.4迁移机制的实现 203
8.4.5性能评价 208
8.5小结 212
第9章 并行模拟引擎SimK 213
9.1引言 213
9.2 SimK的设计与实现 213
9.2.1设计方法 213
9.2.2实现机制 215
9.3 SimK优化及适用性讨论 220
9.3.1同步优化 220
9.3.2进程间通信优化 221
9.3.3对不同体系结构模拟器的支持 222
9.3.4多粒度模拟模块集成 222
9.4基于SimK的HPP结构模拟平台 223
9.4.1 HPP模拟平台结构 223
9.4.2 HPP节点模拟 225
9.4.3千万亿次计算机互连网络模拟 230
9.4.4 HPP节点系统软件 233
9.4.5性能评价 235
9.5小结 240
第10章 曙光5000A的实现与评价 242
10.1曙光5000A总体架构 242
10.2硬件系统 243
10.3软件系统 244
10.4冷却子系统 245
10.5性能评测 246
10.5.1网络性能 246
10.5.2 NPB测试 248
10.5.3 Linpack测试 249
10.6高效能评价 249
10.6.1高性能计算机的评价方法 249
10.6.2相关研究 250
10.6.3 RPI相对效能评价指标 252
10.6.4曙光5000A的高效能评价 256
10.7整机对比分析 258
10.8小结 261
参考文献 262