第一篇 学习篇 1
第1课 超算的发展与应用 1
1.1 为什么要研究超算 1
1.2 超算的发展与架构分类 4
1.2.1 超级计算机的发展 4
1.2.2 超级计算机系统的架构分类 5
1.2.3 超级计算机的发展趋势 7
1.2.4 异构并行技术的兴起与发展 7
1.3 超算应用的现状和挑战 9
1.3.1 超级计算的应用现状 10
1.3.2 超级计算应用的挑战 12
第2课 超算集群系统的构建及功耗管理 14
2.1 超算集群系统的组成 14
2.2 超算集群功耗监控与管理 18
2.3 构建性能均衡的超算系统 20
2.3.1 性能均衡的超算系统 20
2.3.2 如何管理高效能计算系统 21
2.3.3 监控管理 22
2.3.4 作业调度 23
2.3.5 十万亿次级别高效能计算系统构建 24
第3课 超算系统的网络通信 29
3.1 InfiniBand技术概要 29
3.2 InfiniBand在HPC中的应用现状 31
3.3 InfiniBand技术核心——RDMA 33
3.3.1 RDMA的技术简介 33
3.3.2 RDMA的技术核心 34
3.4 基于InfiniBand的HPC应用优化 36
3.5 InfiniBand加速云计算与大数据 42
第4课 超算系统的应用环境 45
4.1 CPU并行系统应用环境 46
4.1.1 硬件环境 46
4.1.2 软件环境 47
4.1.3 开发环境 48
4.2 CPU+MIC异构并行系统应用环境 51
4.2.1 硬件环境 51
4.2.2 软件环境 51
4.2.3 开发环境 52
4.2.4 资源 54
4.3 CPU+GPU异构并行系统应用环境 54
4.3.1 硬件环境 54
4.3.2 软件环境 54
4.3.3 开发环境 55
4.3.4 资源 58
第5课 超算系统性能评测方法 59
5.1 超算系统性能评测现状 59
5.1.1 系统性能测评的意义和挑战 59
5.1.2 系统性能测评的度量和主要内容 60
5.1.3 系统性能测评步骤及方法 62
5.2 高性能计算系统性能测评现状及方法 63
5.2.1 主要测试程序及应用 64
5.2.2 高性能计算系统排行榜 70
5.3 超算应用特征分析与监测工具 71
5.3.1 应用特征数据提取 71
5.3.2 应用特征分析——实验归纳 73
5.3.3 应用特征分析——理论预测 76
5.3.4 应用特征监控工具——天眼 78
第二篇 竞赛篇 83
第6课 世界大学生超级计算机竞赛介绍 83
6.1 ASC世界大学生超级计算机竞赛 83
6.1.1 历史沿革 83
6.1.2 参赛团队 83
6.2 ISC国际大学生超级计算机竞赛 88
6.2.1 历史沿革 88
6.2.2 参赛团队 89
6.2.3 特点及发展趋势 93
6.3 SC国际大学生超级计算机竞赛 93
6.3.1 历史沿革 93
6.3.2 参赛团队 94
6.3.3 特点及发展趋势 96
第7课 ASC世界大学生超级计算机竞赛历史与展望 97
7.1 2012年中国大学生超级计算机竞赛 97
7.1.1 首次进入中国的国际赛事 97
7.1.2 大赛进展 97
7.1.3 大赛三要素:在校大学生、国际接轨、实用技能 97
7.2 2013年亚洲大学生超级计算机竞赛(ASC13) 98
7.2.1 ASC13定位及宗旨 98
7.2.2 大赛的赛制、赛程与组织架构 98
7.2.3 进入ASC13的十强 99
7.2.4 评审委员会对参赛高校的综合评价 99
7.3 2014年世界大学生超级计算机竞赛(ASC14) 100
7.3.1 82所世界高校同台竞技,创历史之最 100
7.3.2 全球超算专家云集 100
7.3.3 初赛:四大赛题遴选超算精英 101
7.3.4 决赛:七大赛题挑战智慧极限 102
7.3.5 黑马异军突起 102
7.3.6 e Prize计算挑战奖激励全球超算天才 102
7.4 2015年世界大学生超级计算机竞赛(ASC15) 103
7.4.1 六大洲152支参赛队,再创历史新高 103
7.4.2 全球超算专家云集 103
7.4.3 初赛:从分子到宇宙的“两极”考验 104
7.4.4 决赛赛题:紧贴应用 105
7.4.5 汇聚全球青年精英,挑战宇宙级“难题” 105
7.4.6 总决赛设25万大奖 105
7.4.7 《三体》作者刘慈欣“出现”在总决赛闭幕式 106
第8课 ASC世界大学生超级计算机竞赛规则解析 107
8.1 详细解析2014年世界大学生超级计算机竞赛初赛规则 107
8.1.1 初赛介绍 107
8.1.2 初赛规则解析 107
8.1.3 初赛规则总结 109
8.2 详细解析2014年世界大学生超级计算机竞赛决赛规则 109
8.2.1 决赛介绍 109
8.2.2 决赛规则解析 109
8.2.3 决赛规则总结 112
第三篇 进阶篇 113
第9课 竞赛方案 113
9.1 简介 113
9.2 组队 113
9.3 基本条件 114
9.4 培训 114
9.5 硬件培训 115
9.6 竞赛方案 115
9.6.1 章节结构 115
9.6.2 图表的呈现 115
9.6.3 其他部分 116
9.6.4 高性能计算活动简介 116
9.6.5 硬件设计与能效 117
9.6.6 (HPL)LINPACK测试 118
9.6.7 应用软件 118
9.6.8 配置文档 118
9.6.9 代码优化 121
9.7 项目书任务分配 121
9.8 总结 121
第10课 竞赛集群的设计与建设 123
10.1 集群的结构 123
10.2 集群的性能和功耗 124
第11课 系统浮点性能测试HPL优化方案 125
11.1 HPL简介 125
11.2 安装与测试 126
11.3 常用的HPL优化方法 129
11.3.1 修改配置参数 129
11.3.2 第三方库的选择 130
11.3.3 编译器优化 130
11.3.4 确定进程与节点的对应关系 130
11.3.5 优化任务分配 131
11.3.6 散热 132
第12课 分子动力学软件GROMACS优化方案 133
12.1 应用程序简介 133
12.2 实验环境与硬件规格 133
12.3 测试参数调校 134
12.4 软件库的效能分析 135
12.5 计算资源分配的效能分析 137
12.6 应用GPU的效能测试 139
第13课 气候系统海洋模式LICOM优化方案 140
13.1 气候系统海洋模式LICOM介绍 140
13.1.1 什么是LICOM 140
13.1.2 LICOM的发展演化 140
13.1.3 LICOM的优化意义 140
13.2 LICOM优化的关键点分析 141
13.3 硬件环境搭建 141
13.4 软件环境配置 141
13.4.1 NetCDF C库安装配置 142
13.4.2 NetCDFFortran库安装配置 142
13.4.3 LICOM的安装配置 142
13.5 优化方案实施过程及结果 144
13.5.1 优化方案实施过程 144
13.5.2 优化结果 145
13.6 ASC14备赛过程回顾 146
13.7 LICOM于ASC14决赛赛场优化回顾 147
13.8 LICOM优化总结及评估 149
第14课 三维纵横波分离的弹性波方程模拟方法3D EW优化方案 150
14.1 组队参赛情况及参赛准备 150
14.1.1 人员准备 150
14.1.2 技术准备 150
14.2 ASC14 3D EW比赛规则解读 152
14.3 三维纵横波分离的弹性波方程模拟算法介绍 153
14.4 3D EW程序分析 154
14.4.1 热点分析 154
14.4.2 代码分析 154
14.5 基于CPU+MIC集群平台的3D EW并行算法设计与实现 155
14.5.1 基于CPU+MIC集群平台的3D EW并行算法整体设计 155
14.5.2 基于CPU+MIC集群平台的3D EW并行算法实现 155
14.6 基于竞赛平台的3D EW测试和分析 158
14.6.1 测试平台环境 158
14.6.2 单节点性能 159
14.6.3 跨节点性能 160
14.7 参赛感悟及收获 160