OpenACC高性能并行编程 概念与策略PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:(美)苏妮塔·钱德拉塞克兰(Sunita Chandrasekaran),(德)吉多·杰克兰德(Guido Juckeland)编
- 出 版 社:北京:机械工业出版社
- 出版年份:2019
- ISBN:9787111623236
- 页数:220 页
第1章 OpenACC概述 1
1.1 OpenACC语法 2
1.1.1 导语 3
1.1.2 子语 3
1.1.3 API例程与环境变量 4
1.2 计算构件 4
1.2.1 kernels 5
1.2.2 parallel 6
1.2.3 loop 7
1.2.4 routine 7
1.3 数据环境 9
1.3.1 数据导语 9
1.3.2 数据子语 10
1.3.3 cache导语 11
1.3.4 部分数据传输 11
1.4 总结 12
1.5 练习 12
第2章 循环级并行性 14
2.1 kernels循环与parallel循环的比较 15
2.2 并行性的三个级别 18
2.2.1 gang、worker与vector子语 18
2.2.2 将并行性映射到硬件 19
2.3 其他loop构件 20
2.3.1 循环折叠 20
2.3.2 independent子语 21
2.3.3 seq与auto子语 22
2.3.4 reduction子语 23
2.4 总结 25
2.5 练习 26
第3章 OpenACC编程工具 27
3.1 架构的通用特性 27
3.2 编译OpenACC代码 28
3.3 OpenACC应用程序的性能分析 30
3.3.1 性能分析层次和术语 30
3.3.2 性能数据获取 31
3.3.3 性能数据记录和显示 32
3.3.4 OpenACC性能分析接口 32
3.3.5 支持OpenACC的性能工具 33
3.3.6 NVIDIA性能分析工具 34
3.3.7 针对混合应用程序的Score-P工具基础架构 35
3.3.8 TAU性能系统 40
3.4 识别OpenACC程序中的bug 42
3.5 总结 44
3.6 练习 45
第4章 使用OpenACC编写第一个程序 48
4.1 案例研究 48
4.1.1 串行代码 49
4.1.2 编译代码 55
4.2 创建一个原生的并行版本 56
4.2.1 找到热点 56
4.2.2 使用kernels安全吗 56
4.2.3 OpenACC实现 56
4.3 OpenACC程序的性能 59
4.4 优化的并行版本 60
4.4.1 减少数据移动 61
4.4.2 特别聪明的小改动 62
4.4.3 最终的结果 63
4.5 总结 65
4.6 练习 66
第5章 编译OpenACC 67
5.1 并行性的挑战 68
5.1.1 并行硬件 68
5.1.2 映射循环 69
5.1.3 内存层次结构 71
5.1.4 归约 72
5.1.5 应对并行性的OpenACC 72
5.2 重建编译器 73
5.2.1 编译器可以做什么 74
5.2.2 编译器不能做什么 75
5.3 编译OpenACC 76
5.3.1 代码预备工作 77
5.3.2 调度 77
5.3.3 串行代码 78
5.3.4 用户错误 79
5.4 总结 80
5.5 练习 81
第6章 最佳编程实践 83
6.1 通用准则 84
6.1.1 最大化设备计算 84
6.1.2 优化数据局部性 85
6.2 最大化设备计算 86
6.2.1 原子操作 86
6.2.2 kernels构件与parallel构件 87
6.2.3 运行时调优和if子语 88
6.3 优化数据局部性 89
6.3.1 最少化数据传输 89
6.3.2 数据复用和present子语 90
6.3.3 非结构化数据生命周期 91
6.3.4 指定数组形状 92
6.4 典型示例 92
6.4.1 背景知识:热力学报表 92
6.4.2 基线CPU版本的实现 93
6.4.3 性能分析 93
6.4.4 使用OpenACC进行加速 94
6.4.5 优化数据局部性 96
6.4.6 性能研究 97
6.5 总结 98
6.6 练习 98
第7章 OpenACC与性能可移植性 99
7.1 挑战 99
7.2 目标架构 100
7.2.1 特定平台的编译 101
7.2.2 x86_64多核与NVIDIA 101
7.3 OpenACC性能可移植性 101
7.3.1 OpenACC内存模型 102
7.3.2 内存架构 102
7.3.3 代码生成 102
7.3.4 性能可移植性的数据布局 103
7.4 代码重构以实现性能可移植性 103
7.4.1 HACCmk 103
7.4.2 面向多种架构 105
7.4.3 openACC在NVIDIA K20x GPU上的应用 106
7.4.4 openACC在AMD Bulldozer多核上的应用 107
7.5 总结 108
7.6 练习 109
第8章 并行编程的其他方式 111
8.1 编程模型 111
8.1.1 OpenACC 113
8.1.2 OpenMP 113
8.1.3 CUDA 114
8.1.4 OpenCL 114
8.1.5 C+++AMP 115
8.1.6 Kokkos 115
8.1.7 RAJA 116
8.1.8 线程构建模块 116
8.1.9 C+++17 116
8.1.10 Fortran 2008 117
8.2 编程模型组件 117
8.2.1 并行循环 118
8.2.2 并行归约 119
8.2.3 紧密嵌套循环 121
8.2.4 分层并行性(非紧密嵌套循环) 122
8.2.5 任务并行性 124
8.2.6 数据分配 125
8.2.7 数据传输 126
8.3 案例研究 127
8.3.1 串行实现 128
8.3.2 OpenACC实现 129
8.3.3 OpenMP实现 130
8.3.4 CUDA实现 131
8.3.5 Kokkos实现 134
8.3.6 TBB实现 136
8.3.7 一些性能数字 138
8.4 总结 140
8.5 练习 140
第9章 OpenACC与互操作性 142
9.1 在OpenACC中调用原生设备代码 142
9.1.1 示例:使用DFT进行图像滤波 143
9.1.2 host_data导语及use_device子语 145
9.1.3 目标平台相关API例程 147
9.2 在原生设备代码中调用OpenACC 149
9.3 OpenACC互操作性高级话题 149
9.3.1 acc_map_data 149
9.3.2 在OpenACC kernel中调用CUDA设备例程 151
9.4 总结 152
9.5 练习 152
第10章 OpenACC高级特性 153
10.1 异步操作 153
10.1.1 OpenACC异步编程 155
10.1.2 软件流水线 160
10.2 多设备编程 168
10.2.1 多设备流水线 169
10.2.2 OpenACC与MPI 172
10.3 总结 176
10.4 练习 176
第11章 使用OpenACC的创新研究思路,第1部分 177
11.1 神威OpenACC 177
11.1.1 SW26010众核处理器 178
11.1.2 神威太湖之光中的内存模型 178
11.1.3 执行模型 180
11.1.4 数据管理 181
11.1.5 总结 183
11.2 针对加速器的嵌套循环编译器转换 184
11.2.1 OpenUH编译器基础架构 185
11.2.2 循环调度转换 187
11.2.3 循环调度的性能评估 190
11.2.4 OpenUH的其他研究课题 193
第12章 使用OpenACC的创新研究思路,第2部分 194
12.1 一个基于导语的高性能可重构计算框架 194
12.1.1 介绍 195
12.1.2 OpenACC到FPGA的基线翻译 196
12.1.3 用于高效FPGA编程的OpenACC扩展和优化 198
12.1.4 评估 203
12.1.5 总结 207
12.2 使用XcalableACC编程加速集群 207
12.2.1 XcalableMP介绍 208
12.2.2 XcalableACC:当XcalableMP遇上OpenACC 211
12.2.3 Omni编译器的实现 213
12.2.4 在HA-PACS上的性能评估 215
12.2.5 总结 220
- 《联吡啶基钌光敏染料的结构与性能的理论研究》李明霞 2019
- 《信息系统安全技术管理策略 信息安全经济学视角》赵柳榕著 2020
- 《程序逻辑及C语言编程》卢卫中,杨丽芳主编 2019
- 《事业单位招聘护士综合应试策略》杨会香,井秀玲,马小霞主编 2019
- 《飞扬 第十七届新概念作文获奖者范本 B卷》省登宇主编 2015
- 《NiFe2O4基惰性阳极材料的烧结行为及应用性能》杜金晶,王斌著 2019
- 《全国职业院校工业机器人技术专业规划教材 工业机器人现场编程》(中国)项万明 2019
- 《基于核心素养的有效学习与学业评价策略 初中政治》李亚莉主编 2018
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《编程超有趣 奇妙Python轻松学 第1辑》HelloCode人工智能国际研究组 2018
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《看漫画学钢琴 技巧 3》高宁译;(日)川崎美雪 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《海明威书信集:1917-1961 下》(美)海明威(Ernest Hemingway)著;潘小松译 2019
- 《迁徙 默温自选诗集 上》(美)W.S.默温著;伽禾译 2020
- 《上帝的孤独者 下 托马斯·沃尔夫短篇小说集》(美)托马斯·沃尔夫著;刘积源译 2017
- 《巴黎永远没个完》(美)海明威著 2017
- 《幼儿英语游戏活动指导与实训》苏小菊,任晓琴主编;颜晓芳,覃静,谢恬恬,钟博维副主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019