第1章 绪论 1
1.1 视频图像处理 1
1.1.1 概述 1
1.1.2 视频图像处理发展与应用 3
1.1.3 视频图像处理算法关键技术 5
1.2 视频图像处理在智能驾驶领域的应用 6
1.2.1 概述 6
1.2.2 视频图像处理在智能驾驶领域的应用与发展 7
1.2.3 视频图像处理在智能驾驶领域的关键技术 9
1.3 异构平台与GPU架构 11
1.3.1 概述 12
1.3.2 GPU体系架构 12
1.3.3 GPU编程模型 15
1.4 GPU性能加速优化方法 17
1.4.1 访存优化 18
1.4.2 计算优化 19
1.4.3 数据本地化 20
第2章 视频图像处理在智能驾驶中的应用 22
2.1 引言 22
2.1.1 国外研究现状 22
2.1.2 国内研究现状 25
2.2 车道线的提取和跟踪 26
2.2.1 道路图像预处理方法 28
2.2.2 边缘检测 31
2.2.3 基于Hough变换的车道线检测 32
2.3 交通标志牌的检测和识别 34
2.3.1 交通标志简介 34
2.3.2 交通标志识别简介 36
2.3.3 交通标志牌检测 37
2.3.4 基于SVM的交通标志牌检测 39
2.3.5 交通标志的识别 41
2.3.6 基于SVM的交通标志牌的识别 43
2.4 交通信号灯的检测 45
2.4.1 颜色分割 45
2.4.2 基于颜色和形状的交通信号灯检测识别 49
2.5 智能车其他视频图像处理 53
2.5.1 基于SVM的行人检测 53
2.5.2 SVM与深度学习 60
2.6 本章小结 61
第3章 GPU体系架构 62
3.1 GPU与CPU架构的区别 62
3.2 当前主流GPU体系架构 63
3.2.1 NVIDIA GPU架构 63
3.2.2 AMD GPU架构 69
3.2.3 两种架构的异同 72
3.3 本章小结 74
第4章 CUDA与OpenCL编程模型 75
4.1 CUDA编程模型 75
4.2 OpenCL编程模型 77
4.3 CUDA和OpenCL编程流程 81
4.3.1 CUDA向量相加程序编写过程 81
4.3.2 OpenCL向量相加程序编写过程 84
4.4 GPU程序性能优化分析 90
4.5 本章小结 90
第5章 异构计算与性能优化方法 91
5.1 视频图像处理算法 91
5.2 访存优化方法 92
5.2.1 CPU与GPU之间的传输优化 92
5.2.2 global memory的合并访问 93
5.2.3 shared memory 94
5.2.4 寄存器 95
5.3 矩阵转置算法 95
5.3.1 算法简介及分析 95
5.3.2 并行性分析 95
5.3.3 矩阵转置算法优化 97
5.3.4 性能分析 100
5.4 规约算法 102
5.4.1 算法简介及分析 102
5.4.2 并行性分析 103
5.4.3 规约算法优化 105
5.4.4 性能分析 108
5.5 resize算法 112
5.5.1 算法简介及分析 112
5.5.2 并行性分析 113
5.5.3 resize算法优化 115
5.5.4 性能分析 117
5.6 Laplace算法 120
5.6.1 算法简介及分析 120
5.6.2 并行性分析 120
5.6.3 Laplace算法优化 122
5.6.4 性能分析 122
5.7 本章小结 123
第6章 Canny边缘检测算法优化 124
6.1 引言 124
6.1.1 边缘检测相关概述 124
6.1.2 视频图像处理问题及方法 125
6.2 国内外研究现状 126
6.3 Canny边缘检测算法简介 127
6.4 并行性分析及GPU实现 129
6.4.1 并行性分析 129
6.4.2 基于NVIDIA Tegra K1的GPU实现与分析 129
6.5 优化策略分析 131
6.5.1 向量化访存 131
6.5.2 数据本地化 132
6.5.3 条件分支优化 133
6.6 Canny边缘检测算法优化过程与实验结果分析 133
6.6.1 灰度化算法 134
6.6.2 滤波及计算梯度幅值算法 134
6.6.3 非极大值抑制算法 136
6.6.4 递归确定边缘算法 137
6.6.5 Canny及边缘检测算法 137
6.7 本章小结 139
第7章 人脸检测算法优化 141
7.1 引言 141
7.2 人脸检测算法 142
7.2.1 GPU架构 142
7.2.2 Viola-Jones人脸检测算法 143
7.3 人脸检测算法的GPU实现与优化 144
7.3.1 并行性分析 144
7.3.2 Na?ve实现与负载不均衡 145
7.3.3 GPU优化 147
7.4 性能评估 154
7.4.1 实验平台 154
7.4.2 正确性验证 155
7.4.3 性能分析 156
7.5 本章小结 160
第8章 异构平台激光雷达算法优化 161
8.1 引言 161
8.1.1 国外研究现状 161
8.1.2 国内研究现状 163
8.2 车载激光雷达 165
8.2.1 激光雷达目标检测 166
8.2.2 激光雷达环境感知 167
8.2.3 激光雷达的优势 169
8.2.4 Velodyne三维激光雷达 170
8.3 激光雷达数据处理算法 171
8.3.1 激光雷达数据获取及解包 171
8.3.2 激光雷达识别障碍物 175
8.3.3 用Hough变换进行路边检测 178
8.4 激光雷达数据处理算法优化 179
8.4.1 栅格投影优化 179
8.4.2 数据传输优化 180
8.4.3 栅格处理优化 181
8.4.4 性能评估 185
8.5 本章小结 189
第9章 性能与能耗的权衡 190
9.1 引言 190
9.2 能效评价指标 192
9.3 各层次能耗优化策略 193
9.4 系统级能耗优化技术 195
9.5 本章小结 197
参考文献 198