第1章 绪论 1
1.1 视频图像处理的概念 1
1.2 视频图像处理的应用 1
1.3 视频图像处理系统的组成 6
1.4 习题 8
参考文献 8
第2章 视频图像的表示 10
2.1 图像的视觉基础 10
2.1.1 图像的概念 10
2.1.2 分辨率 12
2.1.3 人眼的视觉特性 13
2.2 颜色模型 14
2.2.1 颜色基础知识 14
2.2.2 颜色模型的基本概念 15
2.3 图像的数字化 19
2.3.1 图像的采样 19
2.3.2 图像的量化 22
2.3.3 图像的表示 23
2.4 图像格式 24
2.4.1 BMP 24
2.4.2 JPEG 25
2.4.3 TIFF 27
2.4.4 GIF 28
2.5 数字视频格式 29
2.5.1 MPEG 29
2.5.2 MOV 31
2.5.3 ASF 31
2.5.4 RA/RM 33
2.6 习题 34
参考文献 34
第3章 图像变换 35
3.1 傅里叶变换 35
3.1.1 傅里叶变换的基本概念 35
3.1.2 离散傅里叶变换 36
3.1.3 傅里叶变换的性质 37
3.1.4 快速傅里叶变换 40
3.2 离散余弦变换 43
3.2.1 离散余弦变换的定义 44
3.2.2 离散余弦变换的正交性 45
3.2.3 离散余弦变换的计算 45
3.3 沃尔什—哈达玛变换 46
3.3.1 沃尔什变换 46
3.3.2 哈达玛变换 47
3.4 K—L变换 48
3.5 小波变换 49
3.5.1 小波的基本概念 49
3.5.2 小波变换 50
3.5.3 多分辨率分析 52
3.5.4 Mallat算法 52
3.5.5 图像的小波变换及算法 55
3.6 习题 58
参考文献 59
第4章 视频图像预处理 60
4.1 灰度变换 60
4.1.1 直接灰度变换 60
4.1.2 直方图变换 62
4.2 图像平滑 67
4.2.1 邻域平均法 68
4.2.2 中值滤波 71
4.2.3 多图像平均法 72
4.2.4 低通滤波法 73
4.3 图像锐化 74
4.3.1 图像锐化的基本思路 74
4.3.2 梯度算子 75
4.3.3 拉普拉斯算子 77
4.3.4 高通滤波法 77
4.4 图像校正 78
4.4.1 图像校正的基本思路 79
4.4.2 常用的图像几何变换 80
4.5 图像形态学处理 82
4.5.1 形态学的基本概念 83
4.5.2 形态学的基本运算 83
4.6 习题 84
参考文献 85
第5章 图像分割 86
5.1 阈值分割 87
5.1.1 阈值分割的原理与方法 87
5.1.2 基于像素的阈值选取 88
5.1.3 基于区域的阈值选取 91
5.2 基于区域的图像分割 95
5.2.1 区域生长 95
5.2.2 区域分裂—合并技术 98
5.3 基于边缘提取的图像分割 101
5.3.1 边缘检测 101
5.3.2 用于边缘检测的算子 102
5.3.3 边缘连接 108
5.3.4 哈夫变换 108
5.4 图像分割的量化评价 112
5.4.1 评价方法与分类 112
5.4.2 常用测度 113
5.5 习题 114
参考文献 114
第6章 视频分割的理论与方法 116
6.1 视频分割的相关概念 116
6.1.1 视频分割的定义 116
6.1.2 视频分割的研究和应用现状 117
6.2 视频分割的基本理论 121
6.2.1 视频分割的框架 121
6.2.2 视频对象分割方法的分类 121
6.3 视频分割技术 122
6.3.1 空间域分割技术 122
6.3.2 时域分割技术 129
6.3.3 时空联合分割技术 134
6.4 视频分割算法的性能评价标准 135
6.5 习题 136
参考文献 136
第7章 图像匹配 138
7.1 图像匹配的基本概念 138
7.2 图像匹配算法分类 138
7.3 模板匹配算法 139
7.3.1 ABS算法 139
7.3.2 归一化互相关匹配算法 140
7.3.3 图像矩匹配算法 141
7.3.4 基于图像特征点的匹配算法 143
7.4 改进算法 149
7.4.1 序贯相似性检测算法 149
7.4.2 基于排序的序贯相关算法 150
7.4.3 FFT的相关算法 152
7.4.4 分层搜索的序贯判决算法 153
7.5 其他算法介绍 155
7.5.1 基于对数极坐标变换的图像匹配算法 155
7.5.2 不同分辨率图像的角点匹配方法 157
7.6 待研究的问题 159
7.7 环境匹配技术发展简介 160
7.7.1 环境匹配算法研究的现状分析 160
7.7.2 环境匹配算法存在的主要问题 163
7.7.3 环境匹配技术的发展趋势 164
7.8 习题 165
参考文献 165
第8章 图像识别 166
8.1 图像识别的基本概念 166
8.2 基于匹配的识别技术 167
8.2.1 图像变换 167
8.2.2 相似性测度 168
8.2.3 插值算法 169
8.2.4 最小二乘法 169
8.3 统计识别方法 170
8.3.1 线性决策函数 170
8.3.2 最小距离分类器 173
8.4 人工神经网络识别法 174
8.4.1 人工神经网络的概念 175
8.4.2 BP神经网络 175
8.4.3 自组织网络 184
8.5 支持向量机识别方法 192
8.5.1 支持向量机 193
8.5.2 支持向量机的学习算法 196
8.6 习题 197
参考文献 197
第9章 运动目标跟踪 199
9.1 运动目标跟踪技术简介 199
9.2 卡尔曼滤波跟踪 200
9.2.1 离散卡尔曼滤波器 200
9.2.2 扩展卡尔曼滤波器 201
9.2.3 卡尔曼滤波器在目标检测与跟踪中的应用 202
9.3 光流分析法 204
9.3.1 运动场与光流场 204
9.3.2 Horn-Schunck经典光流计算方法 205
9.3.3 光流计算方法实验结果 208
9.4 均值漂移跟踪 209
9.4.1 均值漂移算法概述 209
9.4.2 基于色彩直方图的均值漂移 211
9.4.3 均值漂移目标跟踪效果 212
9.5 蒙特卡洛随机采样 213
9.5.1 贝叶斯滤波原理 213
9.5.2 蒙特卡洛方法 214
9.5.3 粒子滤波算法综述 215
9.5.4 粒子滤波目标跟踪效果 215
9.6 习题 217
参考文献 217
第10章 视频图像编码 218
10.1 视频图像编码概述 218
10.2 图像/视频编码标准 220
10.2.1 MPEG系列 220
10.2.2 H.26x系列 225
10.2.3 AVS 230
10.3 视频编码的整体框架和关键技术 231
10.3.1 预测编码 232
10.3.2 帧内预测 234
10.3.3 变换编码 237
10.3.4 变长编码 239
10.4 习题 240
参考文献 240
第11章 多媒体通信概述 241
11.1 多媒体通信概述 241
11.2 流媒体技术 242
11.2.1 流式传输的基础 242
11.2.2 流媒体的实现原理 243
11.2.3 流媒体的播放方式 243
11.2.4 流媒体的应用 245
11.3 多媒体通信协议 246
11.3.1 会话初始化协议 246
11.3.2 实时传输协议 252
11.3.3 实时流协议 256
11.3.4 QoS保障 258
11.4 多媒体通信系统 263
11.4.1 基于H.320的多媒体通信系统 263
11.4.2 基于H.323的多媒体通信系统 265
11.4.3 基于SIP的多媒体通信系统 269
11.4.4 基于P2P的多媒体通信系统 272
11.5 习题 277
参考文献 277
第12章 视频图像应用 278
12.1 基于视频图像的智能交通监控系统 278
12.1.1 系统硬件框架设计 278
12.1.2 系统软件总体结构 279
12.1.3 系统主要模块 280
12.1.4 系统软件界面 281
12.2 基于视频图像的客流量检测系统 282
12.2.1 客流密度估计 282
12.2.2 行人检测与计数 284
12.2.3 客流速度检测 285
12.3 基于视频图像的车载安全预警系统 286
12.3.1 交通标志识别系统 287
12.3.2 驾驶员注意力判别系统 289