第一部分 多媒体的关键技术:数据压缩 3
第一章 多媒体计算机技术 3
1.1 多媒体计算机的定义、分类及其发展趋势 3
1.1.1 利用多媒体是计算机技术发展的必然趋势 3
1.1.2 多媒体计算机的定义和分类 4
1.2 多媒体技术促进了通信、娱乐和计算机的融合 4
1.2.1 多媒体技术是解决常规电视数字化及高清晰度电视(HDTV)切实可行的方案 4
1.2.2 用多媒体技术制作V-CD及影视音响卡拉OK机 7
1.2.3 个人信息通信中心(PIC——Personal Information Communication Centre) 7
1.3 多媒体计算机技术的发展和应用 8
1.3.1 多媒体数据库 9
1.3.2 多媒体通信 10
1.3.3 多媒体创作工具及其应用 11
1.3.4 多媒体计算机的发展趋势 12
第二章 多媒体数据压缩的基本技术 14
2.1 多媒体数据压缩的必要性和可能性 14
2.2 统计编码 15
2.2.1 统计编码原理 15
2.2.2 霍夫曼(Huffman)编码 17
2.2.3 算术编码 18
2.2.4 行程编码(RLC) 19
2.3.1 预测编码的基本原理 20
2.3.2 DPCM的基本原理 20
2.3 预测编码 20
2.3.3 最佳线性预测 21
2.3.4 自适应预测编码 22
2.4 变换编码 23
2.4.1 变换编码的基本原理 23
2.4.2 最佳的正交变换——K-L变换 24
2.4.3 次最优正交变换——DCT变换 28
2.4.4 小波变换 31
3.1.1 引言 37
第三章 多媒体数据压缩标准 37
3.1 JPEG 37
3.1.2 基于离散余弦变换(DCT)的编码 38
3.1.3 基于DPCM的预测编码 50
3.1.4 基于DCT的累进操作方式编码 50
3.1.5 基于DCT的分层编码操作方式 51
3.1.6 结束语 51
3.2 MPEG-1 52
3.2.1 引言 52
3.2.2 MPEG-1视频 52
3.2.3 MPEG-1音频 77
3.2.4 结束语 78
3.3 MPEG-2 78
3.4 AC-3 80
3.4.1 引言 80
3.4.2 AC-3编码原理 81
3.4.3 AC-3编码的技术要点 82
3.4.4 结束语 85
3.5 MPEG-4 86
3.6 MPEG-7 87
3.6.1 概述 87
3.6.2 MPEG-7的制定工作 89
第二部分 MPEG-4标准 93
第四章 MPEG-4系统流 93
4.1 系统体系结构 93
4.1.1 系统终端模型 94
4.1.2 传输层定义 95
4.1.3 同步层定义 95
4.1.4 压缩层定义 95
4.2 系统解码器模型 97
4.2.1 系统解码器模型的基本概念 97
4.2.2 定时模型规范 98
4.2.3 缓冲区模型规范 100
4.3 对象描述框架 101
4.3.1 基本数据结构 103
4.3.2 属性智能管理和保护 105
4.3.3 对象内容信息 106
4.3.4 对象描述符流 108
4.3.5 对象描述符的部件 111
4.3.6 对象描述框架的使用规则 129
4.3.7 IPMP系统接口的使用 134
4.4 场景描述 138
4.4.1 场景描述概念 138
4.4.2 场景的二进制格式(BIFS)语法 150
4.4.3 结点语义 203
4.5 基本码流的同步 206
4.5.1 同步层概念 207
4.5.2 基本码流接口 212
4.6 基本码流的多路合成 213
4.7 句法构造描述语言 216
4.7.1 基本的数据类型 217
4.7.2 句法流控制 217
4.8 附录:基本术语 218
5.1.1 视频流中的数据结构 221
5.1 视频流的语法和语义 221
第五章 MPEG-4视频流 221
5.1.2 视频流语法 230
5.1.3 视频流语义 271
5.2 视频流解码 321
5.2.1 视频解码过程 322
5.2.2 高级语法结构 322
5.2.3 视频对象平面(VOP)重建 323
5.2.4 纹理解码 323
5.2.5 形状解码 333
5.2.6 运动补偿解码 346
5.2.7 交织视频解码 360
5.2.8 Sprite解码 368
5.2.9 一般扩展性解码 374
5.2.10 静态纹理对象解码 380
5.2.11 网格对象解码 392
5.2.12 人脸对象解码 397
5.2.13 解码过程的输出 401
5.3 视频系统合成 401
5.3.1 时域扩展性合成 401
5.3.2 Sprite合成 403
5.3.3 网格对象合成 403
5.4.1 视觉对象类型 404
5.4 框架和级 404
5.4.2 视觉框架 405
5.4.3 视觉框架和级 407
第六章 MPEG-4音频流 409
6.1 概述 409
6.1.1 MPEG-4音频 409
6.1.2 MPEG-4音频中的新概念 409
6.1.3 MPEG-4音频的性能 410
6.2 技术特点 413
6.2.1 MPEG-4音频对象类型 413
6.2.2 音频框架和级 415
6.3 话音编码 418
6.3.1 CELP 418
6.3.2 HVXC 421
6.4 通用音频编码 423
6.4.1 编码器和解码器框图 423
6.4.2 编码器和解码器工具 423
6.5 结构化音频 428
6.5.1 目标 428
6.5.2 主要元素 428
7.1.1 MPEG-4校验模型(VM)的编码结构 433
7.1 MPEG-4校验模型编码 433
第三部分 MPEG-4校验模型 433
第七章 编码器结构 433
7.1.2 VM中的数据结构 434
7.1.3 基于VOP的编码 434
7.1.4 视频对象平面的编码结构 437
7.2 形状编码 438
7.2.1 VM中的形状编码方法 438
7.2.2 二值形状编码方法 439
7.2.3 灰度级的形状编码 444
7.3 运动估计和补偿 445
7.3.1 填充技术 446
7.3.2 基本的运动估计技术 447
7.3.3 无限的运动估计 449
7.3.4 高级预测模式 449
7.3.5 重叠的运动预测 450
7.4 纹理编码 451
7.4.1 DCT变换 451
7.4.2 量化方法 452
7.4.3 I-VOP和P-VOP帧内编码DC、AC的预测 454
7.4.4 量化变换系数的VLC编码 455
7.5.1 B-VOP编码模式 456
7.5 B-VOP的编码 456
7.5.2 编码模式选择 457
7.5.3 运动矢量编码 458
7.6 容错和码率控制 458
7.6.1 MPEG-4容错方式 458
7.6.2 码率控制 460
7.7 可扩展性编码 464
7.7.1 空域扩展编码 465
7.7.2 时域扩展编码 466
7.8.1 sprite介绍 468
7.8 sprite编码 468
7.8.2 sprite的生成方法 469
7.8.3 Sprite编码 470
第八章 解码器结构 472
8.1 视频对象平面解码器结构 472
8.2 时域预测结构 472
8.3 可扩展性解码 473
8.3.1 空域扩展解码 474
8.3.2 时域扩展解码 474
8.4 合成器定义 475
参考文献 478