第1章 理论和实践 1
1.1 基本原理 1
1.1.1 源编码 1
1.1.2 冗余和不相关性 1
1.1.3 无损和有损源编码 1
1.1.4 编码和传输 2
1.2 傅立叶变换 2
1.3 z变换 3
1.4 应用要求 3
1.4.1 点对点与广播 3
1.4.2 实时与离线 3
1.4.3 保真度 3
1.4.4 质量 3
1.4.5 错误的敏感度 4
1.4.6 可伸缩性 4
1.4.7 专用硬件 4
1.4.8 压缩率 4
1.4.9 成本 4
1.5 数字域中的信号 5
1.5.1 合成源 5
1.5.2 模拟信号的数字化 5
1.6 时间采样 6
1.6.1 采样幅值 8
1.6.2 脉冲编码调制 9
1.6.3 数字处理 9
1.6.4 模拟再现的准备 10
1.7 人类视觉系统 10
1.7.1图片质量 11
1.7.2 调制传输功能 13
1.7.3 倾斜效应:水平和垂直感觉 13
1.7.4 马赫效应和轮廓感觉 13
1.7.5 屏蔽 14
1.7.6 移动对象分辨率的损失 16
1.7.7 采样运动的插值 18
1.7.8 移动和静态图片传输编码 19
1.8 参考文献 21
第2章 视频压缩处理 22
2.1 扫描 22
2.1.1 同步 22
2.1.2 隔行扫描 22
2.1.3 分辨率 23
2.2 色彩基础 24
2.2.1 兼容性 24
2.3 颜色传输标准 25
2.3.1 NTSC编码器 26
2.3.2 NTSC解码器 27
2.3.3 PAL 28
2.3.4 PAL编码器 28
2.3.5 PAL解码器 29
2.3.6 SECAM 29
2.3.7 SECAM编码器 30
2.3.8 SECAM解码器 31
2.3.9 3个主要标准的比较 31
2.4 在视频信号数字处理过程中的特殊考虑 31
2.4.1 噪声 32
2.4.2 特殊滤波技术 34
2.4.3 空间滤波 34
2.4.4 时间滤波 34
第3章 视频压缩技术:编码 36
3.1 图片作为消息 36
3.2 编解码器参考模型 36
3.2.1 第1个图片模型和它的编码 37
3.2.2 特定源的码字分配 39
3.2.3 第2个图片模型:源存储器 41
3.3 数字图片编码:解相关和量化 43
3.3.1 解相关:源失去记忆 44
3.3.2 预测编码 45
3.3.3 转换编码基础 46
3.3.4 解相关信号的量化 47
3.3.5 量化器的设计步骤 48
3.3.6 非线性量化器 49
3.3.7 最大量化器,劳埃德算法 50
3.3.8 线性量化器 51
3.3.9 量化之前解相关的原因 51
3.4 参考文献 52
第4章 视频压缩技术:差分脉码调制技术 54
4.1 作为简单的解相关方法使用DPCM 54
4.1.1 误差影响的DPCM 54
4.1.2 从预测值中获取的信息 55
4.1.3 电视图片的预测器 56
4.1.4 内部预测 58
4.1.5 自适应预测器 60
4.1.6 通道的传输错误 61
4.1.7 预测误差的量化器 62
4.1.8 自适应量化器 66
4.2 图像序列的帧间编码和运动补偿 66
4.2.1 DPCM的预测器 66
4.2.2 运动补偿的原因 67
4.2.3 带有运动补偿的帖间DPCM 67
4.2.4 通过块匹配估计运动的方法 67
4.2.5 使用块匹配技术的运动估计器 69
4.2.6 块匹配所需的工作量 71
4.2.7 削减计算要求的块匹配技术 72
4.2.8 运动估计的其他方法 74
4.2.9 干扰对测量的影响 75
4.2.10 一般应用的运动向量 76
4.3 参考文献 76
第5章 视频压缩技术:变换编码 78
5.1 变换编码的重要性 78
5.1.1 频率域中的编码技术:变换编码 78
5.1.2 变换的一般解释 78
5.1.3 系数量化和编码优于像素的原因 81
5.1.4 哪种变换最好 83
5.1.5 平面变换 84
5.1.6 系数的量化过程 87
5.2 实现考虑 88
5.2.1 帧内转换编码 90
5.2.2 系数编码 93
5.2.3 其他考虑因素 96
5.2.4 帧间变换编码 96
5.2.5 帧间DCT或混合DCT 97
5.2.6 量化和传输引起的典型编码错误 98
5.2.7 实践考虑 98
5.3 参考文献 100
第6章 视频压缩技术:向量量化 102
6.1 引言 102
6.1.1 概述:标量量化器 102
6.2 向量量化器 103
6.2.1 随机VQ:设计代码薄 104
6.2.2 最相似码向量的搜索策略 106
6.2.3 晶格VQ 107
6.2.4 哪种晶格最好 108
6.2.5 工作量更少:金字塔VQ 109
6.2.6 晶格VQ还是随机VQ 109
6.3 应用于图片编码的VQ 111
6.3.1 分类的VQ(CVQ) 111
6.3.2 高通和带通信号的应用 112
6.3.3 预先可视化VQ 113
6.3.4 向量量化和防错 113
6.4 参考文献 116
第7章 子带编码 118
7.1 从声音到视觉 118
7.2 解相关原则 118
7.2.1 基本框图 119
7.2.2 增益 120
7.2.3 子带编码和DPCM 123
7.2.4 频带分割的应用 123
7.2.5 一个简单的例子 124
7.2.6 变换也是滤波器组 126
7.2.7 子带编码和变换编码 126
7.2.8 QMF组 127
7.2.9 图片频带分割的3种结构 128
7.2.10 量化 130
7.2.11 能消除所有依赖吗 131
7.2.12 应用考虑 131
7.2.13 运动图片的子带编码 132
7.2.14 子带编码:成果和前景 133
7.3 参考文献 133
第8章 声音和音频 135
8.1 概述 135
8.1.1 听觉屏蔽 135
8.1.2 频谱屏蔽 136
8.1.3 瞬态屏蔽 136
8.1.4 失真 137
8.1.5 声道 138
8.2 模拟压缩技术 141
8.2.1 预加重 141
8.2.2 宽带压缩扩展 141
8.3 数字音频压缩 143
8.4 数字压缩技术 144
8.4.1 子带ADPCM编码 145
8.4.2 线性预测 146
8.4.3 自适应量化 147
8.4.4 apt-X100编码延时 148
8.4.5 位错误响应 148
8.4.6 apt-X100的实现过程 149
8.4.7 自同步 149
8.4.8 子带APCM编码 149
8.4.9 ISO/MPEG第2层编码 150
8.4.10 比例系数 152
8.4.11 音频数据位分配 152
8.4.12 取消错误 152
8.4.13 编辑压缩数据 152
8.4.14 应用方面的考虑 152
8.5 参考文献 153
第9章 视频压缩标准 154
9.1 设置标准 154
9.2 视频压缩系统 154
9.2.1 JPEG 154
9.2.2 基线编码器 155
9.2.3 MPEG 155
9.2.4 MPEG-1 157
9.2.5 MPEG-2 159
9.2.6 视频源代码 159
9.2.7 空间和SNE可量测性 160
9.3 使用MPEG-2传输流进行定时和同步 162
9.3.1 MPEG-2视频压缩 163
9.3.2 MPEG-2传输流 164
9.3.3 系统时间戳 165
9.3.4 参考时钟同步 167
9.4 参考文献 168
第10章 压缩的应用 169
10.1 视频会议 169
10.1.1 H.261 169
10.1.2 H.261编码 172
10.2 数字视频转换 172
10.2.1 TV接收模式 172
10.3 CD应用 174
10.3.1 CD物理规范 174
10.3.2 CD 系统标准 175
10.3.3 红皮书:音频CD 176
10.3.4 红皮书重放 177
10.3.5 黄皮书:CD-ROM 178
10.3.6 ISO 9660格式 179
10.3.7 绿皮书(CD-I)和黄皮书 180
10.3.8 CD-I中的ADPCM音频压缩 180
10.3.9 CDI就绪光盘 181
10.3.10 增强CD(CD+) 181
10.3.11 CD桥光盘 181
10.3.12 相片CD 182
10.3.13 CD-I 全动和视频CD 183
10.3.14 可录制CD 183
10.3.15 CD视频 184
10.3.16 MMCD 184
10.4 参考文献 185
第11章 计算机的压缩应用 186
11.1 简介 186
11.1.1 TV音频和视频信号 186
11.1.2 PC总线和视频捕获结构 186
11.1.3 模拟MUX结构 188
11.1.4 数字MUX结构 189
11.1.5 DAC附加结构 189
11.1.6 共享帧缓冲区结构 190
11.1.7 外设元件接口(PCI)结构 190
11.1.8 PCI多媒体接口 190
11.1.9 立体声解码器 191
11.1.10 视频换算器 192
11.1.11 闭路字幕和图文电视解码器 192
11.1.12 MPEG-1音频和视频解码器 192
11.1.13 软件解码 193
11.2 只用软件压缩的算法 196
11.2.1 向量量化 196
11.2.2 小波变换 196
11.2.3 分形 196
11.3 PC应用 197
11.3.1 PCI总线 197
11.3.2 PCI视频使新应用得以实现 198
11.3.3 PCI多媒体桥IC中的SAA714X家族 199