《多媒体原理 第1册 媒体编码及内容分析》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:(美)Ralf Steinmetz,(美)Klara Nahrstedt著;白金榜等译
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2003
  • ISBN:7505388622
  • 页数:215 页
图书介绍:本书介绍了数字音频、图像、视频、图形和动画的基本特点,论证了在内容分析和压缩方面有效的方法。内容包括多媒体和数据流的一般特征及其在多媒体系统设计方面的影响;基本的音频概念及表示的技术;图形和图像特征;各种视频信号,电制制式,数字化,以及基于计算机的动画问题;基本压缩方法及多媒体压缩标准;光学存储技术和设备;内容处理技术等。本书可作为高等学校计算机专业和通信专业本科生教材,也可作为有关工程技术人员参考用书。

第1章 引言 1

1.1 多媒体的学科交叉状况 2

1.2 本书内容 3

1.3 本书编排 3

1.3.1 媒体特征与编码 4

1.3.2 媒体压缩 4

1.3.3 光存储 4

1.3.4 内容处理 5

1.4 关于多媒体的更多读物 5

2.2 术语“媒体” 6

2.2.1 感知媒体 6

2.1 术语“多媒体” 6

第2章 媒体和数据流 6

2.2.2 表示媒体 7

2.2.3 显示媒体 7

2.2.4 存储媒体 7

2.2.5 传输媒体 7

2.2.6 信息交换媒体 8

2.2.7 显示空间和显示值 8

2.2.8 显示维数 8

2.3 多媒体系统的关键特性 9

2.3.1 离散和连续媒体 10

2.3.2 独立媒体 10

2.3.3 计算机控制的系统 10

2.3.4 集成 10

2.4.1 异步传输模式 11

2.3.5 总结 11

2.4 表征数据流 11

2.4.2 同步传输模式 12

2.4.3 等时传输模式 12

2.5 表征连续媒体数据流 12

2.5.1 强和弱周期数据流 12

2.5.2 连续信息单元的数据量变化 13

2.5.3 连续包的相互关系 15

2.6 信息单元 15

第3章 音频技术 17

3.1 什么是声音 17

3.1.3 声音感知和心理声学 18

3.1.2 幅度 18

3.1.1 频率 18

3.2 声音在计算机上的表示 21

3.2.1 采样速率 21

3.2.2 量化 22

3.3 三维声音投影 22

3.3.1 空间声音 22

3.3.2 反射系统 24

3.4 音乐和MIDI标准 24

3.4.1 MIDI简介 24

3.4.2 MIDI设备 25

3.4.3 MIDI和SMPTE时间标准 25

3.5.2 语音合成 26

3.5 语音信号 26

3.5.1 人类语音 26

3.6 语音输出 27

3.6.1 可再生的语音播放 27

3.6.2 时间域的声音连接 27

3.6.3 声音在频率域的连接 29

3.6.4 语音合成 29

3.7 语音输入 30

3.7.1 语音识别 30

3.8 语音传输 32

3.8.1 脉冲编码调制 32

3.8.2 信源编码 33

3.8.3 识别-合成法 34

3.8.4 可达到的质量 35

第4章 图形与图像 36

4.1 引言 36

4.2 捕获图形或图像 36

4.2.1 捕获现实的图像 36

4.2.2 图像格式 38

4.2.3 创建图形 43

4.2.4 存储图形 44

4.3 计算机辅助图形和图像处理 45

4.3.1 图像分析 45

4.3.2 图像合成 57

4.4 重构图像 58

4.4.1 雷顿变换 59

4.4.2 立体视法 60

4.5 图形和图像的输出方案 61

4.5.1 抖动 62

4.6 总结和展望 63

第5章 视频技术 64

5.1 基本概念 64

5.1.1 视频信号表示 64

5.1.2 信号格式 67

5.2 电视系统 70

5.2.1 传统的系统 70

5.2.2 高清晰度电视 71

5.3.1 复合编码 73

5.3 视频信号的数字化 73

5.3.2 分量编码 74

5.4 数字电视 75

第6章 电脑动画 77

6.1 基本概念 77

6.1.1 输入处理 77

6.1.2 合成阶段 77

6.1.3 中间处理 78

6.1.4 改变颜色 78

6.2 动画规范 79

6.3.4 通过分析实际动作来控制 80

6.3.3 基于约束的控制 80

6.3.2 过程控制 80

6.3.1 显控制 80

6.3 控制动画的方法 80

6.3.5 运动学和动力学控制 81

6.4 动画显示 81

6.5 动画传输 82

6.6 虚拟现实模型语言 82

第7章 数据压缩 85

7.1 存储空间 85

7.2 编码需求 85

7.3 信源编码,熵编码和混合编码 88

7.3.2 信源编码 89

7.3.1 熵编码 89

7.3.3 数据压缩的主要步骤 90

7.4 基本的压缩技术 91

7.4.1 游程编码 91

7.4.2 零抑制 92

7.4.3 矢量量化 92

7.4.4 模式置换 92

7.4.5 二元编码 92

7.4.6 统计编码 93

7.4.7 哈夫曼编码 93

7.4.8 算术编码 94

7.4.10 子带编码 95

7.4.11 预测或者相对编码 95

7.4.9 变换编码 95

7.4.12 增量调制 96

7.4.13 自适应压缩技术 96

7.4.14 其他基本技术 97

7.5 JPEG 97

7.5.1 图像预处理 99

7.5.2 基于DCT的有损顺序模式 102

7.5.3 基于DCT的扩展有损模式 107

7.5.4 无损模式 108

7.5.5 分层模式 109

7.6 H.261(px64)和H.263 110

7.6.1 图像预处理 111

7.6.2 编码算法 112

7.6.3 数据流 113

7.6.4 H.263+和H.263L 113

7.7 MPEG 114

7.7.1 视频编码 114

7.7.2 语音编码 118

7.7.3 数据流 119

7.7.4 MPEG-2 121

7.7.5 MPEG-4 124

7.7.6 MPEG-7 134

7.8 分形压缩 135

7.9 总结 136

第8章 光学存储媒质 138

8.1 光学存储的历史 138

8.2 基本技术 139

8.3 录像盘片和其他WORM 141

8.4 数字音频激光唱片 143

8.4.1 技术基础 143

8.4.2 八位至十四位调制 144

8.4.3 差错处理 145

8.4.4 CD-DA的帧,磁道,区域和块 146

8.4.5 数字CD-DA技术的优点 147

8.5 光盘只读存储器 148

8.5.1 块 148

8.5.2 模式 148

8.5.3 逻辑文件格式0 150

8.5.4 CD-ROM技术的局限性 151

8.6 CD-ROM扩展结构 152

8.6.1 形式1和形式2 153

8.6.2 不同媒质的压缩数据 153

8.7 基于CD-ROM技术的进一步发展 154

8.7.1 交互式光盘 155

8.7.2 CD简便交互式格式 157

8.7.3 CD桥盘 157

8.7.4 照片光盘 158

8.7.5 交互式数字视频系统和CDTV 159

8.8 可记录光盘存储器 159

8.9 CD-MO 161

8.10 可读写光盘 162

8.11.1 DVD标准 163

8.11 数字通用光盘 163

8.11.2 DVD-VIDEO:解码器 166

8.11.3 八位到十四位调制(EFM) 166

8.11.4 逻辑文件格式 167

8.11.5 DVD-CD比较 167

8.12 结尾综述 167

第9章 内容分析 170

9.1 简单特征与复杂特征 170

9.2 单个图像的分析 171

9.2.1 文本识别 171

9.2.2 基于相似性的图像数据库搜索 173

9.3.1 运动向量 174

9.3 图像序列的分析 174

9.3.2 切换检测 178

9.3.3 镜头分析 183

9.3.4 镜头级的基于相似性的搜索 183

9.3.5 场景和视频级的基于相似性的搜索 186

9.4 音频分析 187

9.4.1 句法音频指示器 188

9.4.2 语意音频指示器 188

9.5 应用 190

9.5.1 类型识别 190

9.5.2 视频中的文字识别 193

9.6 结束语 194

参考文献 195