目录 1
第1章 概述 1
1.1 多媒体计算机的发展历史 1
1.1.1 计算机的发展大事记 1
1.1.2 图形用户界面的发展 4
1.1.3 光盘发展的历史 6
1.2 多媒体技术的相关概念 7
1.2.1 媒体 7
1.2.2 多媒体与多媒体技术 10
1.3 多媒体系统的关键技术 11
1.3.1 多媒体信息的表示 11
1.3.2 多媒体输入输出技术 12
1.3.3 多媒体专用芯片技术 13
1.3.4 多媒体存储设备与技术 14
1.3.5 多媒体系统软件技术 16
1.3.6 多媒体传输技术 16
1.4 多媒体技术的应用 17
思考题 19
2.1 多媒体计算机基本结构 20
第2章 多媒体计算机系统 20
2.2 CPU技术 21
2.2.1 CPU的制造工艺 21
2.2.2 CPU内核的发展与转变 21
2.2.3 高速缓冲存储器 22
2.2.4 Intel超线程技术 22
2.2.5 CPU的重要性能指标 23
2.3.2 声卡芯片技术指标 25
2.3 声卡 25
2.3.1 声卡的发展历史 25
2.4 显卡 26
2.4.1 显卡的组成 27
2.4.2 显卡的接口 28
2.5 显示器 28
2.5.1 显示器的基本参数 28
2.5.2 CRT显示器 29
2.5.3 LCD显示器 30
2.5.4 等离子体显示器 32
2.5.5 背投 33
2.6 其他输入设备 34
2.6.1 视频采集卡 34
2.6.2 触摸屏 34
2.6.3 手写板 35
2.7 USB设备 36
2.7.1 USB协议的功能 37
2.7.2 USB拓扑 38
2.7.3 USB数据流向模式 39
2.7.4 USB设备地址和管道概念 39
2.7.5 USB传送类型 40
2.7.6 USB的机械特征和电特性 41
2.7.7 USB包的格式 41
2.7.8 电缆数据格式 43
2.7.9 USB的互连 43
2.7.10 USB主机概述 44
2.7.11 USB系统配置 46
2.8 多媒体操作系统 47
2.8.1 Windows 9x/Me对多媒体的支持 47
2.8.2 Windows NT对多媒体的支持 49
2.8.3 Windows XP对多媒体的支持 50
2.8.4 Windows 2003对多媒体的支持 51
2.8.5 Linux对多媒体的支持 51
思考题 52
3.1 信号处理的基本术语 53
第3章 数字信号处理基础 53
3.2 人类的听觉特性和视觉特性 54
3.2.1 人耳的听觉特性 55
3.2.2 人眼的视觉特性 56
3.3 音频信号处理基础 57
3.3.1 声音信号的特点 58
3.3.2 声音信号的分类 59
3.3.3 语音采样 59
3.3.4 预加重 60
3.3.5 加窗 60
3.3.7 短时过零率 61
3.3.6 短时能量 61
3.4 图像信号处理基础 62
3.4.1 色彩的基本概念 62
3.4.2 彩色空间及其变换 64
3.4.3 数字图像处理的研究内容 67
3.5 数字视频处理基础 69
3.5.1 数字视频的特征 69
3.5.2 数字视频的描述 70
3.5.4 数字视频CCIR 601编码标准 71
3.5.3 数字视频处理的主要研究内容 71
3.5.5 视频压缩编码的基本概念 72
3.5.6 视频信号的数字化处理对信号的损伤 73
3.6 常用的信号处理算法 79
3.6.1 傅里叶变换 79
3.6.2 小波变换 80
3.6.3 分形变换 81
3.6.4 人工神经网络 82
3.7.2 哈夫曼编码 83
3.7.1 行程长度编码 83
3.7 常用的编码算法 83
3.7.3 算术编码 85
3.7.4 感知编码 86
3.7.5 基于语义编码 87
3.7.6 矢量量化编码 88
3.7.7 基于模型编码 89
思考题 90
4.1 数字音频压缩技术 91
第4章 数字声音处理技术 91
4.1.1 音频压缩算法的分类 92
4.1.2 时域压缩算法 93
4.1.3 子带编码 97
4.1.4 MP3音频压缩编码 98
4.2 三维音效 99
4.2.1 人类的听觉 99
4.2.2 3D音效的分类 100
4.2.3 微软Direct Sound 3D 101
4.2.4 Aureal A3D 102
4.2.5 Creative EAX 103
4.2.6 Sensaura 104
4.2.7 QSound Q3D 105
4.2.8 杜比AC-3 105
4.2.9 DTS 107
4.3 语音识别 108
4.3.1 语音识别系统的构成 108
4.3.2 语音识别系统的分类 109
4.3.3 语音识别的基本过程 110
4.4.1 自然语言理解技术的发展历史 111
4.4 自然语言理解 111
4.4.2 自然语言理解的技术特点 112
4.4.3 自然语言理解技术的应用领域 114
4.5 语音合成 116
4.5.1 TTS 117
4.5.2 视觉语音 118
思考题 119
第5章 数字图像处理技术 120
5.1 数字图像压缩技术 120
5.1.1 图像数据的冗余 121
5.1.2 视频编码的运动估计方法 123
5.1.3 基于小波变换的极低码率视频编码技术 127
5.2 视频通信差错恢复技术 129
5.2.1 克服比特流同步丢失的编码方法 129
5.2.2 空间域内的差错复原编码技术 130
5.2.3 时间域内的差错复原编码技术 130
5.2.4 可伸缩编码 131
5.2.5 多描述编码 131
5.2.6 解码端差错掩盖技术 132
5.2.7 基于反馈的差错控制技术 133
5.3 图像分割技术 133
5.3.1 图像分割概述 134
5.3.2 阈值化分割方法 135
5.3.3 基于边缘检测的方法 138
5.3.4 基于区域的分割方法 139
5.3.5 彩色图像分割方法 140
5.3.6 纹理图像分割方法 141
5.3.7 灰度图像分割算法的常用评价方法 142
思考题 144
第6章 数字信号压缩标准 145
6.1 常见图形、图像文件格式 145
6.1.1 BMP 146
6.1.2 GIF 150
6.1.3 PDF 160
6.2 AVI数字视频 161
6.2.1 AVI数字视频的特点 161
6.2.2 AVI文件格式 162
6.2.3 AVI文件的主要参数 163
6.3 静态图像压缩标准 165
6.3.1 JPEG 165
6.3.2 JPEG 2000 171
6.4 动态图像压缩标准 178
6.4.1 概述 178
6.4.2 MPEG-1标准 179
6.4.3 MPEG-2标准 183
6.4.4 MPEG-4标准 185
6.4.5 H.261标准 187
6.4.6 H.263及H.263+标准 188
6.4.7 H.264标准 194
6.5 语音压缩编码标准 197
思考题 200
第7章 多媒体系统的人机交互技术 201
7.1 人机界面概述 202
7.1.1 人机界面的发展历史 202
7.1.2 人机界面设计技术 203
7.1.3 用户界面的设计目的以及设计原则 206
7.1.4 多媒体界面设计的艺术原则 207
7.2 多通道用户界面 211
7.2.1 多通道概念 211
7.2.2 多通道用户界面的特点 212
7.2.3 多通道用户界面的主要研究内容 213
7.2.4 多通道用户界面评价 215
7.2.5 多通道用户界面的应用 216
7.3 三维人机交互技术 216
7.3.1 三维交互设备与交互方式 217
7.3.2 人机交互中的视线跟踪技术 218
7.3.3 基于手势的人机交互技术 221
7.4 虚拟现实 224
7.4.1 虚拟现实的定义 224
7.4.2 虚拟现实的关键技术 226
7.4.3 虚拟现实的应用 227
思考题 228
第8章 多媒体信息存储 229
8.1 直接连接存储技术 230
8.1.1 SCSI技术 230
8.2 网络存储系统 231
8.1.2 RAID技术 231
8.2.1 网络存储系统的体系结构 232
8.2.2 存储区域网 232
8.2.3 联网存储 233
8.2.4 NAS与SAN的融合统一 235
8.3 存储网络技术 236
8.3.1 基于光纤通道技术的存储网络技术 236
8.3.2 基于分组交换技术的存储网络技术 236
8.3.3 基于InfiniBand技术的存储网络技术 238
8.4.2 DLT技术 239
8.4 磁带技术 239
8.4.1 DAT技术 239
8.4.3 LTO技术 240
8.5 存储虚拟化技术 240
8.6 光存储技术 242
8.6.1 光盘盘片的结构 242
8.6.2 光盘的光道结构 243
8.6.3 光盘制作过程 244
8.6.4 光盘数据读出的过程 244
8.6.5 光盘的规范及格式 246
8.6.6 DVD及其关键技术 248
8.6.7 CD-R盘 252
8.6.8 CD-RW盘 253
8.6.9 COMBO驱动器 255
8.6.10 蓝光光盘 255
思考题 258
第9章 多媒体信息的管理和查询 259
9.1.1 超文本和超媒体的概念 260
9.1 超文本和超媒体 260
9.1.2 超文本系统的基本特征 263
9.1.3 超文本系统的用户接口 263
9.2 HTML语言简介 265
9.2.1 HTML语言结构 265
9.2.2 HTML标签和属性 266
9.2.3 超链接 267
9.2.4 用HTML实现多媒体 269
9.3.1 XML是元标记语言 271
9.3 XML简介 271
9.3.2 XML的严格格式 272
9.3.3 XML文档的组成 273
9.3.4 VoiceXML 276
9.4 多媒体数据库 278
9.4.1 多媒体数据库设计中面临的问题 278
9.4.2 多媒体数据库的体系结构 280
9.4.3 多媒体数据库的层次结构 281
9.4.4 面向对象的多媒体数据库 282
9.5.1 查询语言 284
9.5 多媒体数据库检索 284
9.5.2 全文检索技术 285
9.5.3 Web信息检索 287
9.5.4 基于内容的图像检索 290
思考题 298
第10章 多媒体信息传输 299
10.1 多媒体计算机网络 299
10.1.1 有线网络接入技术 299
10.1.2 无线网络接入技术 304
10.1.3 IPv6 306
10.2 流媒体技术 309
10.2.1 流式传输 309
10.2.2 流媒体技术原理 310
10.2.3 流媒体播放方式 312
10.2.4 支持流媒体传输的网络协议 313
10.2.5 流媒体文件格式 314
10.3 移动多媒体通信技术 315
10.3.1 移动多媒体通信的关键要素 315
10.3.2 宽带移动多媒体通信 318
10.3.3 WAP与GPRS 320
10.4 分布式多媒体系统中的服务质量控制 321
10.4.1 分布式多媒体计算机系统的基本特征 321
10.4.2 服务质量控制的基本方法 323
10.4.3 网络服务模型 324
10.5 IP多播技术 329
10.5.1 IP多播概述 329
10.5.2 IP多播路由及其协议 330
10.5.4 基于IP多播的视频传输 332
10.5.3 IP多播路由中的隧道传输机制 332
10.5.5 IP多播技术在多点视频数据传输方面的优势 334
10.6 多媒体信息传输的安全 334
10.6.1 常见的攻击方法 335
10.6.2 安全控制目标 336
10.6.3 常用的信息加密技术 337
10.6.4 VPN 341
10.6.5 信息隐藏技术 344
思考题 347
第11章 典型多媒体应用系统的实现 348
11.1 基于多播的视频会议系统——H.323 348
11.1.1 H.323系统的体系结构 349
11.1.2 H.323终端 349
11.1.3 IP多播技术基础 349
11.1.4 基于多播的视频会议系统实现 357
11.1.5 视频会议系统的多点通信 358
11.1.6 音频和视频的实时传输实现 359
11.1.7 会议信令过程的实现 362
11.2 基于H.324协议的可视电话系统 369
11.2.1 H.324标准概述 369
11.2.2 H.223协议的实现 370
11.2.3 通信控制协议H.245及其软件实现 375
11.2.4 V.80协议接口及其软件实现 379
11.2.5 基于Windows的多线程设计策略 385
11.2.6 系统的兼容性设计 388
思考题 392
参考文献 393