第1章 多媒体系统设计:引言 1
1.1 多媒体元素 3
1.2 多媒体应用 6
1.2.1 文档图像化 7
1.2.2 图像处理和图像识别 8
1.2.3 全运动数字视频应用 11
1.2.4 电子消息 12
1.2.5 一个通用的多媒体应用 13
1.3 多媒体系统的体系结构 15
1.3.1 高分辨率图形显示 17
1.3.2 IMA体系结构框架 17
1.3.3 多媒体系统网络体系结构 18
1.3.4 联网标准 20
1.4 多媒体系统中正在发展的技术 21
1.4.1 超媒体文档 22
1.4.2 HDTV和UDTV 23
1.4.3三维技术和全息摄影 24
1.4.4 模糊逻辑 25
1.4.5 数字信号处理器 26
1.5 多媒体系统中的对象定义 27
1.5.1 文本 27
1.5.2 图像 28
1.5.3 音频和语音 29
1.5.4 全运动和现场视频 29
1.6.1 多媒体系统的文件格式 30
1.6 多媒体数据接口标准 30
1.6.2 视频处理标准 31
1.6.3 微软的AVI 32
1.7 数据压缩的需求 33
1.7.1 压缩标准 33
1.7.2 图像的无损压缩 34
1.7.3 照片和视频和有损压缩 35
1.7.4 硬件与软件压缩 36
1.8 多媒体数据库 37
1.8.1 多媒体存储的检索 38
1.8.2 多媒体系统的数据库管理系统 39
1.8.3 多媒体应用程序的数据库组织 41
1.9 小结 42
1.8.4 多媒体系统的事务管理 42
1.10 练习 43
第2章 压缩和解压缩 44
2.1 压缩类型 45
2.1.1 无损压缩 46
2.1.2 有损压缩 47
2.2 二值图像压缩方法 48
2.2.1 位包编码(游程编码) 48
2.2.2 CCITT Group 3 1-D压缩 49
2.2.3 CCITT Group 3 2D压缩 54
2.2.4 CCITT GrouP 4 2D压缩 56
2.3 彩色、灰度和静止视频图像压缩 57
2.3.1 黑白电视和彩色图像组成 59
2.3.2 JPEG压缩 60
JPEG标准中的定义 61
JPEG组成综述 62
JPEG方法 63
2.3.3 离散余弦变换(DCT) 65
量化 66
之字形序列 68
熵编码 68
2.4 视频图像压缩 92
2.4.1 全运动视频压缩的要求 92
2.4.2 CCITT H.261视频编码算法(P×64) 94
2.4.3 MPEG压缩 95
MPEG编码方法 96
2.4.4 运动图片类型 96
宏块 97
运动补偿 98
2.4.5 MPEG-2 99
2.4.6 MPEG-2,“大联盟” 100
2.4.7 向量量化 100
2.4.8 Intel的Indeo技术 101
2.4.9 苹果公司的Qucik Time 102
2.4.10 微软的AVI 102
2.4.11 Intel的DVI 102
2.5 音频压缩 102
2.5.1 自适应差分脉冲编码调制 103
2.6 分形压缩 103
2.7 小结 104
2.8 练习 105
第3章 数据和文件格式标准 106
3.1 富文本格式 107
3.2 TIFF文件格式 108
3.2.1 TIFF规范 108
3.2.2 TIFF结构 109
3.2.3 TIFF标记 113
3.2.3 关于实现TIFF的问题 117
3.2.4 TIFF类 118
3.3 资源文件交换格式(RIFF) 118
3.3.1 带有两个子主块的RIFF主块 120
3.3.2 表主块 121
3.3.3 带有INFO表主块的RIFF波形音频文件格式 121
3.3.4 RIFF MIDI文件格式 123
3.3.5 RIFF DIBS(独立于设备的位图) 124
3.3.6 RIFF调色板文件格式 126
3.3.7 RIFF音频视频交错(AVI)文件格式 127
3.3.8 索引主块“idxl” 133
3.3.9 AVI文件的边界条件处理 133
3.4 MIDI文件格式 134
3.4.1 MIDI通信协议 135
通道消息 135
系统消息 136
3.5 静止和运动图像的JPEG DIB文件格式 138
3.5.1 JPEG静止图像 139
3.5.2 JPEG运动图像 139
带有JPEG DIB的JPEG AVI文件格式 139
3.8 TWAIV 141
3.6 AVI Indeo文件格式 141
3.7 MPEG标准 141
3.8.1 TWAIN规范的目标 142
3.8.2 TWAIN的体系结构 143
3.8.3 新的WAVE RIFF文件格式 144
3.8.4 设立新的WAVE类型 147
微软ADPCM WAVE类型 148
CCITT标准扩展WAVE类型 150
DVI ADPCM Wave类型 150
Creative实验室ADPCM 151
Dolby实验室AC-2 Wave类型 152
3.10 练习 153
3.9 小结 153
第4章 多媒体输入/输出技术 155
4.1 关键技术问题 155
4.1.1 传统输入设备的局限 156
4.1.2 显示和编码技术 156
4.1.3 分辨率和带宽问题 157
4.1.4 多媒体输入和输出设备 157
4.2 笔式输入 158
4.2.1 笔比鼠标和键盘更优越吗? 159
4.2.2 电子笔是如何工作的? 160
电子笔 161
数字化仪 162
笔驱动程序 162
识别器 163
识别上下文管理程序 163
字典 164
显示驱动程序 164
4.3 视频图像显示系统 164
4.3.1 显示系统要求 164
显示系统技术 166
4.3.2 显示性能问题 167
4.3.3 视频显示技术标准 167
4.3.4 CPT显示系统 170
显示术语 172
4.3.5 平板显示系统 174
4.4 打印输出技术 175
4.4.1 激光打印技术 176
4.4.2 染料升华打印机 177
4.4.3 彩色打印机技术问题 178
4.5 图像扫描仪 179
4.5.1 扫描仪的类型 179
扫描仪格式系数 179
扫描机理和使用问题 180
4.5.2 扫描仪的眼睛——电荷耦合器件 181
CCD彩色获取 182
4.5.3 图像增强技术 183
4.5.4 图像操作 184
4.5.5. 扫描仪特性 185
4.5.6 扫描性能 186
4.6 数字语音和音频 186
4.6.1 数字音频 186
4.6.2 数字语音 187
4.6.3 语音识别系统 189
语音识别系统的类型 191
语音识别系统性能 194
语音识别的应用 194
4.6.4 乐器数字接口(MIDI) 196
MIDI规范 1.0 197
MIDI通信协议 198
4.6.5 MPC规范1.0和2.0 199
4.6.6 声音卡体系结构 200
4.7 数字相机 203
4.7.1 为什么用数字相机? 204
4.8.1 视频帧获取卡的体系结构 205
4.8 视频图像和动画 205
4.8.2 视频和静止图像处理 208
帧内图像处理 210
空间滤波处理 211
帧处理 213
4.8.3 图像动画技术 214
4.9 全运动视频 216
4.9.1 视频摄像机 216
4.9.2 全运动视频控制器 217
视频获取卡的体系结构 217
4.9.3 全运动视频的性能问题 218
4.10 小结 219
4.11 练习 220
5.1 磁介质技术 221
第5章 存储和检索技术 221
5.1.1 硬盘技术和历史 222
5.1.2 磁存储密度和等待时间 226
5.1.3 磁盘跨接 227
5.1.4 RAID(廉价磁盘的冗余阵列) 228
RAID0层——磁盘划分技术 229
RAID1层——磁盘镜像技术 230
RAID2层——数据位交错技术 231
RAID3层——并行磁盘阵列 233
RAID4层——扇区交错技术 234
RAID5层——块交错技术 235
选择RAID系统的标准 236
磁盘存储在多媒体上的使用 237
适用于AV(音频/视频)的磁驱动器 239
5.2 光介质技术 240
5.2.1 光存储密度和等待时间 241
5.2.2 CD-ROM 241
CD-ROM的标准 244
5.2.3 小型盘(MD) 248
5.2.4 WORM光盘驱动器 249
5.2.5 可重写光盘技术 253
磁光技术 253
相变可写式光盘 255
颜料聚合物可写式光盘 255
5.2.6 多功能驱动器 256
5.3 分层存储管理* 256
5.3.1 永久与瞬时存储的问题 257
5.3.2 光盘库 258
5.3.3 分层存储的应用 259
5.4 存储系统的高速缓冲存储器管理 260
5.4.1 低层次的盘高速缓冲存储 261
8.1.4 多源多用户著作系统 265
5.4.2 分层存储系统的高速缓冲存储器结构 265
8.1.5 电话著作系统 266
5.4.3 分布式客户机-服务器系统的高速缓冲存储器 268
8.2 超媒体应用程序设计 268
5.4.4 多媒体应用软件如何使用高速缓冲存储器? 269
5.5 小结 270
5.6 练习 271
6.1 专用计算处理器 272
第6章 体系结构与通信 272
6.1.1 用户处理芯片 273
6.1.2 数字信号处理 273
6.1.3 DSP与传统的体系结构 279
6.2 存储系统 279
6.2.1 存储器的类型与速度 279
6.2.2 存储器的组织 281
6.3.1 专用板卡 283
6.3 多媒体板卡方案 283
6.3.2 多功能卡 284
6.4 局域网/广域网连接 284
6.4.1 以太网 286
6.4.2 FDDI Ⅱ 287
6.4.3 ISDN(综合业务数字网) 292
6.4.4 Windows的电话接口体系结构 296
6.4.5 ATM 299
6.4.6 基于公共网络的广域网 303
6.4.7 局域和广域网设备 305
6.4.8 企业级多媒体应用中的局域网和广域网 307
6.5.1 对象连接嵌入(OLE) 308
6.5 分布式对象模型 308
6.5.2 分布式系统对象模型(DSOM) 313
6.5.3 公共对象请求代理(CORBA) 313
6.6 小结 314
6.7 练习 315
第7章 多媒体应用程序设计 316
7.1 多媒体应用程序分类 318
7.1.1 游戏 319
7.1.2 多媒体信息类 319
7.1.3 运用机顶系统的交互式电视 319
7.1.4 视频/电话会议和超媒体邮件 320
7.1.5 共享工作区和运行环境 321
7.1.6 业务处理工作流应用程序 322
7.2 多媒体系统的类型 323
7.2.2 业务系统 324
7.2.1 家庭/娱乐系统 324
7.3 虚拟现实设计 327
7.3.1 人的因素 327
7.3.2 多媒体输入和输出 328
7.3.3 虚拟现实建模 329
7.3.4 虚拟现实设计考虑 330
7.4 多媒体系统部件 331
7.4.1 多媒体输入系统 332
7.4.2 多媒体输出系统 332
7.4.3 多媒体存储系统 332
7.5 多媒体数据库的组织 334
7.5.1 多媒体数据库的特点 335
7.5.2 多媒体系统中的数据库管理系统 338
7.6 应用程序工作流设计 341
7.6.1 文档图像管理系统工作流 341
7.6.2 多媒体对象的工作流问题 343
7.7 分布式应用程序设计 346
7.7.1 网络和通信 347
7.7.2 高速缓存管理 348
7.7.3 压缩和解压缩 350
7.7.3 索引与QC的工作流集成 352
7.7.4 注释 353
7.8 小结 354
7.9 练习 355
第8章 多媒体著作和用户界面 356
8.1 多媒体著作系统 357
8.1.1 多媒体著作的设计问题 358
8.1.2 著作设计方法 361
8.1.3 多媒体著作系统的分类 361
8.2.1 应用程序集成 370
8.2.2 通用用户界面和应用程序集成 370
8.2.5 超媒体应用程序设计 371
8.2.4 分布式数据访问 371
8.2.3 数据交换 371
8.2.6 信息结构化 372
8.2.7 给对象加声音和视频 374
8.3 用户界面设计 374
8.3.1 应用程序中的导航 375
8.3.2 设计用户界面 376
8.3.3 多媒体应用程序的专用模拟 376
组织者(organizer)模拟 377
电话模拟 378
听觉用户界面 379
VCP模拟 379
8.3.4 音频/视频索引功能 380
8.4 信息访问 381
8.5 对象显示/播放问题 382
8.5.1 图像显示 382
8.5.2 音频质量 382
8.5.3 视频播放的特征 383
视频帧交错 383
场景变化帧检测 383
视频比例缩放、摇镜头和变焦 384
8.5.4 三维对象显示和模拟现实 385
8.6 小结 386
8.7 练习 386
第9章 超媒体消息系统 387
9.1 可移动消息传送 387
9.2 超媒体消息部件 388
9.2.1 文本消息 389
9.2.2 Rich-Text>(富文本)消息 390
9.2.3 语音消息 390
9.2.4 全运动视频管理 391
9.3 超媒体链接和嵌入 393
9.3.1 超文本文档中的链接 393
9.3.2 链接和嵌入:定义 394
9.4 创建超媒体消息 395
9.5 集成多媒体消息标准 396
9.5.1 与厂商无关的消息 396
9.5.2 MAPI支持 398
9.5.4 X.400消息处理服务 399
9.5.3 电话API 399
9.5.5 X.500目录系统标准 401
9.5.6 Interne消息 402
9.6 集成文档管理 403
9.7 小结 404
9.8 练习 404
第10章 分布式多媒体系统 405
10.1 分布式多媒体系统的组成 405
10.1.1 应用软件 407
10.1.2 文档存储 407
10.1.3 图像和静态视频存储 408
10.1.4 音频和全运动视频存储 408
10.1.6 部件服务代理 409
10.1.5 对象目录服务代理 409
10.1.7 用户界面服务代理 410
10.2 分布式客户机-服务器操作 410
10.2.1 分布式工作组计算中的客户机 411
10.2.2 分布式工作组计算中的服务器 412
10.2.3 数据库操作 412
10.2.4 分布式成组计算中的中间件 413
10.3 多媒体对象服务器 413
10.3.1 多媒体服务器的类型 414
10.3.2 多媒体服务器的大容量存储 416
WORM光盘 417
可重写式光盘 418
光盘库 418
10.4 多服务器网络拓扑结构 419
10.3.3 多媒体对象服务器的网络拓扑结构 419
10.4.1 传统的局域网 420
10.4.2 扩展的局域网 420
10.4.3 高速局域网 423
10.4.4 广域网 424
10.4.5 网络性能问题 427
10.5 分布式多媒体数据库 427
10.5.1 多媒体应用程序的数据库组织 428
10.5.2 多媒体系统的事务管理 429
10.5.3 将超媒体记录当作对象来管理 431
10.6 处理分布式对象 434
10.6.1 服务器间的通信 434
10.6.2 对象服务器结构 435
10.6.3 对象识别 438
10.6.4 对象修改管理 440
10.6.5 优化对象的网络定位 441
10.6.6 对象目录服务 442
10.6.7 多媒体对象检索 443
10.6.8 数据库复制(replication)技术 445
10.6.9 对象转存方案 449
10..10 优化对象存储 451
10.7 小结 452
10.8 练习 453
第11章 系统设计:方法与依据 454
11.1 基本设计问题 457
11.1.1 关键的交付结果 457
11.2.1 技术评估 458
11.2 确定企业需求 458
11.2.2 业务信息模型 459
11.3 检验当前的体系结构和可行性 460
11.4 性能分析 461
11.4.1 性能分析与监测 462
11.4.2 设计中影响性能的问题 463
11.5 性能设计 464
11.5.1 存储管理 464
11.5.2 访问管理和存储分布式优化 465
11.5.3 最大化网络传输 468
11.5.4 系统性能管理 469
11.6 多媒体系统设计 470
11.6.1 系统设计方法 470
11.6.3 面向对象多媒体系统 471
11.6.2 设计系统对象 471
11.6.4 设计对象 472
11.6.5 系统设计分析 475
11.7 系统可扩展性 476
11.8 小结 476
11.9 练习 476
第12章 多媒体系统设计实例 478
12.1 确定企业需求 479
12.2 IFC的业务模型 479
12.3 IFC的业务信息模型 480
12.3.1 应用程序功能需求一览 481
12.3.2 客户与经纪人的责任 482
12.3.3 应用程序提供的功能 483
12.3.4 应用程序数据 486
12.4 体系结构建议和技术可行性 488
12.4.1 体系结构建议 488
12.4.2 存储需求与技术可行性 489
12.5 对象建模 492
12.6 分析性能需求 492
12.7 设计考虑 492
12.8 设计存储分布 494
12.9 优化网络传输 495
12.10 小结 495
12.11 练习 495
多媒体术语表 497
参考文献 511