1.1概论 1
1.1.1多媒体和多媒体技术 1
1.1.2多媒体网络 1
第1章 网络多媒体基础知识 1
1.2音频基础 2
1.2.1各种主流音频编码(或格式)的介绍 2
1.2.2语音识别技术 4
1.3.2M-JPEG 6
1.3.3MPEG系列标准 6
1.3.1国际电联的H.261和H.263标准 6
1.3视频基础 6
1.3.4MPEG-21 7
1.4流媒体技术基础 7
1.4.1概述 7
1.4.2流媒体技术 8
1.4.3流媒体发展现状 9
1.5DirectX简介 10
2.1.1VFW简介 11
2.1VFW视频捕捉简介 11
第2章 视频捕捉系统 11
2.1.2AVI的RIFF格式 13
2.1.3捕捉参数的设置 18
2.1.4捕捉窗口 19
2.1.5捕捉驱动程序 20
2.1.6捕捉文件和缓存 21
2.1.7其他类型的捕捉 23
2.1.8高级捕捉选项 25
2.1.9AVICap回调函数 26
2.2视频捕捉程序举例 28
2.3VC++下实现VFW应用实例 33
2.3.1系统介绍 33
2.3.2创建窗口和按钮 34
2.3.3显示视频源窗口 35
2.3.4实现窗口的关闭、最小化和显示帮助的代码 36
2.3.5实现录像的代码 36
2.4本章小结 39
3.1.1视频会议系统的结构 40
3.1视频会议系统 40
第3章 视频会议系统 40
3.1.2H.320和H.323两种技术标准的对比 41
3.2视频会议的解决方案 43
3.2.1基于局域网的视频会议解决方案 43
3.2.2基于ISDN广域网的视频会议解决方案 43
3.2.3基于卫星网的视频会议解决方案 44
3.3视频会议的安全保密 44
3.3.1视频会议系统安全保密方法 44
3.3.2视频会议系统中的加密算法 45
3.4.1多点会议的3种模式 47
3.3.3访问控制 47
3.4IP视频会议系统 47
3.4.2确保IP视频会议质量 48
3.5视频会议系统 50
3.5.1系统硬件平台 50
3.5.2系统软件平台 50
3.6代码分析 51
3.6.1代码简介 51
3.6.3通信类型选择 52
3.6.2实时通信客户端接口 52
3.6.5初始化一个会话 53
3.6.4调整通信设备 53
3.6.6处理实时通信事件 56
3.6.7创建一个通信会话 58
3.6.8处理实时流会话事件 59
3.6.11结束会话 63
3.7本章小结 63
3.6.10支持白板 63
3.6.9共享应用程序 63
第4章 远程视频监控系统 65
4.1视频监控系统概述 65
4.2远程视频监控系统概述 66
4.2.1简介 66
4.2.2体系结构 66
4.3数字视频压缩及传输技术 67
4.3.1数字视频压缩技术 67
4.3.2视频图像传输技术 68
4.4远程视频监控系统 70
4.5.1AV-8视频采集卡简介 72
4.5视频采集与压缩 72
4.5.2AV-8二次开发基础 73
4.5.3程序实现 77
4.6实时图像和视频文件的播放 84
4.6.1DirectShow简介 84
4.6.2程序实现 88
4.7视频数据发送和接收播放 94
4.7.1Winsock网络编程技术 94
4.7.2Windows多线程编程技术 99
4.7.3视频数据发送和接收播放模块的设计 103
4.7.4视频数据发送模块的程序实现 105
4.7.5视频数据接收播放模块的程序实现 114
4.8本章小结 125
第5章 MPEG-4播放技术 126
5.1MPEG-4简介 126
5.1.1MPEG制定的标准 126
5.1.2MPEG-4标准的特点和功能 127
5.1.3MPEG-4的视频数据流结构 128
5.2MPEG-4的关键技术 130
5.1.4MPEG的图像类型及码流组成 130
5.2.1多媒体传送集成框架DMIF 131
5.2.2语法描述 131
5.2.3音频对象的编码 131
5.2.4视频对象的编码 132
5.3MPEG-4播放器系统简介 133
5.3.1系统硬件平台 133
5.3.2系统软件平台 133
5.4系统实现 133
5.4.2代码分析 134
5.4.1系统流程图 134
5.4.3系统运行 156
5.5本章小结 157
第6章 MPEG-4编码技术 158
6.1MPEG-4编码的特性 158
6.2视频对象(VO) 159
6.3MPEG-4的编码过程 160
6.3.1形状编码 161
6.3.2运动估计和运动补偿 161
6.3.3纹理编码 162
6.3.4容错和纠错 164
6.3.5可扩展性编码 165
6.4MPEG-4音频编码 165
6.4.1MPEG-4音频编码简介 165
6.4.2参数编码 166
6.4.3码激励线性预测编码 166
6.5MPEG-4编码源代码分析 167
6.5.1入口函数 167
6.5.2运动信息编码 173
6.5.3纹理编码 182
6.6本章小结 194
第7章 MPEG-4解码技术 195
7.1虚拟世界、多媒体与MPEG-4 195
7.1.1多媒体与虚拟世界(VW) 195
7.1.2MPEG-4的特色 195
7.1.3MPEG-4的架构 196
7.2MPEG-4系统 198
7.2.1系统解码器模型 198
7.2.2场景描述 201
7.2.3对象描述框架 204
7.2.5基本码流同步(同步层) 206
7.2.4MPEG-J 206
7.2.6基本码流的多路合成 207
7.3MPEG-4解码技术 207
7.4MPEG-4系统软硬件平台 209
7.4.1系统硬件平台 209
7.4.2系统软件平台 209
7.5系统实现 209
7.5.1系统流程图 209
7.5.2代码分析 209
7.6本章小结 236
第8章 MP3深入编程 237
8.1音频基本概念 237
8.1.1音频压缩的意图 237
8.1.2音频压缩的两个部分 237
8.1.3工作原理 237
8.1.4压缩率、比特率和质量 238
8.1.5SideInformation(旁信息) 238
8.2音频压缩 238
8.2.1听觉机制 238
8.2.2亚能带编码 240
8.2.3MPEG第一层面 241
8.2.4MPEG第二层面 242
8.2.5变换编码 242
8.2.6MPEG第三层面 242
8.2.7AC-3 243
8.3MP3编码分析 243
8.3.1编码解析 243
8.3.2编码层 244
8.4解码详述 248
8.5CoolPlayer分析 255
8.5.1播放器的“假”引擎 256
8.5.2真正的引擎 264
8.6本章小结 271
第9章 XvidQP系统 272
9.1Xvid简介 272
9.1.1Xvid特点 272
9.1.2Xvid压缩原理 274
9.1.3Xvid的量化方法 276
9.2系统实现 277
9.2.1程序流程图 277
9.2.2代码分析 278
9.3本章小结 300
第10章 DirectShow程序设计 301
10.1DirectShow简介 301
10.1.1DirectShow系统结构 301
10.1.2Filter的注册 302
10.1.3Filter测试工具GraphEdit 303
10.1.4DirectShow事件通知机制 304
10.1.5DirectShow对硬件的支持 306
10.2Filter的开发 307
10.2.1FilterPin之间的连接 307
10.2.2FilterMediatype概述 308
10.2.3数据传输 310
10.2.4流的定位 311
10.3用VC开发Directshow程序 311
10.3.1建立Filter项目 311
10.3.3编程中应该注意的问题 312
10.3.2选择合适的Filter基类 312
10.4DirectShow应用——视频捕捉WDMVsVFW 313
10.4.1视频捕捉卡 313
10.4.2枚举系统捕捉卡 314
10.4.3CaptureFilter和其他Filter之间的连接 314
10.4.4实现视频捕捉到文件 315
10.5DirectShow应用——音频捕捉 316
10.5.1AudioCaptureFilter 316
10.5.2创建一个音频捕捉程序 316
10.5.4改变音频捕捉缓冲的大小 318
10.5.3音频捕捉前的参数设置 318
10.6DirectShow应用——支持数码摄像机 319
10.6.1DV简介 319
10.6.2通过程序去控制DV机 319
10.6.3DV的各种实际应用场合 320
10.7DirectShow应用——支持DVD播放 321
10.7.1DVD基础知识 321
10.7.2DirectShow对DVD的支持 323
10.7.3编写DVD播放程序的注意事项 324
10.8.1ASF 325
10.8DirectShow应用——支持WindowsMedia格式 325
10.8.2播放ASF文件的播放器 326
10.9DirectShow开发高级实例——PID扩展插件开发 327
10.9.1PID应用原理 327
10.9.2PID插件开发 328
10.9.3需求来源 328
10.9.4开发环境 328
10.9.5关键代码 328
10.9.6PID使用演示 333
10.10.1关键代码 334
10.10DirectShow开发综合实例——数字电视接收器 334
10.10.2构建FilterGraph 336
10.10.3获得tune请求 339
10.10.4创建NetworkProviderFilter 341
10.10.5相似tuning空间 343
10.10.6提交tune请求给NetworkProvider 343
10.10.7添加并且连接其他filter 343
10.11本章小结 349
11.1Direct3D体系结构概述 350
11.1.1Direct3D图形流水线 350
第11章 Direct3D程序设计 350
11.1.2硬件抽象层 351
11.1.3系统集成 351
11.2可编程流水线 351
11.2.1把顶点着色器集成到几何流水线中 353
11.2.2把像素着色器集成到图形流水线中 353
11.3可编程数据流模型 354
11.3.1数据流的使用 354
11.3.2顶点颜色着色器 357
11.3.3单纹理着色器 358
11.3.4多重纹理着色器 358
11.4顶点着色器 359
11.4.1VertexShader编程概览 361
11.4.2VertexShader定义 362
11.4.3编写和编译VertexShader 364
11.5像素着色器 372
11.5.1创建像素着色器 372
11.5.2确认对像素着色器的支持 374
11.5.4对纹理的一些考虑 375
11.5.3纹理操作的转换 375
11.5.5像素着色器示例 377
11.6地表凹凸贴图(BumpEathe)实例 381
11.6.1整体描述 381
11.6.2凹凸贴图代码分析 383
11.7本章小结 394
第12章 DirectSound程序设计 395
12.1DirectSound的功能 395
12.2DirectSound和DirectMusic比较 395
12.3.1编译和连接DirectSound工程 396
12.3DirectSound编程初步介绍 396
12.3.2调试DirectSound工程 397
12.3.3为了测试而调整硬件加速程度 397
12.3.4DirectSound编程第一步 397
12.4DirectSound的详细使用方法 398
12.4.1DirectSound播放对象 398
12.4.2DirectSound设备 399
12.4.3DirectSound缓冲区 402
12.4.4使用WAV数据 410
12.4.53D声音 411
12.4.6使用音效 414
12.5工程实例 417
12.5.1CSound类的实现 418
12.5.2主程序的实现 422
12.6本章小结 424
第13章 DirectMusic程序设计 425
13.1DirectMusic简介 425
13.2DirectMusic的功能 425
13.3.1核心层和Performance层 426
13.3DirectMusic体系结构 426
13.3.2DirectMusic对象和接口综述 427
13.3.3DirectMusic音频数据流程综述 431
13.3.4DirectMusic消息 432
13.3.5可下载音色技术(DLS) 437
13.3.6Microsoft软件合成器 438
13.4系统软硬件平台 438
13.4.1系统硬件平台 438
13.4.2系统软件平台 438
13.5.1实例一系统流程图 439
13.5.2实例一代码分析 439
13.5系统实现 439
13.5.3实例一系统运行 442
13.5.4实例二系统流程图 444
13.5.5实例二代码分析 445
13.5.6实例二系统运行 459
13.6本章小结 460
第14章 语音识别系统 461
14.1语音识别技术的基本原理与方法 461
14.1.1人类声音的产生机理与数学模型 461
14.1.2基于模板匹配的语音识别技术 463
14.1.3动态时间规整法(DTW) 467
14.1.4基于DTW技术的语音识别方案 470
14.2系统关键技术算法及具体实现 471
14.2.1Windows语音编程 471
14.2.2机器人语音控制系统的实现 476
14.3系统基本技术要求 485
14.3.1系统硬件配置及搭建 485
14.3.2系统软件配置及搭建 485
14.3.3系统程序实现 485
14.4本章小结 504