第1章 绪论 1
1.1 音频信息处理技术的发展 3
1.1.1 音频编码压缩技术的发展 3
1.1.2 音频分类和场景分析技术的发展 6
1.1.3 音频信息检索技术的发展 7
1.1.4 音频水印及信息伪装技术的发展 8
1.2 音频信息处理技术的应用 11
参考文献 11
第2章 声学基础及人类听觉感知 12
2.1 声学基础知识 12
2.2 声音的感知 18
2.2.1 听觉系统 18
2.2.2 听觉特性 20
2.2.3 掩蔽效应 22
参考文献 27
第3章 音频信号的数字化及特征分析 28
3.1 音频信号的数字化 28
3.1.1 音频信号的采样与量化 28
3.1.2 短时加窗处理 30
3.2 音频信号的时域分析 32
3.2.1 短时能量分析 32
3.2.2 短时平均过零率 33
3.2.3 短时自相关函数和短时平均幅度差函数 34
3.3 音频信号的频域分析 35
3.3.1 傅里叶变换 36
3.3.2 离散余弦变换 37
3.3.3 线性预测分析 38
3.4 音频信号的时频域分析 40
3.4.1 信号的时频表示 40
3.4.2 Gabor变换 42
3.4.3 小波变换 43
3.5 音频信号的倒谱分析 44
3.5.1 线性预测倒谱分析 45
3.5.2 基于听觉特性的Mel频率倒谱分析 46
参考文献 46
第4章 音频信号的编码技术 47
4.1 概述 47
4.2 常用音频编码格式 48
4.2.1 PCM编码 48
4.2.2 WAV 48
4.2.3 MP3 49
4.2.4 MP3PRO 50
4.2.5 RealMedia 50
4.2.6 Windows Media 51
4.2.7 MIDI 51
4.2.8 OggVorbis 52
4.2.9 VQF 52
4.2.10 Mod 53
4.2.11 Monkey's Audio 53
4.2.12 AIFF 54
4.2.13 AU 54
4.2.14 VOC 54
4.2.15 Vox 54
4.3 几种格式的技术组成 55
4.3.1 WAV 55
4.3.2 MP3编码 57
4.4 编码格式的转换 65
4.4.1 音频编码标准 65
4.4.2 编解码的程序实现 68
参考文献 78
第5章 音频分类与场景识别技术 79
5.1 音频分类 79
5.1.1 音频分类中采用的特征 79
5.1.2 音频分类方法 84
5.2 独立场景识别技术 88
5.2.1 基于矢量量化的场景识别方法 89
5.2.2 基于隐马尔可夫模型的场景识别方法 90
5.2.3 基于增量支持向量机的场景识别方法 93
5.3 连续场景分析技术 96
5.3.1 基于模型的音频场景分割方法 97
5.3.2 基于阈值的音频场景分割方法 97
5.3.3 基于BIC的音频场景分割方法 98
参考文献 100
第6章 音频信息检索技术 101
6.1 概述 101
6.2 语音检索 102
6.3 音乐检索 108
6.3.1 哼唱检索 109
6.3.2 拍打检索 114
6.3.3 音频音乐检索 117
6.4 音频例子检索 123
6.4.1 动态直方图搜索方法 124
6.4.2 分段式检索方法 127
6.4.3 噪声下的音频例子检索方法 131
6.4.4 基于直方图的索引方法 136
参考文献 142
第7章 音频水印技术 145
7.1 引言 145
7.2 数字水印的基本理论 146
7.2.1 定义和基本特点 146
7.2.2 基本理论框架 147
7.2.3 数字水印的分类 149
7.3 时域水印算法 149
7.3.1 基于最低有效位的水印算法 149
7.3.2 回声隐藏水印算法 150
7.3.3 扩频方法 151
7.3.4 相位编码方法 153
7.3.5 基于听觉模型的方法 154
7.3.6 其他方法 155
7.4 变换域水印算法 156
7.4.1 傅里叶变换域水印算法 156
7.4.2 离散余弦变换域下水印算法 158
7.4.3 基于小波变换及其他变换的水印算法 159
7.5 水印嵌入模型及影响水印鲁棒性的因素 160
7.5.1 基于特征子空间分解的水印模型建立及性质 162
7.5.2 基于特征子空间分解的水印模型性质分析 165
7.5.3 离散傅里叶变换的分析 167
7.5.4 离散余弦变换分析 168
7.5.5 DCT与DFT的数据能量集中特性 169
7.5.6 离散小波变换分析 169
7.5.7 水印嵌入算法中相关问题的讨论 171
7.5.8 水印嵌入能量的估计 172
7.5.9 水印的鲁棒性评价 173
7.5.10 水印的容量估计 173
7.6 音频水印嵌入能量估计 173
7.6.1 掩蔽效应及听觉模型 173
7.6.2 能量估计 174
7.7 水印自身结构及其性质分析 175
7.7.1 水印嵌入方法及受到攻击的影响 175
7.7.2 水印信息熵与其鲁棒性关系 176
7.7.3 水印嵌入的能量及能量损失 178
7.7.4 水印形式转化原则 178
7.7.5 相关实验 179
7.8 水印的同步技术 180
7.8.1 水印中的同步技术 180
7.8.2 同步信号的确定方法 182
参考文献 183
第8章 音频信息伪装技术 185
8.1 信息伪装技术概论 185
8.1.1 与信息伪装技术相关的概念 185
8.1.2 信息伪装技术的发展 186
8.2 香农密码系统理论简介 191
8.2.1 密码技术简介 191
8.2.2 信息论基础简介 193
8.2.3 香农密码系统理论概要 199
8.3 Simmons认证系统理论简介 202
8.3.1 认证系统的数学模型 202
8.3.2 认证系统理论概要 203
8.4 音频信息伪装技术的容量问题 205
8.4.1 对容量的理论思考 206
8.4.2 一个音频信息伪装的容量描述 209
8.5 基于音频信息伪装的保密通信技术 211
8.5.1 基于音频信息伪装的保密通信模型 212
8.5.2 保密通信技术中的抗DA/AD转换研究 214
8.5.3 基于音频信息伪装的保密通信技术 220
8.5.4 基于音频信息伪装的保密通信系统性能评价 225
参考文献 226