1 引言 1
1.1 深度学习的定义与背景 2
1.2 本书的结构安排 5
2 深度学习的历史 7
3 三类深度学习网络 17
3.1 三元分类方式 18
3.2 无监督和生成式学习深度网络 19
3.3 监督学习深度网络 23
3.4 混合深度网络 25
4 深度自编码器——一种无监督学习方法 29
4.1 引言 30
4.2 利用深度自编码器来提取语音特征 30
4.3 堆叠式去噪自编码器 37
4.4 转换自编码器 37
5 预训练的深度神经网络——一种混合方法 39
5.1 受限玻尔兹曼机 40
5.2 无监督逐层预训练 43
5.3 DNN和HMM结合 45
6 深度堆叠网络及其变形——有监督学习 47
6.1 简介 48
6.2 深度堆叠网络的基本结构 49
6.3 一种学习DSN权值的方法 50
6.4 张量深度堆叠网络 51
6.5 核化深度堆叠网络 54
7 语音和音频处理中的应用 59
7.1 语音识别中声学模型的建立 60
7.2 语音合成 76
7.3 音频和音乐处理 77
8 在语言模型和自然语言处理中的相关应用 79
8.1 语言模型 80
8.2 自然语言处理 84
9 信息检索领域中的应用 93
9.1 信息检索简介 94
9.2 用基于深度自编码器的语义哈希方法对文档进行索引和检索 95
9.3 文档检索中的深度结构语义模型 95
9.4 信息检索中深度堆叠网络的应用 101
10 在目标识别和计算机视觉中的应用 103
10.1 无监督或生成特征学习 104
10.2 有监督特征学习和分类 106
11 多模态和多任务学习中的典型应用 113
11.1 多模态:文本和图像 114
11.2 多模态:语音和图像 118
11.3 在语音、自然语言处理或者图像领域的多任务学习 120
12 结论 125
附录 129
参考文献 131