第1章 特征工程 2
第1节 特征归一化 2
第2节 类别型特征 4
第3节 高维组合特征的处理 6
第4节 组合特征 9
第5节 文本表示模型 11
第6节 Word2Vec 13
第7节 图像数据不足时的处理方法 16
第2章 模型评估 20
第1节 评估指标的局限性 22
第2节 ROC曲线 27
第3节 余弦距离的应用 33
第4节 A/B测试的陷阱 37
第5节 模型评估的方法 40
第6节 超参数调优 43
第7节 过拟合与欠拟合 45
第3章 经典算法 48
第1节 支持向量机 50
第2节 逻辑回归 58
第3节 决策树 61
第4章 降维 72
第1节 PCA最大方差理论 74
第2节 PCA最小平方误差理论 78
第3节 线性判别分析 82
第4节 线性判别分析与主成分分析 86
第5章 非监督学习 90
第1节 K均值聚类 92
第2节 高斯混合模型 102
第3节 自组织映射神经网络 106
第4节 聚类算法的评估 111
第6章 概率图模型 116
第1节 概率图模型的联合概率分布 118
第2节 概率图表示 121
第3节 生成式模型与判别式模型 125
第4节 马尔可夫模型 127
第5节 主题模型 133
第7章 优化算法 140
第1节 有监督学习的损失函数 142
第2节 机器学习中的优化问题 145
第3节 经典优化算法 148
第4节 梯度验证 152
第5节 随机梯度下降法 155
第6节 随机梯度下降法的加速 158
第7节 L1正则化与稀疏性 164
第8章 采样 170
第1节 采样的作用 172
第2节 均匀分布随机数 174
第3节 常见的采样方法 176
第4节 高斯分布的采样 180
第5节 马尔可夫蒙特卡洛采样法 185
第6节 贝叶斯网络的采样 190
第7节 不均衡样本集的重采样 194
第9章 前向神经网络 198
第1节 多层感知机与布尔函数 200
第2节 深度神经网络中的激活函数 207
第3节 多层感知机的反向传播算法 211
第4节 神经网络训练技巧 217
第5节 深度卷积神经网络 222
第6节 深度残差网络 229
第10章 循环神经网络 234
第1节 循环神经网络和卷积神经网络 236
第2节 循环神经网络的梯度消失问题 238
第3节 循环神经网络中的激活函数 241
第4节 长短期记忆网络 243
第5节 Seq2Seq模型 247
第6节 注意力机制 251
第11章 强化学习 256
第1节 强化学习基础 258
第2节 视频游戏里的强化学习 264
第3节 策略梯度 268
第4节 探索与利用 272
第12章 集成学习 276
第1节 集成学习的种类 278
第2节 集成学习的步骤和例子 282
第3节 基分类器 285
第4节 偏差与方差 287
第5节 梯度提升决策树的基本原理 291
第6节 XGBoost与GBDT的联系和区别 295
第13章 生成式对抗网络 298
第1节 初识GANs的秘密 300
第2节 WGAN:抓住低维的幽灵 307
第3节 DCGAN:当GANs遇上卷积 313
第4节 ALI:包揽推断业务 319
第5节 IRGAN:生成离散样本 323
第6节 SeqGAN:生成文本序列 327
第14章 人工智能的热门应用 334
第1节 计算广告 336
第2节 游戏中的人工智能 347
第3节 AI在自动驾驶中的应用 360
第4节 机器翻译 369
第5节 人机交互中的智能计算 372
后记 377
作者随笔 377
参考文献 393