目录 1
第一章 概述 1
1.1 基本定义 2
1.2 可训练分类器与训练理论 3
1.3 假定与符号 5
1.4 训练过程的例子 6
1.5 线性判别函数 8
1.6 特征空间的扩张 14
1.7 二值输入分类器 15
1.8 权空间与特征空间 18
1.9 统计模型 19
1.10 性能评价 23
第二章 线性可分的类别 35
2.1 引言 35
2.2 凸集,可和性与线性可分性 36
2.3 符号与术语 46
2.4 感知器与比例增量训练方法 49
2.5 固定比值训练方法 53
2.6 一种多类训练方法 55
2.7 用对策论综合 58
2.8 简化技术 69
2.9 例子 72
2.10 梯度下降法 76
2.11 保证收敛的条件 79
2.12 用于设计分类器的梯度下降法 80
2.13 Ho-Kashyap法 83
第三章 非线性分类器 93
3.1 引言 93
3.2 Ф分类器 94
3.3 贝叶斯估计:参数训练 95
3.4 平滑技术:非参数训练 112
3.5 条形图 113
3.6 Parzen窗与位函数 121
3.7 节省存贮容量 124
3.8 固定基区条形图 128
3.9 样本集与标本 131
3.10 近对立标本对 135
3.11 局部训练分段线性分类器 137
第四章 损失函数和随机逼近 146
4.1 引言 146
4.2 比例增量法损失函数 147
4.3 样本梯度 153
4.4 先验知识的利用 155
4.5 一些重要训练方法的损失函数和梯度 157
4.6 损失函数的比较 176
4.7 不等代价的分类决策 178
4.8 随机逼近 180
4.9 几种不同组成密度的梯度和超平面 191
4.10 结论 198
第五章 用于非可分类别的线性分类器 204
5.1 梯度下降的修正 204
5.2 规范化、原点选择和初始向量 212
5.3 窗训练法 227
5.4 最小均方误差训练法 254
5.5 等错误训练法 264
5.6 不等代价的考虑 273
5.7 应用 274
5.8 总结 276
第六章 关于不可分类别的马尔可夫链训练模型 280
6.1 引言 280
6.2 分析一个随机差分方程的问题 281
6.3 单特征分类器的实例 283
6.4 具有常增量训练的单特征分类器 285
6.5 学习动态特性的基本性质 287
6.6 各态历经性和大范围稳定性 298
6.7 训练-工作进程:双方式类 305
6.8 最优有限记忆的学习 319
6.9 多维特征空间 337
第七章 连续状态模型 343
7.1 引言 343
7.2 形心方程式 346
7.3 在nρ≤t<∞的情况下证明∑(n)=?(ρ)U 350
7.4 协方差方程式 352
7.5 学习曲线和方差曲线 358
7.6 关于t的规格化问题 360
7.7 例题 361
7.8 单特征分类器中学习曲线的形状 367
7.9 等错误和最小错误点间的接近程度如何? 371
7.10 渐近的大范围稳定性 374
附录A 向量与矩阵 380
A.1 向量不等式及其它向量符号 380
A.2 置换矩阵 381
附录B 窗训练方法收敛性的证明 385
附录C 等错误训练法收敛性的证明 390
C.1 E(‖Z‖2|V)<∞及‖E(Z|V)‖2<∞的证明 390
C.2 定理5.3的证明 392
参考文献 396
汉英名词对照索引 402