第1章 概论 1
1.1 模式识别的基本概念 1
1.2 模式和模式类 2
1.3 模式识别的方法 4
1.3.1 统计模式识别 4
1.3.2 句法模式识别 5
1.3.3 模糊模式识别方法和神经网络方法 5
1.4 学习(训练)的概念 7
1.5 模式识别系统 8
1.5.1 数据获取 8
1.5.2 预处理 8
1.5.3 特征选择和降维 8
1.5.4 分类决策 9
1.6 模型识别技术的重要应用 9
1.6.1 科学应用 9
1.6.2 生命与行为科学 9
1.6.3 工业应用 10
1.6.4 医学应用 10
1.6.5 农业应用 10
1.6.6 行政应用 10
1.6.7 某些军事用途 10
1.7 模式识别应用举例——邮政编码识别 11
1.7.1 二值化处理 11
1.7.2 平滑处理 12
1.7.3 细化处理 12
1.7.4 跟踪和抽取特征 14
1.7.5 分类判决 15
第2章 判别函数 18
2.1 判别函数(判决函数) 18
2.2 线性判别函数 18
2.3 线性判别函数的性质 24
2.3.1 模式空间与加权空间 24
2.3.2 解向量和解区 24
2.3.3 超平面的几何性质 25
2.3.4 二分法能力 26
2.4 广义线性判别函数 28
2.5 非线性判别函数 30
2.5.1 分段线性判别函数 30
2.5.2 基于距离的分段线性判别函数 30
2.5.3 基于函数的分段线性判别函数 32
2.5.4 用凹函数的并表示分段线性判别函数 32
2.5.5 二次判别函数 33
第3章 分类器的设计 35
3.1 线性分类器的设计 35
3.1.1 梯度下降法——迭代法 37
3.1.2 感知器法 37
3.1.3 最小平方误差准则(MSE法)——非迭代法 41
3.1.4 韦-霍氏法(LMS法) 42
3.1.5 何-卡氏法(LMSE算法) 43
3.1.6 Fisher分类准则 45
3.2 分段线形分类器的设计 47
3.2.1 已知子类划分时的设计方法 48
3.2.2 已知子类数目的设计方法 48
3.2.3 未知子类数目时的设计方法 48
3.3 线性不可分问题的分类器的设计 49
3.4 讨论 54
第4章 贝叶斯决策理论 56
4.1 Bayes(贝叶斯)分类器 56
4.1.1 两类问题 56
4.1.2 多类情况 58
4.2 正态分布决策理论 59
4.2.1 正态分布判别函数 60
4.2.2 最小错误率(贝叶斯)分类器 61
4.3 关于分类器的错误率分析 65
4.3.1 一般错误率分析 65
4.3.2 正态分布最小错误率 67
4.4 最小风险贝叶斯分类器 67
4.5 贝叶斯分类器算法 70
4.6 聂曼—皮尔逊判决准则(Neyman-Pearson) 74
4.7 最大最小判别准则 76
4.8 决策树 79
4.8.1 基本概念 80
4.8.2 决策树的构造 80
4.8.3 决策树设计的基本考虑 82
4.9 序贯分类 82
4.10 讨论 84
第5章 参数估计与非参数估计 85
5.1 参数估计与监督学习 85
5.1.1 参数估计与非参数估计 86
5.1.2 监督学习与无监督学习 86
5.2 参数估计理论 86
5.2.1 最大似然估计 86
5.2.2 贝叶斯估计 89
5.2.3 贝叶斯学习 90
5.3 非参数估计 92
5.3.1 密度估计 93
5.3.2 Parzen窗口估计 95
5.3.3 kN-近邻估计 101
5.3.4 后验概率的估计 103
5.3.5 修正的k近邻分类方法 104
5.3.6 最近邻法则 106
5.3.7 简化最近邻法则 109
第6章 聚类分析 110
6.1 系统聚类 110
6.1.1 两类距离 110
6.1.2 聚类算法和递推公式 113
6.1.3 利用非对称相似性矩阵的系统聚类方法 116
6.2 分解聚类 118
6.2.1 对分法 118
6.2.2 一种方式的分解算法 121
6.3 动态聚类——兼顾系统聚类和分解聚类 122
6.3.1 动态聚类的方法概要 122
6.3.2 代表点的选取方法 123
6.3.3 初始分类和调整 123
6.3.4 k次平均算法 123
6.3.5 ISODATA算法(迭代自组织数据分析算法) 126
6.4 利用图论的聚类方法 130
6.4.1 基本概念 131
6.4.2 孔茨的树聚类算法 132
6.5 满足邻接条件的聚类方法 134
6.5.1 最优分割法 134
6.5.2 二维邻接条件 136
6.5.3 满足二维邻接条件的聚类算法 137
6.5.4 满足邻接条件的其他聚类方法 139
第7章 句法结构模式识别 141
7.1 引言 141
7.2 形式语言基础 142
7.2.1 基本概念 142
7.2.2 短语结构文法 143
7.3 模式的描述方法 144
7.3.1 模式基元的选择和链描述法 145
7.3.2 染色体文法 147
7.3.3 图像描述语言(PDL) 148
7.3.4 标准形式文法 150
7.3.5 高维文法 151
7.3.6 状态转移图描述法 157
7.4 文法推断 157
7.4.1 基本定义 158
7.4.2 有限状态文法推断(正则文法的推断) 159
7.4.3 非有限状态文法的推断 164
7.5 句法分析 168
7.5.1 用句法分析作模式识别 168
7.5.2 句法分析的主要方法 169
7.5.3 杨格(Younger)法 172
7.5.4 CYK(Cocke-Younger-Kasami)剖析(列表法) 174
7.5.5 厄利(Earley)法 175
7.5.6 转移图文法 177
7.5.7 算子优先文法 179
7.6 自动机理论 182
7.6.1 有限状态自动机 182
7.6.2 下推自动机(PDA) 186
7.6.3 1型文法和线性有界自动机 191
7.6.4 0型文法和图灵机 191
7.6.5 句法引导的简单翻译自动机 193
7.7 误差校正句法分析 200
7.7.1 随机文法 200
7.7.2 句法模式相似性度量 204
7.7.3 句法模式的聚类分析 205
7.7.4 最小距离法 206
第8章 模糊模式识别 208
8.1 模糊集的基本概念 208
8.2 模糊集的简单运算与模糊关系 211
8.3 隶属函数 216
8.4 模糊识别方法 223
第9章 特征选择与降维 239
9.1 单个特征的评价 239
9.1.1 K-W检验 239
9.1.2 直方图方法 241
9.1.3 利用不确定性选择特征 242
9.1.4 用于有序样本的特征选择方法 243
9.2 主成分分析和对应分析 244
9.2.1 主成分分析 245
9.2.2 对应分析 251
9.3 考虑多类情形的线性降维映射法 254
9.3.1 几种常用线性映射及其性质 255
9.3.2 多类问题线性降维映射算法 256
9.4 非线性的降维映射方法 257
9.4.1 降维映射方法中的几个问题 258
9.4.2 迭代方法 259
9.4.3 非迭代方法 259
9.5 特征选择 261
9.5.1 最优搜索算法 262
9.5.2 次优搜索法 265
9.6 特征选择的几种新方法 267
9.6.1 模拟退火算法 267
9.6.2 Tabu搜索算法 269
9.6.3 遗传算法 270
第10章 智能模式识别 272
10.1 逻辑推理法 272
10.1.1 引言 272
10.1.2 知识表示方法 273
10.1.3 基于知识的推理 287
10.1.4 知识的获取 300
10.1.5 应用实例 304
10.2 人工神经网络 309
10.2.1 大脑神经元的构成及其机理 309
10.2.2 人工神经网络概述 312
10.2.3 BP神经网络模型 326
10.2.4 Hopfield神经网络模型 330
10.3 支持向量机 334
10.3.1 概述 334
10.3.2 统计学习理论 335
10.3.3 支持向量机 337
10.3.4 顺序最小优化算法 340
10.3.5 对SMO算法的改进 347
10.3.6 应用改进的SMO算法的手写体数字识别系统 354
10.3.7 讨论 356
10.4 智能模式识别应用举例 357
10.4.1 神经网络集成的手写体数字识别 357
10.4.2 基于BP神经网络与支持向量机的二级手写体数字识别系统 372
模式识别导论题库 381
附录 计算机上机作业用数据集 389
参考文献 394