1 关于机器学习的讨论 王珏 1
1.1 引言 1
目录 3
序 3
1.2 机器学习的发展历史 4
序言 5
前言 7
1.3 统计机器学习 9
1.3.1 泛化问题 9
1.3.2 表示问题 11
1.4 集群机器学习 12
1.4.1 弱可学习定理 13
1.4.2 经验研究问题 14
1.5 符号机器学习 15
1.5.1 经典符号机器学习原理 16
1.5.2 Reduct理论 17
1.6 流形学习 19
1.7 其他机器学习方法 21
1.8 总结与讨论 25
参考文献 27
2 统计学习理论及其在非监督学习问题中的应用 陶卿 32
2.1 引言 32
2.2.1 监督学习问题 34
2.2 监督学习问题与统计学习算法 34
2.2.2 SVM及其理论分析 35
2.2.3 统计学习算法框架 39
2.3 非监督学习问题机器统计学习算法 41
2.3.1 非监督学习问题 41
2.3.2 非监督学习问题研究的一些说明和思路 42
2.3.3 η非监督学习问题 43
2.3.4 η-one-class问题 44
2.3.5 η非监督学习问题和one-class问题 51
2.3.6 其他非监督学习问题 52
参考文献 56
2.4 结束语 56
3 聚类分析技术综述* 丁泽进 于剑 59
3.1 引言 59
3.2 聚类分析步骤 60
3.3 聚类分析中的数据类型 62
3.4 聚类模型及其算法的设计 63
3.4.1 针对连续型数据的聚类模型及算法 63
3.4.2 针对离散型数据的聚类模型及算法 68
3.4.3 针对关联型数据的聚类模型及算法 71
3.4.4 针对混合型数据的聚类模型及算法 72
3.4.5 在大型数据库中的聚类算法 72
3.4.6 其他类型的聚类模型及算法 73
3.5 聚类分析与奥卡姆剃刀准则 74
3.5.1 奥卡姆剃刀准则 74
3.4.7 小结 74
3.5.2 奥卡姆剃刀准则与聚类算法 75
3.5.3 聚类算法的历史回顾 77
3.5.4 小结 78
3.6 聚类有效性分析方法 78
3.7 聚类分析的应用前景及发展 79
参考文献 80
4 符号机器学习研究 韩素青 韩彦军 88
4.1 引言 88
4.2 表示问题 91
4.2.1 数据预处理问题 91
4.2.2 描述数据的表示语言 93
4.3 规则学习 94
4.3.1 覆盖算法 94
4.3.2 分治算法 100
4.3.3 ILP 101
4.4 约简理论 104
4.5 面向用户需求的符号机器学习——符号数据分析 107
4.6 结束语 109
参考文献 110
5 强化学习研究进展 高阳 116
5.1 引言 116
5.2 强化学习基础 117
5.3 部分感知马氏决策过程中的强化学习 122
5.4 强化学习中的函数估计 125
5.5 分层强化学习 126
5.6 多agent强化学习 128
5.7 结束语 132
参考文献 133
6 流形学习若干问题研究* 张军平 135
6.1 流形学习研究动机 135
6.1.1 计算机视觉与感知 136
6.1.2 应用驱动 136
6.2 流形学习综述 137
6.3 流形学习若干问题研究 139
6.3.1 流形学习基本问题的研究 139
6.3.2 内在维数研究 145
6.3.3 定量化研究(数据的定量化分析) 149
6.3.4 监督学习算法研究 152
6.3.5 范畴问题研究 157
6.3.6 其他 161
6.4 讨论与结论 164
参考文献 165
7 选择性集成 周志华 170
7.1 引言 170
7.2 理论基础 173
7.2.1 回归任务 173
7.2.2 分类任务 175
7.3 GASEN算法 176
7.3.1 算法介绍 177
7.3.2 分析和讨论 178
7.4 一个应用:选择性多本征空间集成 180
7.4.1 本征脸和本征特征 180
7.4.2 SEME算法 181
7.4.3 分析和讨论 182
7.5 选择性集成的一般意义 184
7.6 结束语 185
参考文献 186
8 A Theoretical Study on the Computation Time of Evolutionary Algorithms Jun HE and Xin YAO 189
8.1 Introduction 189
8.2 Mathematical Models 190
8.2.1 Description of Evolutionary Algorithms 190
8.2.2 Model 1:Markov Chain 191
8.2.3 Model 2:Supermartingale 192
8.3 Analyzing Tools 193
8.3.1 First Hitting Time of Evolutionary Algorithms 193
8.3.2 Tool 1:Analytic Approach 194
8.3.3 Tool 2:Drift Analysis 197
8.4 Applications of Analytic Approach 198
8.4.1 Case Study 1:Population Can Bring Benefit 198
8.4.2 Case Study 2:Population May Not Be Beneficial 203
8.4.3 Analysis of(1+1)EAs with Elitist Selection 208
8.4.4 Analysis of Population-based Evolutionary Algorithms 210
8.5 Applications of Drift Analysis 212
8.5.1 Case Study 1:The Subset Sum Problem 212
8.5.2 Case Study 2:Analysis of an(n+n)EA for the ONE-MAX Problem 217
8.5.3 A Classification of Fitness Landscapes 219
8.6 Conclusions and Future Works 221
References 222
9 文本数据挖掘 李航 225
9.1 什么是文本数据挖掘 225
9.2 文本数据挖掘的基本技术 226
9.2.1 文本信息抽取 226
9.2.2 文本分类 228
9.2.3 文本聚类 230
9.2.4 文本数据压缩 231
9.2.5 文本数据处理 232
参考文献 234
9.3 技术发展趋势 234
10 On Conceptual Modeling of Data Mining Yiyu YAO 238
10.1 Introduction 238
10.2 Conceptual Modeling 240
10.2.1 A Brief Summary of Data Mining Research 240
10.2.2 Motivations for Conceptual Modeling 242
10.2.3 Foundations of Data Mining 243
10.2.4 Implications 244
10.3 Data Mining and Scientific Research 245
10.3.1 Common Purposes and Goals 245
10.3.2 Common Processes 246
10.3.3 Implications 247
10.4.1 Multi-level Understanding of Information Processing Systems 248
10.4 Multi-level Modeling of Data Mining 248
10.4.2 A Three-layeredFramework of Data Mining 250
10.4.3 Implications 251
10.5 Concluding Remarks 252
References 253
11 模式分类:统计方法和人工神经网络方法 李伯宇 王晨 周昌印 杜浩 陈雁秋 256
11.1 引言 256
11.1.1 什么是模式分类 256
11.1.2 分类正确率 257
11.1.3 分类实例 258
11.2.1 贝叶斯决策理论 259
11.2 统计分类方法 259
11.1.4 分类方法的研究 259
11.2.2 一致性准则与分类器性能评估 261
11.3 最近邻分类 262
11.3.1 距离度量 263
11.3.2 错误估计 263
11.3.3 样本处理 264
11.4 人工神经网络分类器 265
11.4.1 多层前馈神经网络与BP算法 265
11.4.2 生成收缩算法 266
11.5 讨论和展望 268
参考文献 268
12.1 人脸识别基础 270
12 人脸识别中子空间的统计学习 李子清 张军平 270
12.2 线性子空间 273
12.2.1 PCA子空间 274
12.2.2 基于独立分量分析的子空间方法 276
12.2.3 非负矩阵分解(NMF) 282
12.2.4 混合线性子空间模型 287
12.3 非线性子空间 288
12.3.1 等度规映射算法 292
12.3.2 局部线性嵌套算法 295
12.4 结论 297
参考文献 298
13.1 视频信息分析技术的发展趋势 302
13 基于内容的视频信号分析与处理 路红 薛向阳 Yap-Peng TAN 302
13.2 视频信号的结构化分析 304
13.2.1 镜头分割 304
13.2.2 场景聚类和分割 306
13.2.3 结构化视频简介 307
13.2.4 结构化视频的分析与建模 307
13.2.5 电视节目的分割 313
13.2.6 视频的摘要和概述 313
13.3 基于内容的视频检索 316
13.4 视频信息检索技术的应用——数字电视节目检索与过滤系统 316
13.4.1 内容检索系统 317
13.4.2 实时过滤系统 318
参考文献 320