第一篇 现代数据分析 3
第1章 不确定性分析的理论与方法 3
1.1信息熵 3
1.1.1离散信源的数学模型 3
1.1.2通信系统基本模型 4
1.1.3自信息量 4
1.1.4信息熵的概念与性质 6
1.2离散信道及其信息传递 7
1.2.1离散信道 7
1.2.2互信息量 7
1.3模糊集 10
1.3.1模糊集的概念 10
1.3.2模糊集的表示方法 11
1.3.3模糊集的代数运算 11
1.3.4模糊集与普通集 12
1.3.5模糊关系 13
1.4粗糙集 14
1.4.1粗糙集的基本概念 14
1.4.2粗糙集中的知识表示 15
1.4.3知识约简 16
1.5粒度计算 17
1.5.1粒度计算的概念 17
1.5.2粒度计算的基本成分 18
1.5.3粒度计算的基本问题 19
参考文献 21
第2章 多因素分析 22
2.1主成分分析 22
2.1.1主成分分析的概念 22
2.1.2主成分分析的数学模型 22
2.1.3主成分的导出 23
2.1.4主成分分析的计算步骤 25
2.2因子分析 27
2.2.1因子分析的概念 27
2.2.2因子分析的模型 27
2.2.3因子分析的步骤 32
2.3对应分析 33
2.3.1对应分析的原理 33
2.3.2对应分析的对应图 37
2.4典型相关分析 37
2.4.1典型相关分析的基本概念 37
2.4.2总体的典型变量与典型相关 38
2.4.3样本的典型变量与典型相关 40
2.4.4典型相关系数的显著性检验 41
参考文献 42
第3章 分类分析 43
3.1基于决策树的分类 43
3.1.1决策树的构建及ID3算法 43
3.1.2决策树的剪枝及分类规则的提取 45
3.2基于距离的分类 46
3.2.1统计距离 47
3.2.2两个总体的距离分类 48
3.2.3多个总体的距离分类 49
3.3贝叶斯分类 51
3.3.1两个总体的贝叶斯分类 51
3.3.2多个总体的贝叶斯分类 53
3.4费希尔分类 54
3.4.1费希尔分类函数 54
3.4.2费希尔分类准则 56
3.5分类准则的评价 57
3.5.1回代估计法 57
3.5.2交叉确认估计法 58
参考文献 58
第4章 聚类分析 60
4.1动态聚类 60
4.1.1动态聚类分析的思想 60
4.1.2经典的动态聚类算法分析 62
4.2层次聚类 63
4.2.1层次聚类分析的思想 63
4.2.2层次聚类的算法分析 67
4.2.3经典的层次聚类算法 68
4.3基于密度与网格的聚类 72
4.3.1基于密度的聚类 72
4.3.2基于网格的聚类 77
4.4模糊聚类 80
4.4.1数据集的划分 81
4.4.2聚类目标函数 82
4.4.3模糊c均值聚类算法 85
参考文献 87
第二篇 多元数据的矩阵模式分析 91
第5章 多元数据的矩阵模式概论 91
5.1多元数据的矩阵模式基本概念 91
5.1.1矩阵模式的定义 91
5.1.2矩阵模式的特征 94
5.2多元数据矩阵模式分析的一般框架 95
5.2.1数据预处理 95
5.2.2模式矩阵的构造 95
5.2.3模式矩阵间差异信息评判与度量 95
5.2.4模式矩阵间差异的关系分析 95
参考文献 96
第6章 差异矩阵的信息评判与度量 97
6.1差异矩阵的性质 97
6.1.1差异矩阵的构成 97
6.1.2差异矩阵的统计特征 97
6.1.3差异矩阵的信息特征 98
6.2模式矩阵间差异信息的评判 98
6.2.1多元数据的正态性检验方法及其适用性分析 98
6.2.2两模式矩阵间差异信息评判的方法与过程 100
6.2.3多元数据的信息评判模拟实验 103
6.3模式矩阵间差异信息的度量 105
6.3.1信息度量方法研究进展概述 105
6.3.2基于矩的熵估计方法 106
6.3.3基于拟合累积概率分布反函数的熵估计方法 115
6.3.4基于熵的两模式矩阵间差异信息的度量方法 118
参考文献 120
第7章 模式矩阵间差异的关系分析 123
7.1模式矩阵间差异的线性关系分析 123
7.1.1线性建模方法进展 123
7.1.2基于PLS的两模式矩阵间差异线性关系分析方法 124
7.1.3实验分析 132
7.2模式矩阵间差异的非线性关系分析 145
7.2.1非线性建模方法进展 145
7.2.2基于KPLS的两模式矩阵间差异非线性关系分析方法 146
7.2.3实验分析 152
参考文献 160
第三篇 信息模式识别 165
第8章 信息模式测度 165
8.1交互距离测度 166
8.1.1交互熵理论 166
8.1.2对称交互熵 167
8.2关联信息测度 170
8.2.1关联信息系数 170
8.2.2关联信息测度的定义 171
8.3信息距离测度 171
8.4信息系数测度 174
8.4.1离散量 175
8.4.2离散量的性质 175
8.4.3信息系数测度的定义 176
8.4.4改进信息系数测度 176
8.5模糊熵测度 178
8.5.1模糊熵公理化理论 179
8.5.2模糊绝对熵测度 180
8.5.3模糊相对熵测度 182
8.6模糊交互熵测度 183
8.6.1模糊交互熵 183
8.6.2模糊交互熵测度的定义 184
参考文献 185
第9章 信息特征压缩 187
9.1基于离差阵判据的信息特征压缩 189
9.1.1离差阵判据 189
9.1.2基于离差阵判据的信息特征压缩算法 190
9.2基于概率距离判据的信息特征压缩 192
9.2.1概率距离判据 192
9.2.2基于概率距离判据的信息特征压缩算法 194
9.3基于散度判据的信息特征压缩 197
9.3.1散度判据 197
9.3.2基于散度判据的信息特征压缩算法 198
9.4基于信息熵判据的信息特征压缩 199
9.4.1信息熵判据 199
9.4.2基于信息熵判据的信息特征压缩算法 200
9.5基于对称交互熵判据的信息特征压缩 202
9.5.1对称交互熵判据 202
9.5.2基于对称交互熵判据的信息特征压缩算法 202
9.5.3实例分析 205
9.5.4结论 207
9.6基于离散K-L变换的信息特征分析 207
9.6.1优化理论模型 207
9.6.2基于离散K-L变换的信息特征分析算法 209
9.6.3应用模型 211
9.6.4实例分析 212
9.6.5结论 213
9.7基于信息理论的主成分分析特征压缩算法 213
9.7.1主成分的几何解释 214
9.7.2一种新的基于信息理论的主成分分析特征压缩算法 215
9.7.3实例分析 216
9.7.4结论 220
9.7.5主成分分析扩展研究 220
9.8基于偏回归分析的信息特征压缩 222
9.8.1主成分回归 223
9.8.2 PLS回归的建模思想 224
9.8.3基于PLS的信息特征压缩算法 225
9.8.4实例分析 227
9.8.5结论 229
参考文献 230
第10章 信息模式识别 231
10.1信息聚类算法 231
10.1.1信息系数测度 231
10.1.2基于信息系数测度的信息聚类算法 231
10.1.3改进的信息聚类算法 232
10.1.4实例分析 234
10.1.5结论 237
10.2基于客观熵权的信息模式识别算法 237
10.2.1客观熵权的确定 238
10.2.2数据加权规范化 239
10.2.3模式评价准则的确定 240
10.2.4信息模式分类与识别 242
10.2.5实例分析 242
10.2.6结论 245
10.3数据信息的关联模式识别算法 246
10.3.1模糊相对权重的构造 246
10.3.2关联度的确定 247
10.3.3数据预处理 247
10.3.4关联模式识别算法 248
10.3.5实例分析 248
10.3.6结论 250
10.4基于偏回归分析的信息模式识别算法 250
10.4.1基于偏最小二乘的信息模式识别算法 251
10.4.2实例分析 252
10.4.3结论 254
参考文献 254
第11章 神经网络与分类 256
11.1神经网络概述 257
11.1.1 BP神经网络 257
11.1.2 RBF神经网络 258
11.1.3结论 259
11.2神经网络集成分类模型 260
11.2.1特征降维 260
11.2.2神经网络集成模型 262
11.2.3实例分析 266
11.2.4结论 267
11.3进化神经网络分类 267
11.3.1基于GA的BP神经网络 268
11.3.2基于GA的RBF神经网络 273
11.3.3结论 276
11.4粒度神经网络分类模型 276
11.4.1粒度RBF神经网络的结构 277
11.4.2粒度RBF神经网络的学习算法 277
11.4.3实例分析 280
11.4.4结论 283
参考文献 283
第12章 支持向量机与分类 286
12.1支持向量机 286
12.1.1统计学习理论 286
12.1.2支持向量机理论 287
12.2模糊支持向量机 290
12.2.1模糊支持向量机理论 291
12.2.2基于超球的双隶属度模糊支持向量机 292
12.3粒度支持向量机 296
12.3.1粒度支持向量机理论 296
12.3.2基于FCM隶属度的粒度支持向量机 297
12.3.3基于KFCM隶属度的粒度支持向量机 300
12.4孪生支持向量机 303
12.4.1孪生支持向量机理论 303
12.4.2投影孪生支持向量机 306
参考文献 312