第1章 绪论 1
1.1大数据时代 1
1.2数据、信息与知识 2
1.3探索性数据分析 3
1.4探索性数据分析与传统数据分析的差异 5
第2章 数据预处理 6
2.1数据处理的必要性 6
2.2噪声的处理 8
2.3异常点的处理 15
2.4标准化处理 19
第3章 描述性统计分析 21
3.1统计量 21
3.2统计图 24
第4章 相关性分析 37
4.1简单相关 37
4.2复相关 38
4.3典型相关分析 40
4.4偏相关分析 41
4.5相关性分析的应用 43
第5章 统计过程控制 49
5.1 SPC控制图 50
5.2多变量统计过程控制(MSPC) 58
5.3间歇式生产过程的统计控制 63
5.4 MSPC的应用 66
第6章 基于信息论的数据分析 71
6.1信息熵 72
6.2联合熵与互信息 74
6.3最大关联最小冗余 78
第7章 基于模式识别的数据分析 82
7.1模式识别的概念和方法 82
7.2特征提取方法 92
7.3模式识别应用于数据分析 100
第8章 算法介绍 128
8.1主成分分析(PCA) 128
8.2偏最小二乘(PLS) 142
8.3支持向量机(SVM) 152
第9章 DMOS软件介绍 164
9.1建模和数据分析的准备 165
9.2数据分析步骤 166
主要参考文献 186