第1章 误差及数理统计基础 1
1.1统计学中的几个基本概念 1
1.1.1随机变量 1
1.1.2总体与样本 1
1.1.3统计量 2
1.2误差 5
1.2.1误差的定义和表示 5
1.2.2误差的分类 6
1.2.3误差的传递 8
1.2.4精密度和准确度 11
1.3参数估计 12
1.3.1定义 12
1.3.2估计量的判别标准 12
1.4假设检验 13
1.4.1假设检验的分类和概念 13
1.4.2两种错误 13
1.4.3假设检验的步骤 14
1.5随机误差的分布及置信区间 14
1.5.1正态分布 14
1.5.2置信区间 16
1.5.3置信区间的其他应用 17
1.6显著性检验 18
1.6.1显著性水平 18
1.6.2 t检验 18
1.6.3 F检验 19
1.7可疑值的剔除 20
1.7.1格鲁布斯法 20
1.7.2狄克松法 20
参考文献 21
第2章 常见的数据预处理和平滑方法 22
2.1数据归一化/标准化和变换方法 22
2.1.1数据归一化/标准化方法 22
2.1.2数据的变换方法 24
2.2数据降维方法 24
2.3异常数据检测方法和空缺值处理方法 26
2.3.1异常数据检测方法 26
2.3.2空缺值处理方法 27
2.4噪声数据处理方法 29
2.4.1窗口移动平均法 30
2.4.2窗口移动多项式最小二乘平滑法 32
2.4.3稳健中位数平滑法 40
2.4.4傅里叶变换平滑 40
2.4.5小波变换平滑 41
2.5其他常见数据预处理的方法 42
参考文献 42
第3章 线性回归分析 44
3.1一元线性回归 44
3.1.1模型的建立与正态分布假设 45
3.1.2参数的最小二乘估计 45
3.1.3一元回归方程的求法 46
3.1.4斜率β1和截距β0的区间估计 47
3.1.5回归方程的显著性检验 48
3.1.6相关系数和相关系数的假设检验 49
3.1.7方差分配 51
3.1.8标准加入法 52
3.2多元线性回归 54
3.2.1模型建立与正态分布假设 55
3.2.2参数的最小二乘估计 55
3.2.3多元线性回归方程的求法 56
3.2.4多元回归方程的方差分析和显著性检验 60
3.2.5回归分析中的复共线性 62
3.3最小二乘法线性回归 64
3.4逐步回归 66
3.4.1逐步回归的基本原理 66
3.4.2逐步回归的具体步骤 67
3.4.3容许值和容许值水平界限 69
参考文献 69
第4章 主成分分析 71
4.1概述 71
4.2基本原理 72
4.2.1主成分分析的基本原理 72
4.2.2主成分分析的数学模型 72
4.2.3主成分的几何意义 73
4.3主成分的性质 74
4.4主成分的推导 76
4.5主成分分析的相关计算 77
4.5.1主成分的方差贡献率 77
4.5.2原始变量被主成分的提取率 78
4.5.3主成分载荷的计算 78
4.5.4矩阵XT X特征值的算法 79
4.5.5基于主成分分析的体系组分数确定方法 80
4.6主成分分析的步骤 80
4.6.1样本数据标准化 80
4.6.2计算相关系数矩阵 81
4.6.3求R的特征值和特征向量 82
4.6.4重要主成分的选择 82
4.6.5主成分得分 82
4.7主成分回归 82
4.8主成分分析的主要应用 83
4.8.1投影显示法 83
4.8.2主成分分析在多指标综合评价中的应用 83
4.8.3主成分分析在系统评价中的应用 84
参考文献 84
第5章 因子分析 86
5.1因子分析的基本原理 87
5.2主因子分析 92
5.2.1基本原理 92
5.2.2因子数的确定 94
5.2.3方差最大正交因子旋转 96
5.2.4因子得分 98
5.3雅可比算法 100
5.4目标转换因子分析 104
5.5迭代目标转换因子分析法 105
5.6渐进因子分析 107
5.6.1基本原理 108
5.6.2固定尺寸移动窗口渐进因子分析法 111
5.7因子分析在多组分同时测定中的应用 112
5.8数据例解 114
参考文献 119
第6章 偏最小二乘法 122
6.1偏最小二乘原理 122
6.2偏最小二乘算法 123
6.2.1处理单目标变量问题的偏最小二乘算法 125
6.2.2处理样本少变量多问题的偏最小二乘算法 126
6.2.3偏最小二乘的简单迭代算法 127
6.2.4偏最小二乘算法中矢量的性质 130
6.3偏最小二乘法的交叉有效性 130
6.4非线性偏最小二乘 130
6.5应用实例 131
参考文献 137
第7章 小波变换分析技术 138
7.1小波分析简介 138
7.2小波分析理论 141
7.2.1小波的定义 141
7.2.2小波的多分辨分析 142
7.2.3连续小波变换 143
7.2.4离散小波变换及逆变换 144
7.2.5小波函数 144
7.2.6小波包 147
7.3重叠分析信号的小波分析方法 151
7.4小波变换的频率分析方法 163
7.5小波主成分分析 169
7.5.1主成分分析 169
7.5.2小波主成分分析 169
7.5.3小波主成分分析的应用 169
7.6小波神经网络及其在化学信号分析中的应用 171
7.6.1小波和神经网络的结合 171
7.6.2小波神经网络在化学中的应用 173
7.7二维小波分析 175
7.7.1二维小波变换 175
7.7.2 Matlab中二维小波变换 176
7.8小波分析的其他应用 180
7.8.1小波分析在分子生物信息学中的应用 180
7.8.2样条小波分析在电分析信号中的应用 182
7.8.3 Daubechies正交小波在处理分析化学信号中的应用 184
7.8.4小波包分析在化学信号分析中的应用 186
参考文献 188
第8章 化学模式识别 191
8.1概述 191
8.1.1几个概念 191
8.1.2模式空间的相似系数与距离 192
8.1.3模式识别中的分类问题 193
8.1.4模式识别中方法的分类 193
8.1.5计算机模式识别方法 193
8.1.6模式识别的计算步骤 194
8.2特征抽取方法 194
8.2.1特征抽取方法 194
8.2.2特征选择中应注意的问题 196
8.2.3化学模式识别中的特征变量 196
8.3有监督的模式识别方法:判别分析法 196
8.3.1距离判别法 196
8.3.2 Fisher判别分析法 197
8.3.3 Bayes判别分析法 198
8.3.4线性学习机 200
8.3.5 K-最近邻法 200
8.3.6 ALKNN 201
8.4无监督的模式识别方法:聚类分析法 202
8.4.1聚类分析的基本原理 202
8.4.2聚类过程 203
8.4.3聚类分析算法分类 204
8.5基于特征投影的降维显示方法 210
8.5.1基于主成分分析的投影显示法 210
8.5.2基于主成分分析的SIMCA分类法 214
8.5.3基于偏最小二乘的降维方法 215
8.5.4非线性投影方法 215
参考文献 216
第9章 遗传算法 218
9.1遗传算法简介 218
9.2遗传算法的特点 219
9.3遗传算法的流程 220
9.3.1编码 220
9.3.2初始种群的建立 222
9.3.3适应度函数的设计 223
9.3.4遗传操作设计 225
9.3.5控制参数的设定 225
9.4遗传操作设计 225
9.4.1复制 225
9.4.2交换 228
9.4.3变异 229
9.5遗传算法的终止条件 231
9.6遗传算法的应用 232
9.6.1遗传算法在变量筛选中的应用 232
9.6.2遗传算法在函数优化上的应用 232
9.6.3遗传算法在组合优化中的应用 232
9.6.4遗传算法在机器学习和人工生命中的应用 233
9.6.5遗传算法在图像处理和模式识别中的应用 233
9.6.6遗传算法在生产调度问题中的应用 233
参考文献 233
第10章 人工神经网络法及其在化学中的应用 236
10.1引言 236
10.2模式神经元网络的算法改进 237
10.2.1记忆-遗忘曲线及其原理 238
10.2.2改进后的人工神经网络 238
10.2.3人工神经网络的改进之处 239
10.3反向传输人工神经网络算法 240
10.3.1方法原理 240
10.3.2 BFGS算法 242
10.3.3数据预处理及网络结点数 243
10.3.4测试集的监控和最优模型的选择 243
10.3.5 BP神经网络结构 245
10.3.6精确值计算和模式识别 245
10.3.7人工神经网络的过拟合和过训练问题 245
10.4 Kohonen自组织特征映射模型 246
10.5 Hopfield神经网络 246
10.6人工神经网络的应用 247
10.6.1对多组分的测定 247
10.6.2在纺织中应用 251
10.6.3药效预测 252
10.6.4在其他方面的应用 252
参考文献 252
第11章 支持向量机 255
11.1支持向量机概述 255
11.1.1 VC维理论及推广性 255
11.1.2结构风险最小化原理 256
11.1.3支持向量机的基本原理 256
11.1.4支持向量机的学习算法 258
11.1.5支持向量机的优点 259
11.1.6支持向量机的一般步骤 259
11.2支持向量分类算法 259
11.2.1两类被分类问题 260
11.2.2多类别分类方法 261
11.2.3最大间隔分类器 262
11.2.4软间隔优化 265
11.3支持向量回归 269
11.3.1支持向量回归的基本理论 270
11.3.2ε不敏感损失回归 272
11.3.3核岭回归 277
11.3.4高斯过程 278
11.4支持向量机的应用 280
11.4.1文本分类 280
11.4.2信息检索 281
11.4.3图像识别 281
11.4.4在医学上的应用 285
11.4.5手写数字识别 285
参考文献 286
第12章定量构效活性关系 288
12.1 QSPR/QSAR的研究进展 289
12.1.1局部QSPR/QSAR模型 289
12.1.2反向QSPR/QSAR 290
12.1.3高维(High-dimensional) QSAR模型 290
12.2分子描述符的计算 291
12.3描述符的选择 293
12.3.1遗传算法(GA) 293
12.3.2逐步回归法 294
12.3.3启发式方法(HM) 294
12.3.4主成分分析(PCA) 295
12.3.5变量最优子集回归法(LBR) 295
12.3.6模拟退火算法(SAA) 295
12.4建模方法 296
12.4.1 2D-QSAR建模方法 296
12.4.2 3D-QSAR建模方法 298
12.5模型验证 299
12.6 QSPR/QSAR的应用 304
12.6.1 QSPR/QSAR在色谱分析中的应用研究 304
12.6.2 QSPR/QSAR在毛细管电泳分析中的应用研究 304
12.6.3在环境化学中的应用 305
12.6.4生物制药方面的应用 306
12.6.5在食品化学中的应用 306
12.6.6结论与展望 306
参考文献 307
附录1化学计量学中常见的矩阵基本知识 311
附录2化学计量学中常见的取值表 314