第1章 化学计量学引论 1
1.1 化学量测——决策之基础 1
1.2 化学量测——三支点平台 1
1.3 化学计量学 2
1.4 如何使用本书 2
1.4.1 软件应用 4
1.5 化学计量学方面的一般性读物 4
参考文献 5
第2章 数据的统计学估计 6
引论 6
2.1 误差源 7
2.2 精密度和准确度 10
2.3 正态分布的性质 12
2.4 显著性检验 15
2.4.1 F-检验法——两个方差的比较(精密度) 16
2.4.2 t-检验法 18
2.4.3 单尾检验和双尾检验 19
2.4.4 样品均值和确定值的比较 20
2.4.5 两样品均值的比较 21
2.4.6 使用不同测试对象或测试样品的两种方法的比较 22
2.5 方差分析 23
2.5.1 ANOVA用于检测平均值的差异 23
2.5.2 批内样品方差(批内处理方差) 24
2.5.3 批间样品方差(批间处理方差) 25
2.5.4 残差分析 25
2.6 异常值 28
2.7 集中趋势和分散性的稳健性估计 31
2.8 软件 32
参考文献 35
第3章 采样理论、分布函数和多元正态分布 36
3.1 采样及采样分布 36
3.1.1 正态分布 37
3.1.2 标准正态分布 38
3.2 中心极限定理 39
3.2.1 中心极限定理的实质 39
3.3 小样本的分布 39
3.3.1 t-分布 39
3.3.2 x2-分布 41
3.4 一元假设检验 42
3.4.1 均值的统计推断 42
3.4.2 方差的统计推断和F-分布 43
3.5 多元正态分布 44
3.5.1 广义或马氏距离 45
3.5.2 方差-协方差矩阵 45
3.5.3 使用小样本对总体参量的估计 46
3.5.4 关于假设的注解 47
3.5.5 广义样本方差 47
3.5.6 所选双变量分布的图示 47
3.5.7 x2-分布 49
3.6 比较多元均值的假设检验 50
3.7 例子:多元距离 51
3.7.1 第一步:smx mat数据文件的图示 52
3.7.2 第二步:变量(波长)的选择 52
3.7.3 第三步:变量的直方图 53
3.7.4 第四步:计算训练集的均值和方差-协方差矩阵 54
3.7.5 第五步:计算马氏距离和概率密度 55
3.7.6 第六步:寻找“可接受”和“不可接受”的对象 56
参考文献 58
第4章 主成分分析 59
4.1 引论 59
4.2 光谱-色谱数据 59
4.2.1 基向量 60
4.3 主成分模型 62
4.3.1 特征向量与特征值 63
4.3.2 奇异值分解 64
4.3.3 主成分模型的其他表达 65
4.4 预处理方法 65
4.4.1 均值中心化 65
4.4.2 方差尺度化 66
4.4.3 基线校准 67
4.4.4 平滑与滤波 68
4.4.5 一阶导数与二阶导数 69
4.4.6 标准化 70
4.4.7 多元散射校正与标准正态变量变换 70
4.5 PCA对数据的解析过程 73
4.6 影响因素 76
4.6.1 方差与残余方差 76
4.6.2 特征值中的误差分布 79
4.6.3 F-检验法确定因子数 80
4.7 基矢量 81
4.7.1 用PCA得分图进行聚类和分类 83
4.8 残余光谱 83
4.8.1 残余方差分析 85
4.9 结论 87
参考文献 87
第5章 校正 89
5.1 数据集 89
5.1.1 近红外光谱 89
5.1.2 振动的基本模式、倍频及和频 90
5.1.3 水-甲醇混合物 90
5.1.4 溶剂相互作用 91
5.2 校正引论 91
5.2.1 一元校正 91
5.2.2 非零截距 92
5.2.3 多元校正 93
5.2.4 曲线校正 94
5.2.5 校正样本和验证样本的选择 95
5.2.6 量测误差和预测误差的测定 96
5.3 校正应用实例 97
5.3.1 水-甲醇混合体系近红外数据的图形化研究 97
5.3.2 一元校正 99
5.3.3 多元校正 103
5.4 最小二乘校正模型的统计学估计 104
5.4.1 假设检验 104
5.4.2 最小二乘解中方差的组成 105
5.4.3 解释回归ANOVA表 105
5.4.4 回归系数的置信区间和假设检验 106
5.4.5 预测值的置信区间 107
5.4.6 杠杆力臂和影响力 108
5.4.7 模型偏离和异常值 108
5.4.8 测定系数和多元相关系数 109
5.4.9 灵敏度和检测限 110
5.4.10 干扰效应和灵敏度 113
5.5 变量选择 113
5.5.1 前向选择 114
5.5.2 Efroymson逐步回归算法 114
5.5.3 后向删减 115
5.5.4 连续替换算法 115
5.5.5 所有可能的子集 116
5.5.6 模拟退火算法和遗传算法 116
5.5.7 建议和警惕 116
5.6 校正的有偏方法 117
5.6.1 主成分回归 117
5.6.2 偏最小二乘 125
5.6.3 一些其他校正方法 126
5.6.4 正则化 127
5.6.5 例示正则化结果 128
5.7 标准加入方法 129
5.7.1 一元标准加入方法 130
5.7.2 多元标准加入方法 131
5.8 内标 131
5.9 预处理技术 132
5.10 校正标准化 132
5.10.1 预测值的标准化 133
5.10.2 仪器响应的标准化 133
5.10.3 使用预处理技术进行标准化 134
5.11 软件 134
参考文献 135
第6章 稳健校正 141
6.1 引论 141
6.2 位置与范围估计 142
6.2.1 均值与标准偏差 142
6.2.2 中位数与中位绝对偏差 143
6.2.3 位置与范围的其他稳健估计量 144
6.3 低维位置与协方差估计 145
6.3.1 经验均值与协方差矩阵 145
6.3.2 稳健极小化协方差行列式估计 146
6.3.3 位置和协方差的其他稳健估计 148
6.4 低维线性回归 148
6.4.1 单响应变量线性回归 148
6.4.2 多响应变量线性回归 154
6.5 主成分分析 156
6.5.1 经典主成分分析 156
6.5.2 基于稳健协方差估计的稳健PCA 158
6.5.3 基于投影追踪的稳健PCA 158
6.5.4 基于投影追踪和MCD的稳健PCA 159
6.5.5 异常值图 160
6.5.6 选取主成分数 162
6.5.7 实例 163
6.6 主成分回归 164
6.6.1 经典主成分回归 164
6.6.2 稳健PCR 166
6.6.3 模型校正和验证 166
6.6.4 实例 167
6.7 偏最小二乘回归 171
6.7.1 经典偏最小二乘回归 171
6.7.2 稳健PLSR 171
6.7.3 实例 173
6.8 分类 175
6.8.1 低维分类 175
6.8.2 高维分类 177
6.9 可用软件 179
参考文献 179
第7章 利用非线性回归进行多元量测动力学过程建模 184
7.1 引论 184
7.2 多元数据,比尔-朗伯定律,矩阵符号 185
7.3 浓度轮廓的计算:第Ⅰ类情况,简单机理 186
7.4 基于模型的非线性拟合 188
7.4.1 直接方法,单纯形算法 191
7.4.2 使用Excel的Solver工具进行非线性拟合 192
7.4.3 线性和非线性参数 193
7.4.4 牛顿-高斯-莱温伯格/马奎特方法 195
7.4.5 非白色噪声 202
7.5 浓度轮廓的计算:第Ⅱ类情况,复杂机理 206
7.5.1 Excel中的四阶龙格-库塔方法 207
7.5.2 有趣的动力学例子 209
7.6 浓度轮廓的计算:第Ⅲ类情况,非常复杂的机理 216
7.7 相关问题 218
7.7.1 检测技术 218
7.7.2 模型分析器 219
7.7.3 连续反应器 219
7.7.4 分析的全局化 219
7.7.5 软建模方法 220
7.7.6 其他方法 220
参考文献 221
第8章 响应面建模和实验设计 224
8.1 引论 224
8.2 响应面建模 224
8.2.1 响应面建模的一般策略 224
8.2.2 因子空间 227
8.2.3 一些与回归分析有关的术语 243
8.3 一次一个变量与优化设计 245
8.3.1 二元(多元)实例 245
8.3.2 一次一个变量的方法的优点 246
8.3.3 一次一个变量的方法的缺点 246
8.4 对称优化设计 246
8.4.1 两水平完全因子设计 246
8.4.2 三水平或更多水平的完全因子设计 248
8.4.3 中心组合设计 249
8.5 田口实验设计方法 251
8.6 非对称优化设计 254
8.6.1 优化准则 254
8.6.2 最优化与等距设计 254
8.6.3 设计最优性和设计效率评判标准 257
8.7 用于搜索可行最优实验设计的方法 261
8.7.1 精确D最优设计 261
8.7.2 序贯D最优设计 263
8.7.3 序贯组合D最优设计 266
8.8 现有可用的软件和实验设计表 269
8.8.1 现有可用的软件 269
8.8.2 实验设计表 272
8.9 实例:实验设计在多元校正中的应用 274
8.9.1 校正样本集的构建 274
8.9.2 从历史数据改善质量 282
8.10 结论 288
参考文献 289
第9章 分类和模式识别 291
9.1 引论 291
9.2 数据预处理 292
9.3 绘图和显示 293
9.4 聚类 298
9.5 分类 301
9.5.1 k-最近邻 301
9.5.2 偏最小二乘 302
9.5.3 SIMCA 303
9.6 实际考虑 304
9.7 模式识别技术的应用 305
9.7.1 考古学的赝品 305
9.7.2 燃料泄漏识别 306
9.7.3 分类回收利用的塑料 315
9.7.4 基于化学组成的生物分类学 320
参考文献 322
第10章 信号处理和数字滤波 326
10.1 引论 326
10.2 噪声去除和先验信息的问题 327
10.2.1 信号估计和信号检测 327
10.3 在新坐标上重新表示数据用以分析结构 328
10.3.1 基于投影的信号分析用于信号处理 329
10.4 频域的信号处理 331
10.4.1 傅里叶变换 331
10.4.2 采样定理与混淆 332
10.4.3 有限带宽和离散傅里叶变换 334
10.4.4 傅里叶变换的性质 336
10.5 频域平滑 339
10.5.1 平滑 339
10.5.2 使用设计者转换函数的平滑 340
10.6 时域滤波和平滑 343
10.6.1 平滑 343
10.6.2 滤波 345
10.6.3 多项式移动平均值滤波器(Savitsky-Golay) 348
10.7 基于小波变换的信号处理 350
10.7.1 小波函数 351
10.7.2 小波函数在时间和频率上的局部化 353
10.7.3 离散小波变换 353
10.7.4 使用小波的平滑和去噪 355
参考文献 358
第11章 多元曲线分辨 361
11.1 引论:总体概念,不唯一性,分辨理论 361
11.2 历史背景 364
11.3 局部秩和分辨:渐进因子分析及其相关技术 365
11.4 非迭代分辨方法 368
11.4.1 窗口因子分析 369
11.4.2 其他技术:子窗口因子分析和直观推导式演进特征投影 371
11.5 迭代分辨方法 372
11.5.1 初始估计的产生 373
11.5.2 约束,定义,分类:基于化学或数学性质的等性约束和不等性约束 373
11.5.3 迭代目标转换因子分析 377
11.5.4 多元曲线分辨-交替最小二乘 378
11.6 自模式曲线分辨到多维数据的延伸:用MCR-ALS方法对多个相关数据矩阵进行同时分析 379
11.7 分辨结果的不确定度、可行解的范围和分辨误差 385
11.8 应用 386
11.8.1 生物化学过程 387
11.8.2 环境数据 391
11.8.3 光谱成像 398
11.9 软件 402
参考文献 403
第12章 联用数据的三维校正 410
12.1 引论 410
12.2 背景知识 410
12.3 三维数据术语 412
12.4 三维模型 412
12.5 例子 414
12.6 秩消失方法 415
12.6.1 秩消失因子分析 416
12.6.2 广义秩消失方法 417
12.6.3 直接三线性分解 421
12.7 交替最小二乘方法 423
12.7.1 PARAFAC/CANDECOMP 424
12.8 三维校正的拓展 427
12.9 品质因子 428
12.10 注意事项 429
参考文献 431
第13章 化学计量学展望 441
13.1 化学计量学的发展简史 441
13.1.1 化学计量学——一门趋于成熟的学科 442
13.2 化学计量学的回顾与展望 443
13.2.1 过程分析化学 443
13.2.2 光谱学 443
13.2.3 食品和饲料化学 444
13.2.4 其他有趣的应用领域 444
13.3 化学计量学的发展动力 444
13.3.1 海量数据的挑战 445
13.3.2 化学计量学在化学和生物学交叉中的应用 445
13.4 结语 447
参考文献 447
索引 452