第一章 化学、化工的复杂数据处理 1
1.1 化学、化工中的几个共性课题 1
《计算机化学化工丛书》序 3
1.2 复杂数据处理的困难和对策 4
1.2.1 复杂数据处理的困难 4
前言 5
1.2.2 复杂数据处理的对策 8
1.3 化学、化工复杂数据处理的意义和价值 11
1.3.1 复杂数据处理是化学科学的一个薄弱环节 11
1.3.2 复杂数据信息采掘是改进化工生产的捷径 12
1.3.3 处理复杂数据必须综合应用多种计算方法 13
1.4 复杂数据信息采掘的信息处理流程 20
参考文献 22
第二章 复杂数据信息采掘的主要方法之一--模式识别 23
2.1 模式识别方法的原理和基本概念 23
2.2 数据文件的标准化 25
2.3 主成分分析及其衍生方法 25
2.3.1 主成分分析的原理及KL变换 25
2.3.2 主成分的特性 28
2.3.3 主成分的贡献率 29
2.3.4 主成分算法步骤 30
2.3.5 限值响应问题 31
2.4 白化变换--线性投影法(LMAP) 31
2.4.1 LMAP的原理 31
2.4.2 算法步骤 33
2.5.1 ODP的原理 35
2.5 最优判别平面方法 35
2.5.2 讨论 39
2.5.3 ODP算法步骤 40
2.6 偏最小二乘法 41
2.6.1 主成分的NIPALS算法 42
2.6.2 PLS算法步骤和原理 46
2.6.3 PLS的若干性质 48
2.6.4 PLS预报步骤 50
2.6.5 PLS成分数目的确定 50
2.7 非线性映照 52
2.7.1 线性映照的局限性 52
2.7.2 NLM原理 53
2.7.3 PCA-NLM、LMAP-NLM和PLS-NLM 54
2.7.4 NLM的计算步骤 55
2.8 相似分析法 56
2.8.1 SIMCA的基本原理 56
2.8.2 SIMCA信息分析 58
2.8.3 SIMCA计算步骤 59
2.9 KNN法及其衍生方法 60
2.10 聚类分析方法 62
2.10.1 分级聚类方法 63
2.10.2 最小生成树法 64
2.10.3 最短生成路径法 65
2.10.4 判别聚类的势函数法 66
2.11 模式识别的逆映照方法 67
2.11.1 线性逆映照(LIM) 68
参考文献 69
2.11.2 非线性逆映照(NLIM) 69
第三章 复杂数据信息采掘的主要方法之二--人工神经网络 71
3.1 人工神经网络模型 71
3.1.1 人工神经网络的节点 71
3.1.2 人工神经网络的拓扑结构 74
3.1.3 人工神经网络的运行 76
3.1.4 人工神经网络的性质和特点 76
3.1.5 人工神经网络的学习与训练 78
3.2 误差逆传播神经网络 80
3.2.1 误差逆传播(BP)学习算法的提出 80
3.2.2 BP网络结构与学习规则 80
3.2.3 BP算法学习规则的数学推导 84
3.2.4 BP网络的简单评价 88
3.3.1 传统BP算法主要缺点及改进 89
3.3 多层前馈网络的SABP算法 89
3.3.2 模拟退火算法 90
3.3.3 三层前馈网络SABP算法原理 94
3.4 自组织映射神经网络 97
3.4.1 自组织特征映射 97
3.4.2 算法设计 99
3.5 人工神经网络结果的二维图象显示 100
参考文献 101
第四章 复杂数据信息采掘的主要方法之三--遗传算法 103
4.1 演化算法 103
4.1.1 概述 103
4.1.2 自组织、自适应和自学习性(智能性) 105
4.1.3 本质并行性 105
4.2.1 基本概念 106
4.2 遗传算法概述 106
4.2.2 模式定理 107
4.3 遗传算法设计 110
4.3.1 遗传算法的基本结构 110
4.3.2 设计遗传算法的基本步骤 111
4.3.3 编码方案 112
4.3.4 适应度 116
4.3.5 选择策略 118
4.3.6 遗传算子的设计 122
参考文献 126
第五章 数据文件的建立、评估和数据类型考查 128
5.1 数据文件的格式要求 128
5.1.1 格式和要求 128
5.1.2 多目标问题 129
5.1.3 预加工 130
5.2 数据文件的评估原理 131
5.2.1 超多面体判据 132
5.2.2 KNN留一法判据 133
5.2.3 回归法判据 134
5.3 数据评估的做法和标准 135
5.3.1 超多面体判据 135
5.3.2 KNN留一法的判据 135
5.3.3 回归法的判据 136
5.4 数据结构的初步分析 136
5.4.1 近邻分析(nearest neighbor analysis) 136
5.4.2 拓扑分析(topological type analysis) 136
5.4.3 近线性分析(near-linearity analysis) 139
5.4.4 时间序列分析(time series analysis) 140
5.4.5 Fisher指数分析(fisher index analysis) 141
参考文献 142
第六章 数据的相关分析方法 143
6.1 相关分析的价值和局限性 143
6.2 单因子相关分析和t-f图 145
6.3 双因子分析和f-f图 154
6.4 三因子分析及三维图的显示 157
6.5 数据变换与相关分析相结合的算法 158
6.6 f-f图的分级投影方法 160
参考文献 161
第七章 数据文件的样本筛选 162
7.1 数据文件可分性不好的三个原因 162
7.2 子空间局部考查 163
7.3 添加自变量影响的考查 166
7.4 离群点的删除 168
参考文献 172
第八章 数据文件的自变量筛选 172
8.1 自变量筛选的意义 173
8.2 自变量筛选的多义性 175
8.3 相关分析的应用和局限性 176
8.4 有关变量的共线性检查 178
8.5 近线性数据文件的自变量筛选 178
8.6 偏置型数据集的自变量筛选 180
8.7 包容型数据集的自变量筛选 185
8.8 子空间局部考查与自变量筛选 186
8.9 自变量筛选必须结合专业知识进行 187
参考文献 189
第九章 数据文件的实用建模 190
9.1 实用建模的要求和目标 190
9.2 分类判别问题的超多面体模型 192
9.3 最佳投影-自动矩形-分级投影方法 196
9.4 增补测试样本的算法及应用 196
9.5 实用建模中外推的方法 200
9.6 实用建模中的回归方法 202
9.7 人工神经网络的实用建模 203
9.8 模式识别与人工神经网络相结合的方法 205
9.9 限值响应问题的实用建模 206
9.10 多目标优化模型的建立 210
参考文献 211
第十章 原子参数和分子参数 212
10.1 原子和分子参数选择的原理 212
10.2 原子的价电子数(z) 212
10.3 原子的电离势(I) 213
10.4 原子半径和离子半径(R) 213
10.5 电负性 220
10.6 分子的拓扑参数和原子集团参数 224
10.7 离子键化合物及物系的物性表征参数 226
10.8 金属键化合物及物系的物性表征参数 228
10.9 共价化合物及物系的物性表征参数 230
参考文献 230
11.2 若干热力学性质的计算机预报 231
11.2.1 化合物熔点的计算机预报 231
11.1 原子-分子参数-数据信息采掘方法 231
第十一章 数据信息采掘在物性预报中的应用 231
11.2.2 化合物包晶分解温度的计算机预报 233
11.2.3 液态合金混合熵的计算机预报 236
11.3 若干物理性质的计算机预报 237
参考文献 238
第十二章 数据信息采掘在相图计算中的应用 239
12.1 相图计算的意义和相图计算的原子参数-模式识别方法 239
12.2 原子参数-模式识别方法概述 240
12.3 二元合金相图中间相的形成规律 242
12.4 原子参数与三元合金相形成的关系--取代对的概念 243
12.5 非过渡金属间三元化合物的形成规律 244
12.6 过渡金属间三元化合物的形成规律 246
12.7 过渡金属和非过渡金属间三元化合物的形成规律 247
12.8 氧化物系相图中的中间化合物的形成规律 248
12.9 二元液态合金的相互作用系数和液相分层的计算机预报 249
12.10 相图中间相熔化类型的判别 250
12.11 三元相图液相面的计算机预报 250
参考文献 253
第十三章 数据信息采掘在新材料、新产品研制中的应用 254
13.1 材料设计和分子设计的意义 254
13.2 材料设计专家系统 255
13.3 材料设计专家系统用于已有数据的加工 256
13.4 材料设计专家系统辅助实验探索 258
13.5 材料设计辅助材料智能加工 263
参考文献 264
14.1 化工过程复杂反应体系的量纲分析 266
第十四章 数据信息采掘在化工生产优化中的应用 266
14.2 数据信息采掘和优化建模在炼油工业中的应用 268
14.3 数据信息采掘在高分子材料生产优化中的应用 273
14.4 数据信息采掘在染料色光控制中的应用 277
14.5 数据信息采掘在醋酸乙烯催化合成中的应用 278
14.6 数据信息采掘用于提高有机合成产率 279
14.7 数据信息采掘在化工环保中的应用 281
14.8 数据信息采掘在产品检验自动化中的应用 283
14.9 数据信息采掘在化工设备防腐方面的应用 284
14.10 数据信息采掘在其他化工过程中的应用 284
参考文献 285
第十五章 数据信息采掘在冶金生产优化中的应用 286
15.1 炼焦配煤的优化 286
15.2 模式识别在降低焦比中的应用 287
15.4 连铸坯表面质量的模式识别分析 288
15.3 模式识别方法分析炼钢转炉炉龄的影响因素 288
15.5 模式识别在合金钢生产中的应用 289
15.6 联合法生产氧化铝净溶出率的模式识别优化 291
15.7 烧结法碳酸化分解终点的优化控制 292
15.8 电解铝电流效率的优化模型 292
15.9 电解铝阳极导电合金成分优化 293
15.10 钢铁表面氮化过程的质量优化 294
15.11 汽车零件光亮镀铬的质量优化 295
15.12 热法炼镁质量与配料比的关系 296
参考文献 296
附录 297
A 为初学者按“向导方式”上机实习的操作指南 297
B 上机实习 302
C 附表 303