第1章 概述 1
1.1什么是化学信息 1
1.2化学信息的誔生背景 1
1.3信息科学在化学领域的应用 2
1.4化学信息的结构和特点 2
1.5化学信息的工作方式 3
1.6信息采集接口 4
1.7化学信息的应用 4
1.7.1绘制结构 4
1.7.2数据库 5
1.7.3计算机辅助设计反应预测系统 5
1.7.4预测结构与活性的关系 5
1.8展望 5
第2章化学信息来源 7
2.1词典 7
2.2手册 7
2.3化学期刊 9
2.3.1综合类期刊 9
2.3.2有机化学期刊 10
2.3.3分析化学期刊 11
2.3.4无机化学期刊 12
2.3.5物理化学期刊 12
2.4图书馆资源 12
2.4.1生命科学图书馆 13
2.4.2中国科学院大连化学物理研究所图书馆 13
2.4.3中国科学院国家科学图书馆 14
2.4.4国家科技图书文献中心化工分中心 16
2.4.5清华大学图书馆 17
2.4.6中国国家图书馆 17
2.4.7哈佛大学图书馆 17
2.4.8斯坦福大学图书馆 18
2.5化学化工信息资源导航系统 19
2.5.1ChIN 19
2.5.2Computer AidedChemistry Tutorial 20
2.5.3Wilton High School Chemistry 20
2.5.4化学家链接网站 21
第3章化学信息数据库资源 22
3.1数据库简介 22
3.1.1数据 22
3.1.2数据库 22
3.1.3数据库管理系统 23
3.1.4数据库系统 23
3.2数据库历史及分类 24
3.2.1数据库历史 24
3.2.2数据库的模型分类 25
3.3三类化学信息数据库 26
3.3.1文献数据库 26
3.3.2事实数据库 26
3.3.3结构数据库 26
3.4互联网上的化学化工数据库 27
3.4.1CA 27
3.4.2ISI数据库 33
3.4.3OCLC数据库 39
3.4.4CSA 40
3.4.5ScienceDirect 40
3.4.6CNKI 42
3.4.7万方数据库 48
3.4.8维普中文科技期刊数据库 48
3.4.9EI 48
3.4.10出专利数据库 49
3.4.11Reaxys数据库 51
3.4.12谱图数据库 52
第4章信息搜索引擎 54
4.1概述 54
4.1.1搜索引擎的原理 54
4.1.2搜索引擎的历史及发展趋势 55
4.2搜索引擎的定义及分类 58
4.2.1全文搜索引擎 58
4.2.2目录索引类搜索引擎 58
4.2.3元搜索引擎 59
4.2.4垂直搜索引擎 59
4.3搜索引擎查询方法 59
4.3.1模糊查询 60
4.3.2精确查询 60
4.3.3逻辑查询 60
4.3.4指定范围查询 61
4.4常用搜索引擎 61
4.4.1百度 61
4.4.2Google中国 62
4.4.3维基百科 62
4.4.4BASE 65
4.4.5Vascoda 65
4.4.6InformationBridge 66
4.4.7Intute 67
4.4.8Infomine 68
4.5元搜索引擎 68
4.5.1Dogpile 68
4.5.2Excite 69
4.5.3Ixquick 70
4.5.4Mamma 70
4.5.5Metacrawler 71
4.5.6ProFusion 71
4.5.7Savvysearch 72
4.6专业搜索引擎 73
4.6.1专业搜索引擎的优势 73
4.6.2著名的专业搜索引擎 73
第5章化学软件 76
5.1概述 76
5.2化学软件的分类 77
5.3语言软件和依托算法的化学计算软件 78
5.3.1MATLAB 78
5.3.2R语言 91
5.4绘图软件 101
5.4.1ACD/ChemSketch5.0 101
5.4.2SymyxDraw 103
5.4.3ChemBioDraw 104
5.5化学分析仪器数据处理软件 105
5.5.1GRAMS 106
5.5.2MestReNova 109
5.5.3Origin 110
5.6分子模拟软件 112
5.6.1Gaussian软件 112
5.6.2Amber软件 114
第6章信息处理与数据挖掘 117
6.1概述 117
6.2数据的标准化 118
6.3特征提取与优化 118
6.3.1主成分分析 118
6.3.2偏最小二乘法 121
6.3.3逐步回归分析 122
6.3.4遗传算法 123
6.4信号处理方法 125
6.4.1协方差与相关系数 126
6.4.2自、互相关分析 126
6.4.3功率谱密度 127
6.4.4傅里叶变换 127
6.4.5小波变换 128
6.5机器学习方法 132
6.5.1K最近邻法 132
6.5.2概率神经网络 132
6.5.3分类回归树 133
6.5.4助推法 134
6.5.5人工神经网络 135
6.5.6支持向量机 139
6.6数据库挖掘技术 141
6.6.1聚类算法 141
6.6.2决策树算法 142
6.7web数据挖掘技术 142
6.7.1web内容挖掘 142
6.7.2web结构挖掘 143
6.7.3web日志挖掘 143
第7章QSAR及药物设计 144
7.1概述 144
7.2QSAR模型的分类 145
7.2.1二维定量构效关系 145
7.2.2三维定量构效关系 147
7.2.3多维定量构效关系 150
7.2.4方法评价 150
7.3定量构效关系研究中常用的回归分析法 151
7.3.1多元线性回归 151
7.3.2主成分回归 152
7.3.3偏最小二乘回归 153
7.3.4投影寻踪回归 154
7.3.5非线性方法 155
7.4药物设计 155
7.5QSAR方法的应用 157
第8章生物信息学 161
8.1什么是生物信息学 161
8.2生物信息学的发展历程 162
8.3生物信息学的研究内容 164
8.3.1生物信息挖掘 164
8.3.2药物设计 164
8.3.3基因组学 165
8.3.4蛋白质组学 165
8.4生物信息学的研究方法 167
8.5生物信息学的应用 168
8.6生物信息学的研究 170
8.7蛋白质功能研究 170
8.8蛋白质数据库简介 171
8.8.1综合性蛋白质数据库 171
8.8.2专用性蛋白质数据库 172
8.9蛋白质序列的特征提取方法 173
8.9.1基于氨基酸组成和位置的特征提取方法 174
8.9.2基于氨基酸物理化学特性的特征提取方法 175
8.9.3基于数据库信息挖掘的特征提取方法 177
8.10蛋白质相互作用 178
8.11蛋白质网络 183
参考文献 187