第0章 绪论 1
0.1 生物信息学产生的背景 1
0.2 生物信息学的研究对象 4
0.2.1 核酸 5
0.2.2 蛋白质 7
0.2.3 中心法则和遗传密码 8
0.3 生物信息学的主要研究内容 11
0.3.1 序列比较 11
0.3.2 计算机辅助基因识别 14
0.3.3 系统发育分析 17
0.3.4 RNA和蛋白质的结构研究 18
0.4 本书的主要内容 19
参考文献 21
第1章 生物大分子的图形表示 33
1.1 引言 33
1.1.1 DNA序列的图形表示 34
1.1.2 RNA二级结构的图形表示 40
1.1.3 蛋白质序列的图形表示 42
1.2 DNA序列的3-D图形表示 45
1.3 DNA序列的2-D图形表 49
1.3.1 特征序列 49
1.3.2 基于特征序列的“双水平线”图 51
1.3.3 基于特征序列的“梯状”图 53
1.4 有向图表示 57
参考文献 58
第2章 生物序列的数值刻画 65
2.1 引言 65
2.2 伪迹 68
2.3 ALE-指标 75
2.3.1 ALE-指标 75
2.3.2 性质 77
2.3.3 应用 81
2.4 上三角矩阵表示 87
2.4.1 序列不变量的相容性 87
2.4.2 有向图及上三角矩阵的应用 89
2.5 正规化相对熵 93
2.5.1 定义 94
2.5.2 应用 96
参考文献 100
第3章 序列与结构的粗粒化描述 105
3.1 DNA序列的逻辑表示 106
3.1.1 逻辑表示同其他表示的比较 108
3.1.2 逻辑序列的S/S矩阵及其压缩矩阵 111
3.2 蛋白质序列的逻辑表 115
3.2.1 蛋白质序列的逻辑表示 116
3.2.2 应用 119
3.3 基于5-字母模型的蛋白质序列的图形表示及应用 122
3.3.1 氨基酸的5-字母模型 123
3.3.2 蛋白质序列的2-D图形表示 124
3.3.3 蛋白质序列的数值刻画 125
3.3.4 冠状病毒的系统发育分析 128
3.4 LZ复杂度及应用 131
3.4.1 有限序列的LZ复杂度 131
3.4.2 基于LZ复杂度的RNA二级结构相似性分析 134
3.4.3 广义LZ复杂度及应用 137
参考文献 143
第4章 蛋白质编码基因识别 151
4.1 引言 151
4.2 DNA序列基于正规化相对熵的数值刻画 154
4.3 Fisher线性判别法 155
4.4 算法的评估 157
4.4.1 敏感度、特异性和准确度的定义 157
4.4.2 算法的评估 159
4.5 识别酿酒酵母基因组2-6类中的基因 162
参考文献 167
结语 172