第一章 可靠性与可靠技术概论 1
1.1 计算机系统的可靠性技术及其发展过程 1
1.2 可靠性技术研究的范畴 5
1.2.1 提高元部件可靠性的技术——避错技术 5
1.2.2 使用给定器件构成高可靠性系统的技术——容错技术 5
1.2.3 可测性设计技术 8
1.2.4 失败安全设计技术 8
1.3 可靠性研究的四层次结构模型 10
1.4 故障与故障模型 12
1.4.1 故障分类 12
1.4.2 故障模型 14
1.5 表征系统可靠性的参数指标 20
1.5.1 可靠性与可靠度 21
1.5.2 可维性与可维度 23
1.5.3 可用性与可用度 24
1.5.4 安全性与安全度 25
1.5.5 保能性与保能度 25
1.5.6 可测性与可测度 26
1.5.7 简化可靠性参数 26
1.6 简单系统的可靠性分析计算 27
1.6.1 串联系统 27
1.6.2 并联系统 28
1.6.3 串并联系统 29
1.6.4 并串联系统 30
习题一 31
第二章 可靠性编码技术 33
2.1 检错纠错码概述 33
2.1.1 检错纠错编码原理 33
2.1.3 码距与检错、纠错能力的关系 36
2.1.2 关于编码技术的几个基本概念 36
2.2 常用可靠性编码 38
2.2.1 奇偶校验码 38
2.2.2 循环码(循环冗余码CRC) 47
2.2.3 汉明码 53
2.2.4 算术码 60
2.2.5 校验和码 65
2.2.6 n中取m码 67
2.2.7 伯格码 69
2.3 可靠性编码的码制选择 71
习题二 72
第三章 故障自检测与自诊断技术 75
3.1 概述 75
3.1.1 故障检测与诊断概念 75
3.1.2 故障自检测与自诊断 76
3.1.3 检测与诊断技术的评价标准 80
3.2 以硬件冗余为主导的故障检测与诊断技术 81
3.2.1 基于检错码的自检测技术 81
3.2.2 基于冗余模块的比较检测技术 95
3.2.3 基于自对偶函数的交替逻辑检测技术 98
3.2.4 基于监视定时器的检测技术 99
3.3 以软件冗余为主导的故障检测与诊断技术 100
3.3.1 基于系统动态模型的方法 100
3.3.2 基于一致校验的方法 103
3.3.3 基于因果关系的信号处理方法 103
3.3.4 基于专家系统的方法 104
3.3.5 基于故障树的诊断方法 104
3.3.7 基于模糊数学的方法 105
3.3.6 基于模式识别的方法 105
3.3.8 基于人工神经网络的方法 106
3.3.9 小结 107
习题三 107
第四章 故障屏蔽技术 110
4.1 概述 110
4.2 元件级故障屏蔽技术 111
4.2.1 二倍冗余结构 111
4.2.2 四倍冗余结构 112
4.2.3 桥接冗余结构 113
4.3 逻辑级故障屏蔽技术 114
4.3.1 交织逻辑 114
4.3.2 编码状态机逻辑 117
4.4.1 模块级故障屏蔽模型 119
4.4 模块级故障屏蔽技术 119
4.4.2 N模冗余校正器的设计 120
4.4.3 三模冗余技术 123
4.4.4 三模-单模系统 131
4.5 系统级故障屏蔽技术 132
4.6 故障屏蔽技术在PC控制系统设计中的应用 133
4.6.1 可编程控制器的基本概念 134
4.6.2 控制系统的静态冗余设计 137
4.6.3 控制系统供电系统设计 141
习题四 143
第五章 动态冗余技术 145
5.1 概述 145
5.2 重组 146
5.2.1 后援备份重组 146
5.2.2 缓慢降级重组 147
5.3 可重组的动态N模冗余技术 148
5.3.1 待命储备式N模冗余 148
5.3.2 可重组二模冗余 150
5.3.3 混合N模冗余 153
5.3.4 自适应重组N模冗余 158
5.3.5 自清除冗余 160
5.3.6 筛除冗余 163
5.3.7 双机-三模冗余 165
5.3.8 动态N模冗余小结 166
5.4 恢复 169
5.4.1 向前/向后恢复技术 169
5.4.2 常用恢复算法 171
5.4.3 计算机系统基本部分的恢复技术 178
5.4.4 文件恢复技术 183
5.4.5 通信系统的恢复技术 186
5.5 多处理机系统的动态冗余结构与容错处理 188
5.5.1 常用多处理机系统冗余结构 188
5.5.2 容错处理 198
5.6 模拟部件的冗余容错 201
5.6.1 模拟部件的错误屏蔽技术 201
5.6.2 中值选择模拟信号表决器 202
5.6.3 模拟TMR表决器的VLSI实现与应用 204
5.6.4 磁通和技术在模拟TMR系统中的应用 205
5.6.5 模拟TMR表决的软件实现 206
5.7 动态冗余设计的综合考虑 206
习题五 209
6.1.2 测试技术分类 213
6.1.1 何为测试 213
第六章 可测性设计技术 213
6.1 测试技术的基本概念 213
6.1.3 故障可检测性和可诊断性 215
6.1.4 测试技术的评价标准 216
6.2 测试生成算法 217
6.2.1 通路敏化(Path Sensitizing)法 217
6.2.2 D算法(D-Algorithm) 219
6.2.3 布尔差分法 220
6.2.4 时序电路的测试生成 220
6.3 可测性设计 230
6.3.1 何谓可测性 230
6.3.2 可控性和可观察性 232
6.3.3 可测性设计的特定技术 234
6.3.4 可测性设计的通用技术 237
6.4.3 测试点的选择和评价 240
6.4 内建自测试设计 242
6.4.1 概述 242
6.4.2 BIT的结构 243
6.4.4 BIT的主要性能指标 243
6.4.5 BIT的设计考虑 244
6.4.6 BIT的设计成本估算 244
习题六 245
第七章 软件可靠性技术 247
7.1 软件可靠性概述 247
7.1.1 软件可靠性与硬件可靠性的联系和区别 247
7.1.2 软件可靠性技术的内涵 249
7.1.3 软件可靠性定义 250
7.1.4 软件可靠性指标 251
7.2.1 软件可靠性管理技术 254
7.2 软件避错排错技术 254
7.2.2 可靠性程序设计技术 255
7.2.3 程序验证技术 258
7.3 软件容错技术 271
7.3.1 容错软件的基本概念及原理 271
7.3.2 容错软件设计的基本技术 276
7.3.3 容错软件设计的先进技术 279
7.3.4 容错软件的相异性设计准则 281
7.4 信息保护技术 282
7.4.1 概述 282
7.4.2 基本信息保护技术 283
7.4.3 先进的计算机网络信息保护技术 286
7.5.1 概述 290
7.5 软件可靠性模型 290
7.5.2 Jelinski-Moranda模型 291
7.5.3 Goel-Okumoto的NHPP模型 293
7.5.4 Weibull模型 295
7.5.5 Littlewood模型 297
7.5.6 对数Poisson执行时间模型 299
习题七 299
第八章 失败安全设计技术 301
8.1 失败安全设计概述 301
8.2 失败安全设计和失败安全的条件 302
8.3 输出失败安全设计 303
8.4 系统失败安全设计 305
8.4.1 基于检错码原理的失败安全设计 305
8.4.2 分块法失败安全设计 309
习题八 314
第九章 容错系统的可靠性分析评估 317
9.1 概述 317
9.2 基于可靠性框图的分析法 318
9.2.1 系统可靠性框图及其建立 318
9.2.2 真值表法 320
9.2.3 全概率公式法 322
9.2.4 最小路集法和最小割集法 326
9.3 基于马尔可夫模型的分析法 334
9.3.1 状态图及其构造 334
9.3.2 状态图的简化 336
9.3.3 状态方程及其解算方法 337
9.4 基于故障树的分析法 342
9.4.1 故障树分析法概述 342
9.4.2 故障树的建造 343
9.4.3 故障树的数学描述 345
9.4.4 故障树的定性分析 349
9.4.5 故障树的定量化计算 352
9.4.6 故障树分析法的评价 358
9.5 不可维修系统的可靠性分析 358
9.5.1 简单系统的可靠性分析 359
9.5.2 复杂系统的可靠性分析 365
9.6 可维修系统的可靠性分析 366
9.6.1 概述 366
9.6.2 串联可维修系统 369
9.6.3 并联可维修系统 372
9.6.4 r/N可维修系统 375
9.6.5 二部件冷备份可维修系统 376
9.6.6 实例分析 378
9.7 预维修系统的可靠性分析 380
9.7.1 概述 380
9.7.2 基本的预维修方针及其可靠性分析 381
9.7.3 第二种预维修方针及其可靠性分析 384
习题九 387
第十章 高可靠性计算机应用系统设计 390
10.1 设计方法及举例 390
10.1.1 设计方法 391
10.1.2 设计举例 393
10.2 可靠性技术在航天航空领域中的应用实例 404
10.2.1 多数表决冗余计算机系统 404
10.2.2 三模冗余加热备份容错计算机系统 405
10.2.3 微波统一测控系统中的可靠性设计 407
10.2.4 导弹落区实时数据传输网络的可靠性设计 408
10.3 可靠性技术在工业过程计算机控制与监测系统中的应用实例 409
10.3.1 独立总线三模冗余容错微机系统 409
10.3.2 智能仪表通信系统中的一种冗余通道设计 413
10.3.3 监测系统中的冗余技术应用 416
10.4 故障诊断技术在FMS中的应用 419
10.4.1 FMS故障机理分析 420
10.4.2 FMS故障检测策略 420
10.4.3 监测诊断系统总体结构 422
10.4.4 基于传感信息、控制信号的状态初级识别 423
10.4.5 状态综合监测识别专家系统 424
10.4.6 故障脱机精密诊断专家系统 425
习题十 426
参考文献 429