第1章 系统引导、启动和关闭问题 1
1.1 引导加载程序 2
1.1.1 GRUB 2
1.1.2 LILO 10
1.1.3 当GRUB或者LILO不工作时进行引导 13
1.2 init进程和/etc/inittab文件 14
1.2.1 以多用户模式启动 17
1.2.2 init错误 19
1.3 rc脚本 20
1.3.1 确认模式 24
1.3.2 rc脚本中的启动问题 25
1.4 解决root文件系统的问题 27
1.4.2 从援救CD引导 28
1.4.1 从第二个硬盘引导 28
1.4.3 使用Knoppix CD重置丢失的root密码 30
1.4.4 使用Knoppix CD重新安装GRUB 30
1.4.5 从援救软盘引导 32
1.5 小结 32
1.6 附注 32
第2章 系统挂起和严重错误 33
2.1 操作系统挂起 34
2.1.1 诊断可中断挂起故障 34
2.1.2 诊断不可中断挂起故障 42
2.2 操作系统严重错误 44
2.2.1 诊断操作系统严重错误 44
2.2.2 诊断oops导致的严重错误 47
2.3 硬件机器检查 49
2.4 小结 50
第3章 性能工具 52
3.1 top 53
3.1.1 添加和移除字段 53
3.1.2 解释输出 55
3.1.3 保存自定义 56
3.1.4 批处理模式 57
3.2 sar 58
3.2.1 sar数据收集器 58
3.2.2 CPU统计数据 59
3.2.3 磁盘I/O统计数据 62
3.2.4 网络统计数据 63
3.3 vmstat 65
3.4 iostat 67
3.7 尾注 69
3.5 free 69
3.6 小结 69
第4章 性能 70
4.1 在可能的最低层开始故障诊断 70
4.1.1 使用raw命令将原始设备绑定到块设备 71
4.1.2 原始设备性能 72
4.1.3 使用dd命令确定连续I/O速度 73
4.1.4 使用sar和iostat测量磁盘性能 74
4.1.5 理解测试性能时I/O块大小的重要性 75
4.1.6 时间的重要性 76
4.1.7 确定块大小 77
4.1.8 队列的重要性 78
4.1.9 磁盘的多线程(进程)I/O 79
4.1.10 使用条带化lvol减少磁盘I/O紧张 80
4.1.11 条带化lvol与单磁盘性能的比较 82
4.1.12 多路径I/O 83
4.2 文件系统 86
4.2.1 将日志记录到单独磁盘 86
4.2.2 确定文件系统请求的I/O大小 88
4.2.3 用小块I/O传输加载文件系统 88
4.2.4 利用文件系统的关键优势 91
4.2.5 Linux和Windows性能以及调整扇区对齐 92
4.2.6 使用bonnie++进行调整性能和基准测试 93
4.2.7 评估应用程序的CPU利用率问题 95
4.2.8 使用Oracle statspak 98
4.2.9 分配共享内存时“设备上无剩余空间”错误的故障诊断 101
4.2.10 其他性能工具 102
4.3 小结 103
第5章 针对PCMCIA和USB通过SAN添加新存储 104
5.1 配置 105
5.2 内核模块 106
5.3 通过PCI添加LUN 112
5.4 通过PCMCIA/USB添加存储 119
5.5 小结 122
第6章 磁盘分区与文件系统 123
6.1 背景 123
6.1.1 IDE和SCSI 124
6.1.2 位计算 124
6.2 分区表/主引导记录:定位 126
6.3 分区表/主引导记录:CHS寻址 127
6.3.1 定义主分区 128
6.3.2 确定能否创建附加分区 130
6.4 分区表/主引导记录:逻辑分区/扩展分区 132
6.5 分区表/主引导记录:逻辑块寻址(LBA) 135
6.6 分区表/主引导记录:引导加载器 137
6.6.1 在使用过的驱动器上审查字节 139
6.6.2 BIOS初始化引导加载器 141
6.7 分区表/主引导记录:备份 141
6.7.1 分区恢复过程 142
6.7.2 演示故障 143
6.7.3 挂载分区 144
6.7.4 在ext文件系统中恢复超级块和信息结点表 146
6.8 更多案例 150
6.9 小结 153
7.1 支持的设备 154
第7章 设备故障与置换 154
7.2 到哪里寻找错误 156
7.3 确定故障设备 158
7.4 故障设备的置换 165
7.5 小结 170
第8章 Linux进程:结构、挂起与核心转储 171
8.1 进程结构和生命周期 171
8.1.1 进程/任务概述 171
8.1.2 进程关系 172
8.1.3 Linux进程创建 172
8.1.4 Linux进程创建的示例 173
8.1.5 进程创建小结 174
8.1.6 Linux进程终止 174
8.2 Linux线程 174
8.3 确定进程挂起 180
8.4 进程核心 186
8.4.1 信号 187
8.4.2 限制 189
8.4.3 核心文件 191
8.5 小结 192
第9章 备份与恢复 194
9.1 备份介质 194
9.1.1 磁带 195
9.1.2 光盘存储 202
9.1.3 硬盘存储 202
9.2 备份范围 203
9.3.1 tar 204
9.3 基本备份和恢复命令 204
9.3.2 cpio 206
9.3.3 dump和恢复 208
9.3.4 dd 209
9.3.5 mkisofs 209
9.3.6 rsync命令 209
9.4 裸机恢复 210
9.5 确定磁带的内容 210
9.6 怎样辨别磁带的问题出自硬件还是软件 211
9.7 小结 213
第10章 cron与at 214
10.1 cron 215
10.1.1 cron守护程序 220
10.1.2 kcron 222
10.2 anacron 224
10.3 at 225
10.4 诊断cron 227
10.5 小结 233
第11章 打印与打印机 234
11.1 什么是假脱机程序 234
11.1.1 使用假脱机程序命令 235
11.1.2 假脱机程序“管道工程” 237
11.1.3 术语定义 240
11.2 打印机类型 242
11.3 连接类型 243
11.3.1 本地串行打印 244
11.3.2 本地USB打印 246
11.3.4 远程打印 249
11.3.3 本地并行打印 249
11.3.5 原始网络套接字打印 253
11.4 页面描述语言 255
11.5 通用打印诊断 256
11.5.1 映射假脱机环境 256
11.5.2 断点 257
11.6 小结 257
第12章 系统安全 258
12.1 什么是系统安全 258
12.1.1 主机安全与网络安全的比较 258
12.1.2 什么是安全漏洞 259
12.1.3 主机安全漏洞分类 259
12.1.4 安全漏洞和暴露类型 261
12.2 预防 262
12.2.1 SSH加密 262
12.1.5 增强主机安全的一般步骤 262
12.2.2 诊断典型SSH问题 266
12.2.3 连接和登录失败 266
12.2.4 使用netfilter/iptables强化系统 271
12.2.5 什么是NAT 273
12.2.6 MANGLE表 273
12.2.7 使用iptables进行配置 273
12.2.8 iptables命令示例 277
12.2.9 保存配置 277
12.2.10 终止、验证状态和启动iptables 278
12.2.11 问题诊断示例 279
12.2.12 打补丁 283
12.2.13 遭受入侵后的恢复 284
12.3 小结 284
13.1 OSI和TCP/IP层简介 285
第13章 网络问题 285
13.2 诊断网络层问题 286
13.2.1 TCP/IP物理网络访问层的诊断 286
13.2.2 诊断网络层问题(OSI第三层、TCP/IP第二层) 297
13.2.3 诊断传输层(TCP和UDP)问题 314
13.2.4 诊断应用程序级的问题:TCP/IP模型的最后一层 329
13.3 小结 329
第14章 登录问题 330
14.1 /etc/password,/etc/shadow和密码时效 331
14.1.1 /etc/password和/ete/shadow 331
14.1.2 chage、passwd和usermod 332
14.1.3 /etc/passwd和/etc/shadow损坏 337
14.1.4 pwck 337
14.2.1 /etc/securetty 338
14.2 Linux配置造成的登录失败 338
14.2.2 /etc/nologin 339
14.3 PAM 339
14.3.1 功能 340
14.3.2 优先级 340
14.3.3 模块名 341
14.3.4 参数 341
14.3.5 /etc/pam.d 341
14.3.6 /etc/pam.conf 342
14.3.7 /lib/security 342
14.3.8 Linux-PAM资源 343
14.3.9 诊断PAM故障 343
14.3.10 验证模块 345
14.3.11 PAM中的漏洞 346
14.4 shell问题 347
14.5 密码问题 348
14.6 小结 350
14.7 尾注 350
第15章 X Windows问题 351
15.1 X背景 351
15.2 X组件 352
15.2.1 X Server组件 352
15.2.2 X客户端组件 360
15.3 X显示管理器 361
15.4 X桌面管理器(环境) 362
15.5 X故障诊断案例 363
15.6 小结 365
15.7 尾注 366