《Linux系统故障诊断与排除》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:(美)James Kirkland,David Carmichael,christopher L.Tinker等
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2007
  • ISBN:7115154252
  • 页数:366 页
图书介绍:本书介绍了Linux系统故障的诊断与排除技巧。

第1章 系统引导、启动和关闭问题 1

1.1 引导加载程序 2

1.1.1 GRUB 2

1.1.2 LILO 10

1.1.3 当GRUB或者LILO不工作时进行引导 13

1.2 init进程和/etc/inittab文件 14

1.2.1 以多用户模式启动 17

1.2.2 init错误 19

1.3 rc脚本 20

1.3.1 确认模式 24

1.3.2 rc脚本中的启动问题 25

1.4 解决root文件系统的问题 27

1.4.2 从援救CD引导 28

1.4.1 从第二个硬盘引导 28

1.4.3 使用Knoppix CD重置丢失的root密码 30

1.4.4 使用Knoppix CD重新安装GRUB 30

1.4.5 从援救软盘引导 32

1.5 小结 32

1.6 附注 32

第2章 系统挂起和严重错误 33

2.1 操作系统挂起 34

2.1.1 诊断可中断挂起故障 34

2.1.2 诊断不可中断挂起故障 42

2.2 操作系统严重错误 44

2.2.1 诊断操作系统严重错误 44

2.2.2 诊断oops导致的严重错误 47

2.3 硬件机器检查 49

2.4 小结 50

第3章 性能工具 52

3.1 top 53

3.1.1 添加和移除字段 53

3.1.2 解释输出 55

3.1.3 保存自定义 56

3.1.4 批处理模式 57

3.2 sar 58

3.2.1 sar数据收集器 58

3.2.2 CPU统计数据 59

3.2.3 磁盘I/O统计数据 62

3.2.4 网络统计数据 63

3.3 vmstat 65

3.4 iostat 67

3.7 尾注 69

3.5 free 69

3.6 小结 69

第4章 性能 70

4.1 在可能的最低层开始故障诊断 70

4.1.1 使用raw命令将原始设备绑定到块设备 71

4.1.2 原始设备性能 72

4.1.3 使用dd命令确定连续I/O速度 73

4.1.4 使用sar和iostat测量磁盘性能 74

4.1.5 理解测试性能时I/O块大小的重要性 75

4.1.6 时间的重要性 76

4.1.7 确定块大小 77

4.1.8 队列的重要性 78

4.1.9 磁盘的多线程(进程)I/O 79

4.1.10 使用条带化lvol减少磁盘I/O紧张 80

4.1.11 条带化lvol与单磁盘性能的比较 82

4.1.12 多路径I/O 83

4.2 文件系统 86

4.2.1 将日志记录到单独磁盘 86

4.2.2 确定文件系统请求的I/O大小 88

4.2.3 用小块I/O传输加载文件系统 88

4.2.4 利用文件系统的关键优势 91

4.2.5 Linux和Windows性能以及调整扇区对齐 92

4.2.6 使用bonnie++进行调整性能和基准测试 93

4.2.7 评估应用程序的CPU利用率问题 95

4.2.8 使用Oracle statspak 98

4.2.9 分配共享内存时“设备上无剩余空间”错误的故障诊断 101

4.2.10 其他性能工具 102

4.3 小结 103

第5章 针对PCMCIA和USB通过SAN添加新存储 104

5.1 配置 105

5.2 内核模块 106

5.3 通过PCI添加LUN 112

5.4 通过PCMCIA/USB添加存储 119

5.5 小结 122

第6章 磁盘分区与文件系统 123

6.1 背景 123

6.1.1 IDE和SCSI 124

6.1.2 位计算 124

6.2 分区表/主引导记录:定位 126

6.3 分区表/主引导记录:CHS寻址 127

6.3.1 定义主分区 128

6.3.2 确定能否创建附加分区 130

6.4 分区表/主引导记录:逻辑分区/扩展分区 132

6.5 分区表/主引导记录:逻辑块寻址(LBA) 135

6.6 分区表/主引导记录:引导加载器 137

6.6.1 在使用过的驱动器上审查字节 139

6.6.2 BIOS初始化引导加载器 141

6.7 分区表/主引导记录:备份 141

6.7.1 分区恢复过程 142

6.7.2 演示故障 143

6.7.3 挂载分区 144

6.7.4 在ext文件系统中恢复超级块和信息结点表 146

6.8 更多案例 150

6.9 小结 153

7.1 支持的设备 154

第7章 设备故障与置换 154

7.2 到哪里寻找错误 156

7.3 确定故障设备 158

7.4 故障设备的置换 165

7.5 小结 170

第8章 Linux进程:结构、挂起与核心转储 171

8.1 进程结构和生命周期 171

8.1.1 进程/任务概述 171

8.1.2 进程关系 172

8.1.3 Linux进程创建 172

8.1.4 Linux进程创建的示例 173

8.1.5 进程创建小结 174

8.1.6 Linux进程终止 174

8.2 Linux线程 174

8.3 确定进程挂起 180

8.4 进程核心 186

8.4.1 信号 187

8.4.2 限制 189

8.4.3 核心文件 191

8.5 小结 192

第9章 备份与恢复 194

9.1 备份介质 194

9.1.1 磁带 195

9.1.2 光盘存储 202

9.1.3 硬盘存储 202

9.2 备份范围 203

9.3.1 tar 204

9.3 基本备份和恢复命令 204

9.3.2 cpio 206

9.3.3 dump和恢复 208

9.3.4 dd 209

9.3.5 mkisofs 209

9.3.6 rsync命令 209

9.4 裸机恢复 210

9.5 确定磁带的内容 210

9.6 怎样辨别磁带的问题出自硬件还是软件 211

9.7 小结 213

第10章 cron与at 214

10.1 cron 215

10.1.1 cron守护程序 220

10.1.2 kcron 222

10.2 anacron 224

10.3 at 225

10.4 诊断cron 227

10.5 小结 233

第11章 打印与打印机 234

11.1 什么是假脱机程序 234

11.1.1 使用假脱机程序命令 235

11.1.2 假脱机程序“管道工程” 237

11.1.3 术语定义 240

11.2 打印机类型 242

11.3 连接类型 243

11.3.1 本地串行打印 244

11.3.2 本地USB打印 246

11.3.4 远程打印 249

11.3.3 本地并行打印 249

11.3.5 原始网络套接字打印 253

11.4 页面描述语言 255

11.5 通用打印诊断 256

11.5.1 映射假脱机环境 256

11.5.2 断点 257

11.6 小结 257

第12章 系统安全 258

12.1 什么是系统安全 258

12.1.1 主机安全与网络安全的比较 258

12.1.2 什么是安全漏洞 259

12.1.3 主机安全漏洞分类 259

12.1.4 安全漏洞和暴露类型 261

12.2 预防 262

12.2.1 SSH加密 262

12.1.5 增强主机安全的一般步骤 262

12.2.2 诊断典型SSH问题 266

12.2.3 连接和登录失败 266

12.2.4 使用netfilter/iptables强化系统 271

12.2.5 什么是NAT 273

12.2.6 MANGLE表 273

12.2.7 使用iptables进行配置 273

12.2.8 iptables命令示例 277

12.2.9 保存配置 277

12.2.10 终止、验证状态和启动iptables 278

12.2.11 问题诊断示例 279

12.2.12 打补丁 283

12.2.13 遭受入侵后的恢复 284

12.3 小结 284

13.1 OSI和TCP/IP层简介 285

第13章 网络问题 285

13.2 诊断网络层问题 286

13.2.1 TCP/IP物理网络访问层的诊断 286

13.2.2 诊断网络层问题(OSI第三层、TCP/IP第二层) 297

13.2.3 诊断传输层(TCP和UDP)问题 314

13.2.4 诊断应用程序级的问题:TCP/IP模型的最后一层 329

13.3 小结 329

第14章 登录问题 330

14.1 /etc/password,/etc/shadow和密码时效 331

14.1.1 /etc/password和/ete/shadow 331

14.1.2 chage、passwd和usermod 332

14.1.3 /etc/passwd和/etc/shadow损坏 337

14.1.4 pwck 337

14.2.1 /etc/securetty 338

14.2 Linux配置造成的登录失败 338

14.2.2 /etc/nologin 339

14.3 PAM 339

14.3.1 功能 340

14.3.2 优先级 340

14.3.3 模块名 341

14.3.4 参数 341

14.3.5 /etc/pam.d 341

14.3.6 /etc/pam.conf 342

14.3.7 /lib/security 342

14.3.8 Linux-PAM资源 343

14.3.9 诊断PAM故障 343

14.3.10 验证模块 345

14.3.11 PAM中的漏洞 346

14.4 shell问题 347

14.5 密码问题 348

14.6 小结 350

14.7 尾注 350

第15章 X Windows问题 351

15.1 X背景 351

15.2 X组件 352

15.2.1 X Server组件 352

15.2.2 X客户端组件 360

15.3 X显示管理器 361

15.4 X桌面管理器(环境) 362

15.5 X故障诊断案例 363

15.6 小结 365

15.7 尾注 366