《深入理解计算机系统》PDF下载

  • 购买积分:20 如何计算积分?
  • 作  者:(美)兰德尔E.布莱恩特,大卫R.奥哈拉伦著;龚奕利,贺莲译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2016
  • ISBN:9787111544937
  • 页数:737 页
图书介绍:本书是将计算机软件和硬件理论结合讲述的经典教程,内容覆盖计算机导论、体系结构和处理器设计等多门课程。本书的最大优点是为程序员描述计算机系统的实现细节,通过描述程序是如何映射到系统上,以及程序是如何执行的,使读者更好地理解程序的行为为什么是这样的,以及造成效率低下的原因。

第1章 计算机系统漫游 1

1.1 信息就是位+上下文 1

1.2 程序被其他程序翻译成不同的格式 3

1.3 了解编译系统如何工作是大有益处的 4

1.4 处理器读并解释储存在内存中的指令 5

1.4.1 系统的硬件组成 5

1.4.2 运行hello程序 7

1.5 高速缓存至关重要 9

1.6 存储设备形成层次结构 9

1.7 操作系统管理硬件 10

1.7.1 进程 11

1.7.2 线程 12

1.7.3 虚拟内存 12

1.7.4 文件 14

1.8 系统之间利用网络通信 14

1.9 重要主题 16

1.9.1 Amdahl定律 16

1.9.2 并发和并行 17

1.9.3 计算机系统中抽象的重要性 19

1.10 小结 20

参考文献说明 20

练习题答案 20

第一部分 程序结构和执行 22

第2章 信息的表示和处理 22

2.1 信息存储 24

2.1.1 十六进制表示法 25

2.1.2 字数据大小 27

2.1.3 寻址和字节顺序 29

2.1.4 表示字符串 34

2.1.5 表示代码 34

2.1.6 布尔代数简介 35

2.1.7 C语言中的位级运算 37

2.1.8 C语言中的逻辑运算 39

2.1.9 C语言中的移位运算 40

2.2 整数表示 41

2.2.1 整型数据类型 42

2.2.2 无符号数的编码 43

2.2.3 补码编码 44

2.2.4 有符号数和无符号数之间的转换 49

2.2.5 C语言中的有符号数与无符号数 52

2.2.6 扩展一个数字的位表示 54

2.2.7 截断数字 56

2.2.8 关于有符号数与无符号数的建议 58

2.3 整数运算 60

2.3.1 无符号加法 60

2.3.2 补码加法 62

2.3.3 补码的非 66

2.3.4 无符号乘法 67

2.3.5 补码乘法 67

2.3.6 乘以常数 70

2.3.7 除以2的幂 71

2.3.8 关于整数运算的最后思考 74

2.4 浮点数 75

2.4.1 二进制小数 76

2.4.2 IEEE浮点表示 78

2.4.3 数字示例 79

2.4.4 舍入 83

2.4.5 浮点运算 85

2.4.6 C语言中的浮点数 86

2.5 小结 87

参考文献说明 88

家庭作业 88

练习题答案 97

第3章 程序的机器级表示 109

3.1 历史观点 110

3.2 程序编码 113

3.2.1 机器级代码 113

3.2.2 代码示例 114

3.2.3 关于格式的注解 117

3.3 数据格式 119

3.4 访问信息 119

3.4.1 操作数指示符 121

3.4.2 数据传送指令 122

3.4.3 数据传送示例 125

3.4.4 压入和弹出栈数据 127

3.5 算术和逻辑操作 128

3.5.1 加载有效地址 129

3.5.2 一元和二元操作 130

3.5.3 移位操作 131

3.5.4 讨论 131

3.5.5 特殊的算术操作 133

3.6 控制 135

3.6.1 条件码 135

3.6.2 访问条件码 136

3.6.3 跳转指令 138

3.6.4 跳转指令的编码 139

3.6.5 用条件控制来实现条件分支 141

3.6.6 用条件传送来实现条件分支 145

3.6.7 循环 149

3.6.8 switch语句 159

3.7 过程 164

3.7.1 运行时栈 164

3.7.2 转移控制 165

3.7.3 数据传送 168

3.7.4 栈上的局部存储 170

3.7.5 寄存器中的局部存储空间 172

3.7.6 递归过程 174

3.8 数组分配和访问 176

3.8.1 基本原则 176

3.8.2 指针运算 177

3.8.3 嵌套的数组 178

3.8.4 定长数组 179

3.8.5 变长数组 181

3.9 异质的数据结构 183

3.9.1 结构 183

3.9.2 联合 186

3.9.3 数据对齐 189

3.10 在机器级程序中将控制与数据结合起来 192

3.10.1 理解指针 192

3.10.2 应用:使用GDB调试器 193

3.10.3 内存越界引用和缓冲区溢出 194

3.10.4 对抗缓冲区溢出攻击 198

3.10.5 支持变长栈帧 201

3.11 浮点代码 204

3.11.1 浮点传送和转换操作 205

3.11.2 过程中的浮点代码 209

3.11.3 浮点运算操作 210

3.11.4 定义和使用浮点常数 212

3.11.5 在浮点代码中使用位级操作 212

3.11.6 浮点比较操作 213

3.11.7 对浮点代码的观察结论 215

3.12 小结 216

参考文献说明 216

家庭作业 216

练习题答案 226

第4章 处理器体系结构 243

4.1 Y86-64指令集体系结构 245

4.1.1 程序员可见的状态 245

4.1.2 Y86-64指令 245

4.1.3 指令编码 246

4.1.4 Y86-64异常 250

4.1.5 Y86-64程序 251

4.1.6 一些Y86-64指令的详情 255

4.2 逻辑设计和硬件控制语言HCL 256

4.2.1 逻辑门 257

4.2.2 组合电路和HCL布尔表达式 257

4.2.3 字级的组合电路和HCL整数表达式 258

4.2.4 集合关系 261

4.2.5 存储器和时钟 262

4.3 Y86-64的顺序实现 264

4.3.1 将处理组织成阶段 264

4.3.2 SEQ硬件结构 272

4.3.3 SEQ的时序 274

4.3.4 SEQ阶段的实现 277

4.4 流水线的通用原理 282

4.4.1 计算流水线 282

4.4.2 流水线操作的详细说明 284

4.4.3 流水线的局限性 284

4.4.4 带反馈的流水线系统 287

4.5 Y86-64的流水线实现 288

4.5.1 SEQ-:重新安排计算阶段 288

4.5.2 插入流水线寄存器 289

4.5.3 对信号进行重新排列和标号 292

4.5.4 预测下一个PC 293

4.5.5 流水线冒险 295

4.5.6 异常处理 306

4.5.7 PIPE各阶段的实现 308

4.5.8 流水线控制逻辑 314

4.5.9 性能分析 322

4.5.10 未完成的工作 323

4.6 小结 325

参考文献说明 326

家庭作业 327

练习题答案 331

第5章 优化程序性能 341

5.1 优化编译器的能力和局限性 342

5.2 表示程序性能 345

5.3 程序示例 347

5.4 消除循环的低效率 350

5.5 减少过程调用 353

5.6 消除不必要的内存引用 354

5.7 理解现代处理器 357

5.7.1 整体操作 357

5.7.2 功能单元的性能 361

5.7.3 处理器操作的抽象模型 362

5.8 循环展开 366

5.9 提高并行性 369

5.9.1 多个累积变量 370

5.9.2 重新结合变换 373

5.10 优化合并代码的结果小结 377

5.11 一些限制因素 378

5.11.1 寄存器溢出 378

5.11.2 分支预测和预测错误处罚 379

5.12 理解内存性能 382

5.12.1 加载的性能 382

5.12.2 存储的性能 383

5.13 应用:性能提高技术 387

5.14 确认和消除性能瓶颈 388

5.14.1 程序剖析 388

5.14.2 使用剖析程序来指导优化 390

5.15 小结 392

参考文献说明 393

家庭作业 393

练习题答案 395

第6章 存储器层次结构 399

6.1 存储技术 399

6.1.1 随机访问存储器 400

6.1.2 磁盘存储 406

6.1.3 固态硬盘 414

6.1.4 存储技术趋势 415

6.2 局部性 418

6.2.1 对程序数据引用的局部性 418

6.2.2 取指令的局部性 419

6.2.3 局部性小结 420

6.3 存储器层次结构 421

6.3.1 存储器层次结构中的缓存 422

6.3.2 存储器层次结构概念小结 424

6.4 高速缓存存储器 425

6.4.1 通用的高速缓存存储器组织结构 425

6.4.2 直接映射高速缓存 427

6.4.3 组相联高速缓存 433

6.4.4 全相联高速缓存 434

6.4.5 有关写的问题 437

6.4.6 一个真实的高速缓存层次结构的解剖 438

6.4.7 高速缓存参数的性能影响 439

6.5 编写高速缓存友好的代码 440

6.6 综合:高速缓存对程序性能的影响 444

6.6.1 存储器山 444

6.6.2 重新排列循环以提高空间局部性 447

6.6.3 在程序中利用局部性 450

6.7 小结 450

参考文献说明 451

家庭作业 451

练习题答案 459

第二部分 在系统上运行程序 464

第7章 链接 464

7.1 编译器驱动程序 465

7.2 静态链接 466

7.3 目标文件 466

7.4 可重定位目标文件 467

7.5 符号和符号表 468

7.6 符号解析 470

7.6.1 链接器如何解析多重定义的全局符号 471

7.6.2 与静态库链接 475

7.6.3 链接器如何使用静态库来解析引用 477

7.7 重定位 478

7.7.1 重定位条目 479

7.7.2 重定位符号引用 479

7.8 可执行目标文件 483

7.9 加载可执行目标文件 484

7.10 动态链接共享库 485

7.11 从应用程序中加载和链接共享库 487

7.12 位置无关代码 489

7.13 库打桩机制 492

7.13.1 编译时打桩 492

7.13.2 链接时打桩 492

7.13.3 运行时打桩 494

7.14 处理目标文件的工具 496

7.15 小结 496

参考文献说明 497

家庭作业 497

练习题答案 499

第8章 异常控制流 501

8.1 异常 502

8.1.1 异常处理 503

8.1.2 异常的类别 504

8.1.3 Linux/x86-64系统中的异常 505

8.2 进程 508

8.2.1 逻辑控制流 508

8.2.2 并发流 509

8.2.3 私有地址空间 509

8.2.4 用户模式和内核模式 510

8.2.5 上下文切换 511

8.3 系统调用错误处理 512

8.4 进程控制 513

8.4.1 获取进程ID 513

8.4.2 创建和终止进程 513

8.4.3 回收子进程 516

8.4.4 让进程休眠 521

8.4.5 加载并运行程序 521

8.4.6 利用fork和execve运行程序 524

8.5 信号 526

8.5.1 信号术语 527

8.5.2 发送信号 528

8.5.3 接收信号 531

8.5.4 阻塞和解除阻塞信号 532

8.5.5 编写信号处理程序 533

8.5.6 同步流以避免讨厌的并发错误 540

8.5.7 显式地等待信号 543

8.6 非本地跳转 546

8.7 操作进程的工具 550

8.8 小结 550

参考文献说明 550

家庭作业 550

练习题答案 556

第9章 虚拟内存 559

9.1 物理和虚拟寻址 560

9.2 地址空间 560

9.3 虚拟内存作为缓存的工具 561

9.3.1 DRAM缓存的组织结构 562

9.3.2 页表 562

9.3.3 页命中 563

9.3.4 缺页 564

9.3.5 分配页面 565

9.3.6 又是局部性救了我们 565

9.4 虚拟内存作为内存管理的工具 565

9.5 虚拟内存作为内存保护的工具 567

9.6 地址翻译 567

9.6.1 结合高速缓存和虚拟内存 570

9.6.2 利用TLB加速地址翻译 570

9.6.3 多级页表 571

9.6.4 综合:端到端的地址翻译 573

9.7 案例研究:Intel Core i7/Linux内存系统 576

9.7.1 Core i7地址翻译 576

9.7.2 Linux虚拟内存系统 580

9.8 内存映射 582

9.8.1 再看共享对象 583

9.8.2 再看fork函数 584

9.8.3 再看execve函数 584

9.8.4 使用mmap函数的用户级内存映射 585

9.9 动态内存分配 587

9.9.1 malloc和free函数 587

9.9.2 为什么要使用动态内存分配 589

9.9.3 分配器的要求和目标 590

9.9.4 碎片 591

9.9.5 实现问题 592

9.9.6 隐式空闲链表 592

9.9.7 放置已分配的块 593

9.9.8 分割空闲块 594

9.9.9 获取额外的堆内存 594

9.9.10 合并空闲块 594

9.9.11 带边界标记的合并 595

9.9.12 综合:实现一个简单的分配器 597

9.9.13 显式空闲链表 603

9.9.14 分离的空闲链表 604

9.10 垃圾收集 605

9.10.1 垃圾收集器的基本知识 606

9.10.2 Mark&Sweep垃圾收集器 607

9.10.3 C程序的保守Mark&Sweep 608

9.11 C程序中常见的与内存有关的错误 609

9.11.1 间接引用坏指针 609

9.11.2 读未初始化的内存 609

9.11.3 允许栈缓冲区溢出 610

9.11.4 假设指针和它们指向的对象是相同大小的 610

9.11.5 造成错位错误 611

9.11.6 引用指针,而不是它所指向的对象 611

9.11.7 误解指针运算 611

9.11.8 引用不存在的变量 612

9.11.9 引用空闲堆块中的数据 612

9.11.10 引起内存泄漏 613

9.12 小结 613

参考文献说明 613

家庭作业 614

练习题答案 617

第三部分 程序间的交互和通信 622

第10章 系统级I/O 622

10.1 Unix I/O 622

10.2 文件 623

10.3 打开和关闭文件 624

10.4 读和写文件 625

10.5 用RIO包健壮地读写 626

10.5.1 RIO的无缓冲的输入输出函数 627

10.5.2 RIO的带缓冲的输入函数 627

10.6 读取文件元数据 632

10.7 读取目录内容 633

10.8 共享文件 634

10.9 I/O重定向 637

10.10 标准I/O 638

10.11 综合:我该使用哪些I/O函数? 638

10.12 小结 640

参考文献说明 640

家庭作业 640

练习题答案 641

第11章 网络编程 642

11.1 客户端-服务器编程模型 642

11.2 网络 643

11.3 全球IP因特网 646

11.3.1 IP地址 647

11.3.2 因特网域名 649

11.3.3 因特网连接 651

11.4 套接字接口 652

11.4.1 套接字地址结构 653

11.4.2 socket函数 654

11.4.3 connect函数 654

11.4.4 bind函数 654

11.4.5 listen函数 655

11.4.6 accept函数 655

11.4.7 主机和服务的转换 656

11.4.8 套接字接口的辅助函数 660

11.4.9 echo客户端和服务器的示例 662

11.5 Web服务器 665

11.5.1 Web基础 665

11.5.2 Web内容 666

11.5.3 HTTP事务 667

11.5.4 服务动态内容 669

11.6 综合:TINY Web服务器 671

11.7 小结 678

参考文献说明 678

家庭作业 678

练习题答案 679

第12章 并发编程 681

12.1 基于进程的并发编程 682

12.1.1 基于进程的并发服务器 683

12.1.2 进程的优劣 684

12.2 基于I/O多路复用的并发编程 684

12.2.1 基于I/O多路复用的并发事件驱动服务器 686

12.2.2 I/O多路复用技术的优劣 690

12.3 基于线程的并发编程 691

12.3.1 线程执行模型 691

12.3.2 Posix线程 691

12.3.3 创建线程 692

12.3.4 终止线程 693

12.3.5 回收已终止线程的资源 693

12.3.6 分离线程 694

12.3.7 初始化线程 694

12.3.8 基于线程的并发服务器 694

12.4 多线程程序中的共享变量 696

12.4.1 线程内存模型 696

12.4.2 将变量映射到内存 697

12.4.3 共享变量 698

12.5 用信号量同步线程 698

12.5.1 进度图 701

12.5.2 信号量 702

12.5.3 使用信号量来实现互斥 703

12.5.4 利用信号量来调度共享资源 704

12.5.5 综合:基于预线程化的并发服务器 708

12.6 使用线程提高并行性 710

12.7 其他并发问题 716

12.7.1 线程安全 716

12.7.2 可重入性 717

12.7.3 在线程化的程序中使用已存在的库函数 718

12.7.4 竞争 719

12.7.5 死锁 721

12.8 小结 722

参考文献说明 723

家庭作业 723

练习题答案 726

附录A 错误处理 729

参考文献 733