第1章 计算机系统漫游 1
1.1 信息就是位+上下文 1
1.2 程序被其他程序翻译成不同的格式 3
1.3 了解编译系统如何工作是大有益处的 4
1.4 处理器读并解释储存在内存中的指令 5
1.4.1 系统的硬件组成 5
1.4.2 运行hello程序 7
1.5 高速缓存至关重要 9
1.6 存储设备形成层次结构 9
1.7 操作系统管理硬件 10
1.7.1 进程 11
1.7.2 线程 12
1.7.3 虚拟内存 12
1.7.4 文件 14
1.8 系统之间利用网络通信 14
1.9 重要主题 16
1.9.1 Amdahl定律 16
1.9.2 并发和并行 17
1.9.3 计算机系统中抽象的重要性 19
1.10 小结 20
参考文献说明 20
练习题答案 20
第一部分 程序结构和执行 22
第2章 信息的表示和处理 22
2.1 信息存储 24
2.1.1 十六进制表示法 25
2.1.2 字数据大小 27
2.1.3 寻址和字节顺序 29
2.1.4 表示字符串 34
2.1.5 表示代码 34
2.1.6 布尔代数简介 35
2.1.7 C语言中的位级运算 37
2.1.8 C语言中的逻辑运算 39
2.1.9 C语言中的移位运算 40
2.2 整数表示 41
2.2.1 整型数据类型 42
2.2.2 无符号数的编码 43
2.2.3 补码编码 44
2.2.4 有符号数和无符号数之间的转换 49
2.2.5 C语言中的有符号数与无符号数 52
2.2.6 扩展一个数字的位表示 54
2.2.7 截断数字 56
2.2.8 关于有符号数与无符号数的建议 58
2.3 整数运算 60
2.3.1 无符号加法 60
2.3.2 补码加法 62
2.3.3 补码的非 66
2.3.4 无符号乘法 67
2.3.5 补码乘法 67
2.3.6 乘以常数 70
2.3.7 除以2的幂 71
2.3.8 关于整数运算的最后思考 74
2.4 浮点数 75
2.4.1 二进制小数 76
2.4.2 IEEE浮点表示 78
2.4.3 数字示例 79
2.4.4 舍入 83
2.4.5 浮点运算 85
2.4.6 C语言中的浮点数 86
2.5 小结 87
参考文献说明 88
家庭作业 88
练习题答案 97
第3章 程序的机器级表示 109
3.1 历史观点 110
3.2 程序编码 113
3.2.1 机器级代码 113
3.2.2 代码示例 114
3.2.3 关于格式的注解 117
3.3 数据格式 119
3.4 访问信息 119
3.4.1 操作数指示符 121
3.4.2 数据传送指令 122
3.4.3 数据传送示例 125
3.4.4 压入和弹出栈数据 127
3.5 算术和逻辑操作 128
3.5.1 加载有效地址 129
3.5.2 一元和二元操作 130
3.5.3 移位操作 131
3.5.4 讨论 131
3.5.5 特殊的算术操作 133
3.6 控制 135
3.6.1 条件码 135
3.6.2 访问条件码 136
3.6.3 跳转指令 138
3.6.4 跳转指令的编码 139
3.6.5 用条件控制来实现条件分支 141
3.6.6 用条件传送来实现条件分支 145
3.6.7 循环 149
3.6.8 switch语句 159
3.7 过程 164
3.7.1 运行时栈 164
3.7.2 转移控制 165
3.7.3 数据传送 168
3.7.4 栈上的局部存储 170
3.7.5 寄存器中的局部存储空间 172
3.7.6 递归过程 174
3.8 数组分配和访问 176
3.8.1 基本原则 176
3.8.2 指针运算 177
3.8.3 嵌套的数组 178
3.8.4 定长数组 179
3.8.5 变长数组 181
3.9 异质的数据结构 183
3.9.1 结构 183
3.9.2 联合 186
3.9.3 数据对齐 189
3.10 在机器级程序中将控制与数据结合起来 192
3.10.1 理解指针 192
3.10.2 应用:使用GDB调试器 193
3.10.3 内存越界引用和缓冲区溢出 194
3.10.4 对抗缓冲区溢出攻击 198
3.10.5 支持变长栈帧 201
3.11 浮点代码 204
3.11.1 浮点传送和转换操作 205
3.11.2 过程中的浮点代码 209
3.11.3 浮点运算操作 210
3.11.4 定义和使用浮点常数 212
3.11.5 在浮点代码中使用位级操作 212
3.11.6 浮点比较操作 213
3.11.7 对浮点代码的观察结论 215
3.12 小结 216
参考文献说明 216
家庭作业 216
练习题答案 226
第4章 处理器体系结构 243
4.1 Y86-64指令集体系结构 245
4.1.1 程序员可见的状态 245
4.1.2 Y86-64指令 245
4.1.3 指令编码 246
4.1.4 Y86-64异常 250
4.1.5 Y86-64程序 251
4.1.6 一些Y86-64指令的详情 255
4.2 逻辑设计和硬件控制语言HCL 256
4.2.1 逻辑门 257
4.2.2 组合电路和HCL布尔表达式 257
4.2.3 字级的组合电路和HCL整数表达式 258
4.2.4 集合关系 261
4.2.5 存储器和时钟 262
4.3 Y86-64的顺序实现 264
4.3.1 将处理组织成阶段 264
4.3.2 SEQ硬件结构 272
4.3.3 SEQ的时序 274
4.3.4 SEQ阶段的实现 277
4.4 流水线的通用原理 282
4.4.1 计算流水线 282
4.4.2 流水线操作的详细说明 284
4.4.3 流水线的局限性 284
4.4.4 带反馈的流水线系统 287
4.5 Y86-64的流水线实现 288
4.5.1 SEQ-:重新安排计算阶段 288
4.5.2 插入流水线寄存器 289
4.5.3 对信号进行重新排列和标号 292
4.5.4 预测下一个PC 293
4.5.5 流水线冒险 295
4.5.6 异常处理 306
4.5.7 PIPE各阶段的实现 308
4.5.8 流水线控制逻辑 314
4.5.9 性能分析 322
4.5.10 未完成的工作 323
4.6 小结 325
参考文献说明 326
家庭作业 327
练习题答案 331
第5章 优化程序性能 341
5.1 优化编译器的能力和局限性 342
5.2 表示程序性能 345
5.3 程序示例 347
5.4 消除循环的低效率 350
5.5 减少过程调用 353
5.6 消除不必要的内存引用 354
5.7 理解现代处理器 357
5.7.1 整体操作 357
5.7.2 功能单元的性能 361
5.7.3 处理器操作的抽象模型 362
5.8 循环展开 366
5.9 提高并行性 369
5.9.1 多个累积变量 370
5.9.2 重新结合变换 373
5.10 优化合并代码的结果小结 377
5.11 一些限制因素 378
5.11.1 寄存器溢出 378
5.11.2 分支预测和预测错误处罚 379
5.12 理解内存性能 382
5.12.1 加载的性能 382
5.12.2 存储的性能 383
5.13 应用:性能提高技术 387
5.14 确认和消除性能瓶颈 388
5.14.1 程序剖析 388
5.14.2 使用剖析程序来指导优化 390
5.15 小结 392
参考文献说明 393
家庭作业 393
练习题答案 395
第6章 存储器层次结构 399
6.1 存储技术 399
6.1.1 随机访问存储器 400
6.1.2 磁盘存储 406
6.1.3 固态硬盘 414
6.1.4 存储技术趋势 415
6.2 局部性 418
6.2.1 对程序数据引用的局部性 418
6.2.2 取指令的局部性 419
6.2.3 局部性小结 420
6.3 存储器层次结构 421
6.3.1 存储器层次结构中的缓存 422
6.3.2 存储器层次结构概念小结 424
6.4 高速缓存存储器 425
6.4.1 通用的高速缓存存储器组织结构 425
6.4.2 直接映射高速缓存 427
6.4.3 组相联高速缓存 433
6.4.4 全相联高速缓存 434
6.4.5 有关写的问题 437
6.4.6 一个真实的高速缓存层次结构的解剖 438
6.4.7 高速缓存参数的性能影响 439
6.5 编写高速缓存友好的代码 440
6.6 综合:高速缓存对程序性能的影响 444
6.6.1 存储器山 444
6.6.2 重新排列循环以提高空间局部性 447
6.6.3 在程序中利用局部性 450
6.7 小结 450
参考文献说明 451
家庭作业 451
练习题答案 459
第二部分 在系统上运行程序 464
第7章 链接 464
7.1 编译器驱动程序 465
7.2 静态链接 466
7.3 目标文件 466
7.4 可重定位目标文件 467
7.5 符号和符号表 468
7.6 符号解析 470
7.6.1 链接器如何解析多重定义的全局符号 471
7.6.2 与静态库链接 475
7.6.3 链接器如何使用静态库来解析引用 477
7.7 重定位 478
7.7.1 重定位条目 479
7.7.2 重定位符号引用 479
7.8 可执行目标文件 483
7.9 加载可执行目标文件 484
7.10 动态链接共享库 485
7.11 从应用程序中加载和链接共享库 487
7.12 位置无关代码 489
7.13 库打桩机制 492
7.13.1 编译时打桩 492
7.13.2 链接时打桩 492
7.13.3 运行时打桩 494
7.14 处理目标文件的工具 496
7.15 小结 496
参考文献说明 497
家庭作业 497
练习题答案 499
第8章 异常控制流 501
8.1 异常 502
8.1.1 异常处理 503
8.1.2 异常的类别 504
8.1.3 Linux/x86-64系统中的异常 505
8.2 进程 508
8.2.1 逻辑控制流 508
8.2.2 并发流 509
8.2.3 私有地址空间 509
8.2.4 用户模式和内核模式 510
8.2.5 上下文切换 511
8.3 系统调用错误处理 512
8.4 进程控制 513
8.4.1 获取进程ID 513
8.4.2 创建和终止进程 513
8.4.3 回收子进程 516
8.4.4 让进程休眠 521
8.4.5 加载并运行程序 521
8.4.6 利用fork和execve运行程序 524
8.5 信号 526
8.5.1 信号术语 527
8.5.2 发送信号 528
8.5.3 接收信号 531
8.5.4 阻塞和解除阻塞信号 532
8.5.5 编写信号处理程序 533
8.5.6 同步流以避免讨厌的并发错误 540
8.5.7 显式地等待信号 543
8.6 非本地跳转 546
8.7 操作进程的工具 550
8.8 小结 550
参考文献说明 550
家庭作业 550
练习题答案 556
第9章 虚拟内存 559
9.1 物理和虚拟寻址 560
9.2 地址空间 560
9.3 虚拟内存作为缓存的工具 561
9.3.1 DRAM缓存的组织结构 562
9.3.2 页表 562
9.3.3 页命中 563
9.3.4 缺页 564
9.3.5 分配页面 565
9.3.6 又是局部性救了我们 565
9.4 虚拟内存作为内存管理的工具 565
9.5 虚拟内存作为内存保护的工具 567
9.6 地址翻译 567
9.6.1 结合高速缓存和虚拟内存 570
9.6.2 利用TLB加速地址翻译 570
9.6.3 多级页表 571
9.6.4 综合:端到端的地址翻译 573
9.7 案例研究:Intel Core i7/Linux内存系统 576
9.7.1 Core i7地址翻译 576
9.7.2 Linux虚拟内存系统 580
9.8 内存映射 582
9.8.1 再看共享对象 583
9.8.2 再看fork函数 584
9.8.3 再看execve函数 584
9.8.4 使用mmap函数的用户级内存映射 585
9.9 动态内存分配 587
9.9.1 malloc和free函数 587
9.9.2 为什么要使用动态内存分配 589
9.9.3 分配器的要求和目标 590
9.9.4 碎片 591
9.9.5 实现问题 592
9.9.6 隐式空闲链表 592
9.9.7 放置已分配的块 593
9.9.8 分割空闲块 594
9.9.9 获取额外的堆内存 594
9.9.10 合并空闲块 594
9.9.11 带边界标记的合并 595
9.9.12 综合:实现一个简单的分配器 597
9.9.13 显式空闲链表 603
9.9.14 分离的空闲链表 604
9.10 垃圾收集 605
9.10.1 垃圾收集器的基本知识 606
9.10.2 Mark&Sweep垃圾收集器 607
9.10.3 C程序的保守Mark&Sweep 608
9.11 C程序中常见的与内存有关的错误 609
9.11.1 间接引用坏指针 609
9.11.2 读未初始化的内存 609
9.11.3 允许栈缓冲区溢出 610
9.11.4 假设指针和它们指向的对象是相同大小的 610
9.11.5 造成错位错误 611
9.11.6 引用指针,而不是它所指向的对象 611
9.11.7 误解指针运算 611
9.11.8 引用不存在的变量 612
9.11.9 引用空闲堆块中的数据 612
9.11.10 引起内存泄漏 613
9.12 小结 613
参考文献说明 613
家庭作业 614
练习题答案 617
第三部分 程序间的交互和通信 622
第10章 系统级I/O 622
10.1 Unix I/O 622
10.2 文件 623
10.3 打开和关闭文件 624
10.4 读和写文件 625
10.5 用RIO包健壮地读写 626
10.5.1 RIO的无缓冲的输入输出函数 627
10.5.2 RIO的带缓冲的输入函数 627
10.6 读取文件元数据 632
10.7 读取目录内容 633
10.8 共享文件 634
10.9 I/O重定向 637
10.10 标准I/O 638
10.11 综合:我该使用哪些I/O函数? 638
10.12 小结 640
参考文献说明 640
家庭作业 640
练习题答案 641
第11章 网络编程 642
11.1 客户端-服务器编程模型 642
11.2 网络 643
11.3 全球IP因特网 646
11.3.1 IP地址 647
11.3.2 因特网域名 649
11.3.3 因特网连接 651
11.4 套接字接口 652
11.4.1 套接字地址结构 653
11.4.2 socket函数 654
11.4.3 connect函数 654
11.4.4 bind函数 654
11.4.5 listen函数 655
11.4.6 accept函数 655
11.4.7 主机和服务的转换 656
11.4.8 套接字接口的辅助函数 660
11.4.9 echo客户端和服务器的示例 662
11.5 Web服务器 665
11.5.1 Web基础 665
11.5.2 Web内容 666
11.5.3 HTTP事务 667
11.5.4 服务动态内容 669
11.6 综合:TINY Web服务器 671
11.7 小结 678
参考文献说明 678
家庭作业 678
练习题答案 679
第12章 并发编程 681
12.1 基于进程的并发编程 682
12.1.1 基于进程的并发服务器 683
12.1.2 进程的优劣 684
12.2 基于I/O多路复用的并发编程 684
12.2.1 基于I/O多路复用的并发事件驱动服务器 686
12.2.2 I/O多路复用技术的优劣 690
12.3 基于线程的并发编程 691
12.3.1 线程执行模型 691
12.3.2 Posix线程 691
12.3.3 创建线程 692
12.3.4 终止线程 693
12.3.5 回收已终止线程的资源 693
12.3.6 分离线程 694
12.3.7 初始化线程 694
12.3.8 基于线程的并发服务器 694
12.4 多线程程序中的共享变量 696
12.4.1 线程内存模型 696
12.4.2 将变量映射到内存 697
12.4.3 共享变量 698
12.5 用信号量同步线程 698
12.5.1 进度图 701
12.5.2 信号量 702
12.5.3 使用信号量来实现互斥 703
12.5.4 利用信号量来调度共享资源 704
12.5.5 综合:基于预线程化的并发服务器 708
12.6 使用线程提高并行性 710
12.7 其他并发问题 716
12.7.1 线程安全 716
12.7.2 可重入性 717
12.7.3 在线程化的程序中使用已存在的库函数 718
12.7.4 竞争 719
12.7.5 死锁 721
12.8 小结 722
参考文献说明 723
家庭作业 723
练习题答案 726
附录A 错误处理 729
参考文献 733