第1章 计算机系统漫游 1
1.1 信息就是位+上下文 1
1.2 程序被其他程序翻译成不同的格式 3
1.3 了解编译系统如何工作是大有益处的 4
1.4 处理器读并解释存储在存储器中的指令 5
1.4.1 系统的硬件组成 5
1.4.2 运行hello程序 7
1.5 高速缓存至关重要 7
1.6 存储设备形成层次结构 9
1.7 操作系统管理硬件 10
1.7.1 进程 11
1.7.2 线程 12
1.7.3 虚拟存储器 12
1.7.4 文件 13
1.8 系统之间利用网络通信 13
1.9 重要主题 15
1.9.1 并发和并行 15
1.9.2 计算机系统中抽象的重要性 17
1.10 小结 17
参考文献说明 18
第一部分 程序结构和执行 20
第2章 信息的表示和处理 20
2.1 信息存储 22
2.1.1 十六进制表示法 22
2.1.2 字 25
2.1.3 数据大小 25
2.1.4 寻址和字节顺序 26
2.1.5 表示字符串 31
2.1.6 表示代码 31
2.1.7 布尔代数简介 32
2.1.8 C语言中的位级运算 34
2.1.9 C语言中的逻辑运算 36
2.1.10 C语言中的移位运算 36
2.2 整数表示 38
2.2.1 整型数据类型 38
2.2.2 无符号数的编码 39
2.2.3 补码编码 40
2.2.4 有符号数和无符号数之间的转换 44
2.2.5 C语言中的有符号数与无符号数 47
2.2.6 扩展一个数字的位表示 49
2.2.7 截断数字 51
2.2.8 关于有符号数与无符号数的建议 52
2.3 整数运算 54
2.3.1 无符号加法 54
2.3.2 补码加法 57
2.3.3 补码的非 59
2.3.4 无符号乘法 60
2.3.5 补码乘法 60
2.3.6 乘以常数 63
2.3.7 除以2的幂 64
2.3.8 关于整数运算的最后思考 67
2.4 浮点数 67
2.4.1 二进制小数 68
2.4.2 IEEE浮点表示 70
2.4.3 数字示例 71
2.4.4 舍入 74
2.4.5 浮点运算 76
2.4.6 C语言中的浮点数 77
2.5 小结 79
参考文献说明 80
家庭作业 80
练习题答案 90
第3章 程序的机器级表示 102
3.1 历史观点 103
3.2 程序编码 105
3.2.1 机器级代码 106
3.2.2 代码示例 107
3.2.3 关于格式的注解 109
3.3 数据格式 111
3.4 访问信息 112
3.4.1 操作数指示符 112
3.4.2 数据传送指令 114
3.4.3 数据传送示例 116
3.5 算术和逻辑操作 118
3.5.1 加载有效地址 118
3.5.2 一元操作和二元操作 119
3.5.3 移位操作 120
3.5.4 讨论 120
3.5.5 特殊的算术操作 122
3.6 控制 123
3.6.1 条件码 124
3.6.2 访问条件码 125
3.6.3 跳转指令及其编码 127
3.6.4 翻译条件分支 129
3.6.5 循环 132
3.6.6 条件传送指令 139
3.6.7 switch语句 144
3.7 过程 149
3.7.1 栈帧结构 149
3.7.2 转移控制 150
3.7.3 寄存器使用惯例 151
3.7.4 过程示例 152
3.7.5 递归过程 156
3.8 数组分配和访问 158
3.8.1 基本原则 158
3.8.2 指针运算 159
3.8.3 嵌套的数组 159
3.8.4 定长数组 161
3.8.5 变长数组 163
3.9 异质的数据结构 164
3.9.1 结构 164
3.9.2 联合 167
3.9.3 数据对齐 170
3.10 综合:理解指针 172
3.11 应用:使用GDB调试器 174
3.12 存储器的越界引用和缓冲区溢出 175
3.13 x86-64:将IA32扩展到64位 183
3.13.1 x86-64的历史和动因 184
3.13.2 x86-64简介 185
3.13.3 访问信息 187
3.13.4 控制 192
3.13.5 数据结构 200
3.13.6 关于x86-64的总结性评论 200
3.14 浮点程序的机器级表示 201
3.15 小结 201
参考文献说明 202
家庭作业 202
练习题答案 212
第4章 处理器体系结构 230
4.1 Y86指令集体系结构 231
4.1.1 程序员可见的状态 231
4.1.2 Y86指令 232
4.1.3 指令编码 233
4.1.4 Y86异常 237
4.1.5 Y86程序 237
4.1.6 一些Y86指令的详情 241
4.2 逻辑设计和硬件控制语言HCL 242
4.2.1 逻辑门 243
4.2.2 组合电路和HCL布尔表达式 243
4.2.3 字级的组合电路和HCL整数表达式 245
4.2.4 集合关系 248
4.2.5 存储器和时钟 248
4.3 Y86的顺序实现 250
4.3.1 将处理组织成阶段 250
4.3.2 SEQ硬件结构 258
4.3.3 SEQ的时序 259
4.3.4 SEQ阶段的实现 262
4.4 流水线的通用原理 267
4.4.1 计算流水线 268
4.4.2 流水线操作的详细说明 269
4.4.3 流水线的局限性 271
4.4.4 带反馈的流水线系统 272
4.5 Y86的流水线实现 273
4.5.1 SEQ+:重新安排计算阶段 273
4.5.2 插入流水线寄存器 276
4.5.3 对信号进行重新排列和标号 277
4.5.4 预测下一个PC 279
4.5.5 流水线冒险 280
4.5.6 用暂停来避免数据冒险 283
4.5.7 用转发来避免数据冒险 284
4.5.8 加载/使用数据冒险 288
4.5.9 异常处理 289
4.5.10 PIPE各阶段的实现 291
4.5.11 流水线控制逻辑 296
4.5.12 性能分析 305
4.5.13 未完成的工作 306
4.6 小结 308
参考文献说明 309
家庭作业 309
练习题答案 314
第5章 优化程序性能 324
5.1 优化编译器的能力和局限性 325
5.2 表示程序性能 328
5.3 程序示例 330
5.4 消除循环的低效率 332
5.5 减少过程调用 336
5.6 消除不必要的存储器引用 336
5.7 理解现代处理器 340
5.7.1 整体操作 340
5.7.2 功能单元的性能 343
5.7.3 处理器操作的抽象模型 344
5.8 循环展开 348
5.9 提高并行性 351
5.9.1 多个累积变量 351
5.9.2 重新结合变换 354
5.10 优化合并代码的结果小结 358
5.11 一些限制因素 359
5.11.1 寄存器溢出 359
5.11.2 分支预测和预测错误处罚 360
5.12 理解存储器性能 363
5.12.1 加载的性能 363
5.12.2 存储的性能 364
5.13 应用:性能提高技术 369
5.14 确认和消除性能瓶颈 369
5.14.1 程序剖析 370
5.14.2 使用剖析程序来指导优化 371
5.14.3 Amdahl定律 374
5.15 小结 375
参考文献说明 375
家庭作业 376
练习题答案 378
第6章 存储器层次结构 382
6.1 存储技术 382
6.1.1 随机访问存储器 383
6.1.2 磁盘存储 389
6.1.3 固态硬盘 398
6.1.4 存储技术趋势 399
6.2 局部性 401
6.2.1 对程序数据引用的局部性 402
6.2.2 取指令的局部性 403
6.2.3 局部性小结 403
6.3 存储器层次结构 405
6.3.1 存储器层次结构中的缓存 406
6.3.2 存储器层次结构概念小结 408
6.4 高速缓存存储器 408
6.4.1 通用的高速缓存存储器结构 409
6.4.2 直接映射高速缓存 410
6.4.3 组相联高速缓存 416
6.4.4 全相联高速缓存 418
6.4.5 有关写的问题 420
6.4.6 一个真实的高速缓存层次结构的解剖 421
6.4.7 高速缓存参数的性能影响 422
6.5 编写高速缓存友好的代码 423
6.6 综合:高速缓存对程序性能的影响 426
6.6.1 存储器山 426
6.6.2 重新排列循环以提高空间局部性 430
6.6.3 在程序中利用局部性 433
6.7 小结 433
参考文献说明 434
家庭作业 434
练习题答案 442
第二部分 在系统上运行程序 448
第7章 链接 448
7.1 编译器驱动程序 449
7.2 静态链接 450
7.3 目标文件 450
7.4 可重定位目标文件 451
7.5 符号和符号表 452
7.6 符号解析 454
7.6.1 链接器如何解析多重定义的全局符号 455
7.6.2 与静态库链接 457
7.6.3 链接器如何使用静态库来解析引用 460
7.7 重定位 461
7.7.1 重定位条目 461
7.7.2 重定位符号引用 462
7.8 可执行目标文件 465
7.9 加载可执行目标文件 466
7.10 动态链接共享库 467
7.11 从应用程序中加载和链接共享库 468
7.12 与位置无关的代码(PIC) 471
7.13 处理目标文件的工具 473
7.14 小结 473
参考文献说明 474
家庭作业 474
练习题答案 479
第8章 异常控制流 480
8.1 异常 481
8.1.1 异常处理 481
8.1.2 异常的类别 482
8.1.3 Linux/IA32系统中的异常 484
8.2 进程 487
8.2.1 逻辑控制流 487
8.2.2 并发流 487
8.2.3 私有地址空间 488
8.2.4 用户模式和内核模式 488
8.2.5 上下文切换 489
8.3 系统调用错误处理 491
8.4 进程控制 492
8.4.1 获取进程ID 492
8.4.2 创建和终止进程 492
8.4.3 回收子进程 495
8.4.4 让进程休眠 499
8.4.5 加载并运行程序 500
8.4.6 利用fork和execve运行程序 502
8.5 信号 504
8.5.1 信号术语 505
8.5.2 发送信号 506
8.5.3 接收信号 509
8.5.4 信号处理问题 511
8.5.5 可移植的信号处理 516
8.5.6 显式地阻塞和取消阻塞信号 517
8.5.7 同步流以避免讨厌的并发错误 517
8.6 非本地跳转 521
8.7 操作进程的工具 524
8.8 小结 524
参考文献说明 525
家庭作业 525
练习题答案 530
第9章 虚拟存储器 534
9.1 物理和虚拟寻址 535
9.2 地址空间 535
9.3 虚拟存储器作为缓存的工具 536
9.3.1 DRAM缓存的组织结构 537
9.3.2 页表 537
9.3.3 页命中 538
9.3.4 缺页 538
9.3.5 分配页面 539
9.3.6 又是局部性救了我们 539
9.4 虚拟存储器作为存储器管理的工具 540
9.5 虚拟存储器作为存储器保护的工具 541
9.6 地址翻译 542
9.6.1 结合高速缓存和虚拟存储器 544
9.6.2 利用TLB加速地址翻译 545
9.6.3 多级页表 546
9.6.4 综合:端到端的地址翻译 547
9.7 案例研究:Intel Core i7/Linux存储器系统 550
9.7.1 Core i7地址翻译 551
9.7.2 Linux虚拟存储器系统 554
9.8 存储器映射 556
9.8.1 再看共享对象 557
9.8.2 再看fork函数 558
9.8.3 再看execve函数 559
9.8.4 使用mmap函数的用户级存储器映射 559
9.9 动态存储器分配 561
9.9.1 malloc和free函数 561
9.9.2 为什么要使用动态存储器分配 563
9.9.3 分配器的要求和目标 564
9.9.4 碎片 565
9.9.5 实现问题 565
9.9.6 隐式空闲链表 565
9.9.7 放置已分配的块 567
9.9.8 分割空闲块 567
9.9.9 获取额外的堆存储器 567
9.9.10 合并空闲块 568
9.9.11 带边界标记的合并 568
9.9.12 综合:实现一个简单的分配器 570
9.9.13 显式空闲链表 576
9.9.14 分离的空闲链表 576
9.10 垃圾收集 578
9.10.1 垃圾收集器的基本知识 579
9.10.2 Mark&Sweep垃圾收集器 580
9.10.3 C程序的保守Mark&Sweep 580
9.11 C程序中常见的与存储器有关的错误 581
9.11.1 间接引用坏指针 582
9.11.2 读未初始化的存储器 582
9.11.3 允许栈缓冲区溢出 582
9.11.4 假设指针和它们指向的对象是相同大小的 583
9.11.5 造成错位错误 583
9.11.6 引用指针,而不是它所指向的对象 583
9.11.7 误解指针运算 584
9.11.8 引用不存在的变量 584
9.11.9 引用空闲堆块中的数据 584
9.11.10 引起存储器泄漏 585
9.12 小结 585
参考文献说明 586
家庭作业 586
练习题答案 589
第三部分 程序间的交互和通信 596
第10章 系统级I/O 596
10.1 Unix I/O 596
10.2 打开和关闭文件 597
10.3 读和写文件 598
10.4 用RIO包健壮地读写 599
10.4.1 RIO的无缓冲的输入输出函数 600
10.4.2 RIO的带缓冲的输入函数 600
10.5 读取文件元数据 604
10.6 共享文件 606
10.7 I/O重定向 608
10.8 标准I/O 609
10.9 综合:我该使用哪些I/O函数 610
10.10 小结 611
参考文献说明 612
家庭作业 612
练习题答案 612
第11章 网络编程 614
11.1 客户端-服务器编程模型 614
11.2 网络 615
11.3 全球IP因特网 618
11.3.1 IP地址 619
11.3.2 因特网域名 620
11.3.3 因特网连接 623
11.4 套接字接口 625
11.4.1 套接字地址结构 625
11.4.2 socket函数 626
11.4.3 connect函数 626
11.4.4 open_clientfd函数 627
11.4.5 bind函数 628
11.4.6 listen函数 628
11.4.7 open listenfd函数 628
11.4.8 accept函数 629
11.4.9 echo客户端和服务器的示例 630
11.5 Web服务器 633
11.5.1 Web基础 633
11.5.2 Web内容 633
11.5.3 HTTP事务 634
11.5.4 服务动态内容 636
11.6 综合:TINY Web服务器 639
11.7 小结 645
参考文献说明 645
家庭作业 646
练习题答案 646
第12章 并发编程 648
12.1 基于进程的并发编程 649
12.1.1 基于进程的并发服务器 649
12.1.2 关于进程的优劣 651
12.2 基于I/O多路复用的并发编程 651
12.2.1 基于I/O多路复用的并发事件驱动服务器 653
12.2.2 I/O多路复用技术的优劣 657
12.3 基于线程的并发编程 657
12.3.1 线程执行模型 657
12.3.2 Posix线程 658
12.3.3 创建线程 659
12.3.4 终止线程 659
12.3.5 回收已终止线程的资源 660
12.3.6 分离线程 660
12.3.7 初始化线程 660
12.3.8 一个基于线程的并发服务器 661
12.4 多线程程序中的共享变量 662
12.4.1 线程存储器模型 663
12.4.2 将变量映射到存储器 663
12.4.3 共享变量 664
12.5 用信号量同步线程 664
12.5.1 进度图 667
12.5.2 信号量 668
12.5.3 使用信号量来实现互斥 669
12.5.4 利用信号量来调度共享资源 670
12.5.5 综合:基于预线程化的并发服务器 674
12.6 使用线程提高并行性 676
12.7 其他并发问题 680
12.7.1 线程安全 680
12.7.2 可重入性 682
12.7.3 在线程化的程序中使用已存在的库函数 682
12.7.4 竞争 683
12.7.5 死锁 685
12.8 小结 687
参考文献说明 687
家庭作业 688
练习题答案 691
附录A 错误处理 694
A.1 Unix系统中的错误处理 694
A.2 错误处理包装函数 696
参考文献 698