

# 合肥工业大学试卷(A)

共 2 页第 1 页

2019~2020 学年第 二 学期 课程代码 0529812B/0529630x 课程名称 计算机体系结构 学分 3 课程性质: 必修 考试形式: 闭卷 系主任:   
专业班级: 17 级计算机、物联网 考试日期: 2020/6/29 命题教师: 李建华 学号: \_\_\_\_\_ 姓名: \_\_\_\_\_ 成绩: \_\_\_\_\_

注意: 所有答案一律写在 A4 纸上, 考试结束前请拍照(尽量清晰), 并导入到 Word 文档中, 然后转成 PDF。(文件命名格式: 计 17x\_学号\_姓名.pdf 或者 物 17x\_学号\_姓名.pdf, “计”表示计算机, “物”表示物联网, “x”表示几班)

## 一、简答题(共30分)

1. 指令流水线的段数是不是越多性能越好? (2 分) 为什么? (4 分)
2. 请简述牺牲缓存(Victim Cache)的工作原理, 并解释其有效性。(6 分)
3. 请简述前瞻执行(Speculative Execution)中重定序缓冲(ROB, Re-Order Buffer)的主要功能。(6 分)  
①寄存器替换; ②为已经处理完成但未提交的指令进行重排序, 确保按序提交, 使预测错误的指令执行的计算结果不会被提交
4. 相比较于 RAID 3, RAID 4 的优点是什么? (3 分) RAID 3 的优点是什么? (3 分)
5. 请画出 MIPS 指令集中 JR 指令的单周期数据通路。JR rs 的语义为: PC = GPR[rs] (6 分)
- 采用 ALUop: 多级控制 - 减小主控端元的规模 - 减小延迟 - 优化时钟周期的长度

## 二、综合应用题(70分)

1. 对于没有旁路机制(Data Forwarding)的 MIPS 5 阶段流水线, 找出下面代码中的数据相关, 并将相关的情况(相关指令对的编号以及相关的类型)列出来。(8 分)

| 编号 | 指令                |
|----|-------------------|
| 1. | add \$3, \$1, \$2 |
| 2. | lw \$1, 0(\$4)    |
| 3. | and \$5, \$3, \$4 |
| 4. | and \$6, \$1, \$2 |
| 5. | or \$1, \$3, \$6  |
| 6. | sw \$1, 4(\$4)    |
| 7. | lw \$2, 4(\$4)    |
| 8. | sub \$3, \$5, \$6 |

RAW-真相关/流相关  
WAR-反相关  
WAW-输出相关

### 2. Amdahl 定律:

描述了提升某个部件性能后总体性能的提升, 整体性能的提升与可加速部分运行时间占比有关, 只对部分进行改进, 提升越多, 最终所获得的加速比越有限, 最终会趋向于  $1/(1-f)$ , 表明了性能提升的上限, 对资源分配提升性能有启发意义。

- (1) 请用自己的语言阐述下 Amdahl 定律。(2 分)
- (2) 一个程序的 75% 的运行时间花费在乘法运算上面。如果将乘法单元加速 3 倍, 可以获得的总的加速比为多少? (3 分)
- (3) 若乘法单元可以获得无限的加速比, 请问该程序能获得的最大的加速比为多少? (3 分)

3. 有一条动态多功能流水线由 5 阶段组成(如下图所示), 加法用 1、3、4、5 阶段, 乘法用 1、2、5 阶段, 第 2 阶段的时间为  $2\Delta t$ , 其余各段时间均为  $\Delta t$ , 而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。若在该流水线上计算  $\sum_{i=1}^4 (A_i \cdot B_i)$ , 试计算其吞吐率、加速比和效率。(10 分)



4. 假设你是一个工程师, 目前有一个流水线处理器, 其时钟周期长度为 10ns。在该处理器上, 你最喜爱的基准程序的平均 CPI 为 1.6。此外, 你知道该基准程序中 10% 的指令为分支指令, 且该处理器中分支预测的精度为 90%, 每个错误的分支预测, 会造成处理器暂停 2 个时钟周期。现在你想通过增加流水线的深度使得时钟周期长度变为 9ns, 但该优化措施会使得错误的分支预测的开销变为 7 个时钟周期。假定其它方面不受影响, 请回答如下问题: 在新的处理器中你喜欢的基准程序能够获得的 CPI 是多少? (4 分) 对于该基准程序, 新的处理器与旧的相比哪个更好? (2 分)

5. 对于 CPU 中的缓存, 请回答: 当采取下面的改变时, 强制性失效以及冲突失效分别会发生什么样的变化? 并给出原因。

- (1) 将相联度增加一倍, 缓存的容量和块大小不变; (3 分) 缓存容量下降, 冲突失效增加, 强制性失效增加, 有用的数据容易被替换, 不能很好地挖掘空间局部性
- (2) 将缓存块大小减半, 缓存的相联度和缓存中组的数量不变; (3 分) 组的数量增加一倍, 相联度减半, 强制性失效不变, 冲突失效增加, 命中率下降
- (3) 将缓存中组的数量增加一倍, 缓存容量和缓存块大小不变。 (3 分) 组的数量增加一倍, 相联度减半, 强制性失效不变, 冲突失效增加, 命中率下降

# 合肥工业大学试卷(A)

共 2 页第 2 页

2019~2020 学年第 二 学期 课程代码 0529812B/0529630x 课程名称 计算机体体系结构 学分 3 课程性质: 必修 考试形式: 闭卷 系主任:   
专业班级: 17 级计算机、物联网 考试日期: 2020/6/29 命题教师: 李建华 学号: \_\_\_\_\_ 姓名: \_\_\_\_\_ 成绩: \_\_\_\_\_

6. 一个具有一层缓存系统并支持虚拟存储器 (virtual memory) 的 MIPS 机器的配置说明如下:

- 1MB 物理地址空间
- 4GB 虚拟地址空间
- 4KB 页面大小
- 16KB 8路组相联缓存, 写直达, LRU替换算法
- 1KB 缓存块大小
- 2个条目的TLB, LRU替换算法

假设下面的代码在该系统上单独运行, 且进程上下文切换被关闭。

```
#define NUM_INTS 8192  
int *A = (int *)malloc(NUM_INTS * sizeof(int)); // malloc 返回地址: 0x100000  
int i, total = 0;  
for(i = 0; i < NUM_INTS; i += 128) A[i] = i;  
for(i = 0; i < NUM_INTS; i += 128) total += A[i]; // 目标代码
```

请根据上面的假设回答如下问题:

- (1) 假定采取字节寻址, 请给出访问缓存的地址划分方案? Tag:Index:Offset (3分) 9: 1: 10
- (2) 假定采用字节寻址, 请给出虚拟存储器的地址划分方案? VPN: Page Offset (3分) 20: 12

对于下面三个问题, 仅考虑标注“目标代码”的行:

- (3) 计算缓存的命中率 (3分)
- (4) 计算TLB的命中率 (3分)
- (5) 计算页表的命中率 (3分)

7. 下图给出了 4 种网络拓扑, 基于如下假设回答后面的问题: (8 分)

假设: 1) 一个 packet 从某个节点移动到其邻居节点需要 1 个周期; 2) 假设路由算法采取从源到目标的最短路径进行路由。



问题:

- (1) 基于 uniform random 流量模型且没有流量冲突, 对于图 a 中的单向 ring 来说, packet 传输的平均延迟为多少? (假定 ring 中有 n 个节点, 并且 n 为奇数。)  $\frac{(0+1+\dots+n-1)}{n} / 2 = \frac{n-1}{2}$
- (2) 基于与 (1) 中同样的条件, 双向 ring 的平均延迟为多少?  $\frac{(1+\dots+(n-1)*2)}{n} / 2 = \frac{(n-1)n}{4n}$
- (3) 基于相同的条件,  $n \times n$  的二维 torus 的平均延迟为多少?
- (4) 基于相同的条件,  $n \times n \times n$  的三维 torus 的平均延迟为多少?

8. 针对当前美国封锁华为的事件, 谈谈你的想法和见解。(3 分) 什么原因导致芯片设计这个领域这么难以突破? 也可以谈谈你的看法。(3 分)

该事件背后一方面可见国内的科技实力日益强大, 让美国感受到了威胁。另一方面, 我国仍有很多的技术受制于他国的压制, 需要脱离他国技术进行独立研发。  
关键技术仍存在卡脖子的情况, 只有发展自己的核心技术进行独立研发,  
才能不被卡脖子。爱国者不一定从事某一具体职业, 即便是在基础科研领域,  
做好每一项都是值得敬重的人。  
芯片设计领域需要高端的设备和高端的人才, 而我国尽管人数众多, 但是相关技术起步较晚,  
很多先进的技术被他国垄断, 又被他国压制, 使得芯片领域难以突破。