

9. 考虑一个顺序流水线，忽略前端的取指和译码，处理器从发射到执行完成不同指令所需要的总周期数如下表所示。

| 指令类型 | 总周期数 |
|------|------|
| 内存加载 | 4    |
| 内存存储 | 2    |
| 整型运算 | 1    |
| 分支   | 2    |
| 浮点加法 | 3    |
| 浮点乘法 | 5    |
| 浮点除法 | 11   |

考虑如下的指令序列：

```

Loop:   fld      f2,0(a0)
        fdiv.d   f8,f0,f2
        fmul.d   f2,f6,f2
        fld      f4,0(a1)
        fadd.d   f4,f0,f4
        fadd.d   f10,f8,f2
        fsd     f10,0(a0)
        fsd     f4,0(a1)
        addi    a0,a0,8
        addi    a1,a1,8
        sub     x20,x4,a0
        bnz    x20,Loop
    
```

- 1) 假设一条单发射顺序流水线，在没有数据冲突或分支指令时，每个周期均会新发射一条指令（假设运算单元是充足的）。检测到数据冲突或分支指令时则会暂停发射，直到冲突指令执行完毕才会发射新的指令。则上述代码段的一次迭代需要多少个周期执行完成？
- 2) 假设一条双发射顺序流水线，取指和译码的带宽足够、运算单元充足，且数据在两条流水线之间的传递是无延迟的，因此只有真数据冲突才会导致流水线停顿。则上述代码段的一次迭代需要多少个周期执行完成？
- 3) 调整指令的排列顺序，使得其在上述双发射流水线中完成一次迭代需要的周期数量减少。给出调整后的指令序列及一次迭代所需要的周期数。

解：(1) 31个周期

(2) 23个周期

(3)

|        |           |
|--------|-----------|
| fld    | f2,0,(a0) |
| fdiv.d | f8,f0,f2  |
| fmul.d | f2,f6,f2  |
| fld    | f4,0(a1)  |
| fadd.d | f4,f0,f4  |
| fsd    | f4,0(a1)  |
| addi   | a0,a0,8   |
| addi   | a1,a1,8   |
| sub    | x20,x4,a0 |
| bnz    | x20,Loop  |

21个周期

## 11. 查阅资料，简述显式重命名和隐式重命名的区别、优缺点以及可能的实现方式。

- (1) 显式重命名和隐式重命名都是指令重排技术的一种。显式重命名是指将逻辑寄存器和物理寄存器的映射关系记录在一个表中，每次要使用寄存器时，都需要查询这个表来获取物理寄存器的编号。隐式重命名则是将逻辑寄存器和物理寄存器之间的映射关系隐藏在硬件中，不需要查表来获取物理寄存器的编号。
- (2) 显式重命名可以更好地控制寄存器的使用，但是需要更多的硬件资源  
隐式重命名可以减少硬件资源的使用，但是可能会导致更多的数据依赖关系
- (3) 具体实现方式取决于处理器架构和设计者的选，例如RISC-V就使用的显式重命名方案，包含两个阶段：发射阶段和执行阶段。在发射阶段，指令会被分配一个物理寄存器，并将逻辑寄存器映射到该物理寄存器上；在执行阶段，指令会从该物理寄存器中读取数据

## 10. 考虑如下的代码片段：

Loop:    fld       f4,0(a0)  
          fmul.d    f2,f0,f2  
          fdiv.d     f8,f4,f2  
          fld        f4,0(a1)  
          fadd.d    f6,f0,f4  
          fsub.d    f8,f8,f6

          fsd       f8,0(a1)

现将其进行简单的寄存器重命名，假定有 T0~T63 的临时寄存器池，且 T9 开始的寄存器可用于重命名。写出重命名后的指令序列。

Loop:    fld    f4, 0(a0)  
          fmul.d. f2,f0,f2  
          fdiv.d. f8,f4,f2  
          fld    T14,f0,T14  
          fadd.d f6,f0,T14  
          fsub.d T18,f8,f6  
          fsd    T18, 0(a1)