

9. 10. 11

9. Loop:

|        |           |
|--------|-----------|
| fld    | f2,0(a0)  |
| fdiv.d | f8 f0,f2  |
| fmul.d | f2,f6,f2  |
| fld    | f4,0(a1)  |
| fadd.d | f4 f0,f4  |
| fadd.d | f10,f8,f2 |
| fsd    | f10,0(a0) |
| fsd    | f4,0(a1)  |
| addi   | a0,a0,8   |
| addi   | a1,a1,8   |
| sub    | x20,x4,a0 |
| bnz    | x20,Loop  |

| 指令类型 | 总周期数 |
|------|------|
| 内存加载 | 4    |
| 内存存储 | 2    |
| 整型运算 | 1    |
| 分支   | 2    |
| 浮点加法 | 3    |
| 浮点乘法 | 5    |
| 浮点除法 | 11   |

1)



共 30 周期

2)



共 22 周期

3) fld f2,0(a0)  
 fld f4,0(a1)  
 fdiv.d f8,f0,f2  
 fmul.d f2,f6,f2  
 fadd.d f4,f0,f4  
 fsd f4,0(a1)  
 fadd.d f10,f8,f2  
 fsd f10,0(a0)  
 addi a0,a0,8  
 addi a1,a1,8  
 sub x20,x4,a0  
 bnz x20,Loop

共 20 周期

|     |                      |                   |
|-----|----------------------|-------------------|
| 10. | fld T9, 0(a0)        | 用记分牌，且仅将上寄存器进行重命名 |
|     | fmul.d T10, T0, T2   |                   |
|     | fdiv.d T11, T9, T10  |                   |
|     | fld T12, 0(a1)       | 默认：f0~f8 对应 T0~T8 |
|     | fadd.d T13, T0, T12  |                   |
|     | fsub.d T14, T11, T13 |                   |
|     | fsd T14, 0(a1)       |                   |

11. 显式：安排好超过原 Reg 堆栈数量的 Preg (物理 Reg)，如 10 题一般进行映射与重命名

隐式：不需要多余 Preg，而是通过缓存尚未提交的结果，并直接给到其它准备执行的指令处。

显：更多逻辑资源，更高延迟 例：重命名记分牌

隐：更复杂的硬件，更高功耗 例：Tomasulo 算法