

|                    | Issue | Exec | Comp      |
|--------------------|-------|------|-----------|
| 1) fild f2, o(a0)  | 1     | 4    |           |
| fdiv.d f8, f0, f2  | 5     | 15   |           |
| fmul.d f2, f6, f2  | 16    | 20   |           |
| fld f4, o(a1)      | 17    | 20   |           |
| fadd.d f4, f0, f4  | 21    | 23   |           |
| fadd.d f10, f8, f2 | 22    | 24   |           |
| fsd f10, o(a0)     | 25    | 26   |           |
| fsd f4, o(a1)      | 26    | 27   |           |
| addi a0, a0, 8     | 27    | 27   |           |
| addi a1, a1, 8     | 28    | 28   |           |
| sub x20, x4, a0    | 29    | 29   |           |
| bnez x20, Loop     | 30    | 31   | 需要31个周期完成 |
| 2) Issue Exec Comp |       |      |           |
| 1                  | 4     |      |           |
| 1                  | 14    |      |           |
| 15                 | 19    |      |           |
| 15                 | 18    |      |           |
| 20                 | 22    |      |           |
| 20                 | 22    |      |           |
| 23                 | 24    |      |           |
| 23                 | 24    |      |           |
| 25                 | 25    |      |           |
| 25                 | 25    |      |           |
| 26                 | 26    |      | 需要27个周期完成 |
| 26                 | 27    |      |           |

|     |                      | Issue | Exec comp          |
|-----|----------------------|-------|--------------------|
| (3) | f1d f2, 0(a0)        | 1     | 4                  |
|     | f1d f4, 0(a1)        | 1     | 4                  |
|     | fdiv.d f8, f0, f2    | 5     | 15                 |
|     | fmul.d f2, f6, f2    | 5     | 9                  |
|     | fadd.d f4, f0, f4    | 16    | 18                 |
|     | fadd.d f10, f8, f2   | 16    | 18                 |
|     | fsd f10, 0(a0)       | 19    | 20                 |
|     | fsd f4, 0(a1)        | 19    | 20                 |
|     | addi x0, a0, 8       | 21    | 21                 |
|     | addi x1, a1, 8       | 21    | 21                 |
|     | sub x20, x4, a0      | 22    | 22                 |
|     | bnez x20, Loop       | 22    | 23    // 最少需要23个周期 |
| 10. | f1d T9, 0(a0)        |       |                    |
|     | fmul.d T10, f0, f2   |       |                    |
|     | fdiv.d T11, T9, T10  |       |                    |
|     | f1d T12, 0(a1)       |       |                    |
|     | fadd.d T13, f0, T12  |       |                    |
|     | fsub.d T14, T11, T13 |       |                    |
|     | fsd T14, 0(a1)       |       |                    |

11. 区别：①显式重命名的物理寄存器数目要高于逻辑寄存器的数目；

而隐式重命名物理寄存器与逻辑寄存器的数目相同；

②隐式重命名方案不需要 free-list 来记录物理寄存器状态，

指令被写进 ROB 即完成重命名。

优缺点：显示重命名读取数据的复杂度较低，功耗更低；

隐式重命名需要的物理寄存器数目更少。

实现方式：显示重命名：map-table 记录逻辑寄存器与物理寄存器之间的映射关系；busy-table 记录寄存器是否可读；free-list 记录物理寄存器的空闲状态。

隐式重命名：ROB 保存正在执行、尚未提交的指令的结果；ARF 保存已经提交的指令中即刻写入寄存器中的值。