

|        |                    | dest | j   | k  | Issue | Read | Oper | Exec Comp | Write | Result |
|--------|--------------------|------|-----|----|-------|------|------|-----------|-------|--------|
| 9. (1) | fld f2, 0(a0)      | f2   | 0   | a0 | 1     | -    | -    | 4         | 5     |        |
|        | fdiv.d f8, f0, f2  | f8   | f0  | f2 | 6     | 8    | 16   | 17        |       |        |
|        | fmul.d f2, f6, f2  | f2   | f6  | f2 | 7     | 9    | 11   | 17        |       |        |
|        | fld f4, 0(a1)      | f4   | 0   | a1 | 8     | 10   | 11   | 12        |       |        |
|        | fadd.d f4, f0, f4  | f4   | f0  | f4 | 13    | 23   | 15   | 16        |       |        |
|        | fadd.d f10, f8, f2 | f10  | f8  | f2 | 18    | 24   | 20   | 21        |       |        |
|        | fsd f10, 0(a0)     | a0   | f10 |    | 22    | 29   | 23   | 24        |       |        |
|        | fsd f4, 0(a1)      | a1   | f4  |    | 23    | 30   | 24   | 25        |       |        |
|        | addi a0, a0, 8     | a0   | a0  | 8  | 24    | 31   | 24   | 25        |       |        |
|        | addi a1, a1, 8     | a1   | a1  | 8  | 25    | 32   | 25   | 26        |       |        |
|        | sub x20, x4, a0    | x20  | x4  | a0 | 26    | 35   | 26   | 27        |       |        |
|        | bnz x20, Loop      | x20  |     |    | 28    | 38   | 28   | 30        |       |        |

不考虑 IF、ID，需 30 个周期。

(2)

|                    | Issue | Read | Oper | Exec Comp | Write | Result |
|--------------------|-------|------|------|-----------|-------|--------|
| fld f2, 0(a0)      | 1     | -    | -    | 4         | -     | 5      |
| fdiv.d f8, f0, f2  | 6     | -    | -    | 16        | -     | 17     |
| fmul.d f2, f6, f2  | 6     | -    | -    | 10        | -     | 17     |
| fld f4, 0(a1)      | 7     | -    | -    | 10        | -     | 11     |
| fadd.d f4, f0, f4  | 12    | -    | -    | 14        | -     | 15     |
| fadd.d f10, f8, f2 | 18    | -    | -    | 20        | -     | 21     |
| fsd f10, 0(a0)     | 22    | -    | -    | 23        | -     | 24     |
| fsd f4, 0(a1)      | 22    | -    | -    | 23        | -     | 24     |
| addi a0, a0, 8     | 23    | -    | -    | 23        | -     | 24     |
| addi a1, a1, 8     | 23    | -    | -    | 23        | -     | 24     |
| sub x20, x4, a0    | 25    | -    | -    | 25        | -     | 26     |
| bnez x20, Loop     | 27    | -    | -    | 28        | -     | 29     |

需 29 个周期

|                   | Issue | ExComp | Write |                      |
|-------------------|-------|--------|-------|----------------------|
| (3) fld f2, 0(a0) | 1     | 4      | 5     | 10. 重命名后:            |
| fld f4, 0(a1)     | 1     | 4      | 5     | Loop: fld T9, 0(a0)  |
| fdiv.d f8, f0, f2 | 6     | 16     | 17    | fmul.d T10, f0, f2   |
| fmul.d f2, f6, f2 | 6     | 10     | 11    | fdiv.d T11, T9, T10  |
| fadd.d f4, f0, f4 | 7     | 9      | 10    | fld T12, 0(a1)       |
| fsd f4, 0(a1)     | 11    | 12     | 13    | fadd.d T13, f0, T12  |
| addi a1, a1, 8    | 11    | 11     | 12    | fsub.d T14, T11, T13 |
| fadd f10, f8, f2  | 18    | 20     | 21    | fsd T14, 0(a1)       |
| fsd f10, 0(a0)    | 22    | 23     | 24    |                      |
| addi a0, a0, 8    | 22    | 22     | 23    |                      |
| sub x20, x4, a0   | 24    | 24     | 25    |                      |
| bnez x20, Loop.   | 26    | 27     | 28    | 需 28 个周期             |

11. 显式重命名：提供比 ISA 寄存器更多的物理寄存器，用 free list 维护物理寄存器的空闲状态信息，用 renaming table 维护物理寄存器和 ISA 寄存器的映射关系。指令需要写入时从 FL 中取一个空闲的物理寄存器，并在 RT 中将其与指令写入的 ISA 寄存器绑定。源操作数则查询 RT 并从相应的物理寄存器中读取。显式重命名可避免 WAR 和 WAW 冲突，减小 ROB 的大小，减少指令的提交延迟，但需要更多硬件资源（寄存器、FL、RT 等）。

隐式重命名：物理寄存器数量与 ISA 寄存器相同，但只存放最终写回结果，指令执行完成但还未写回的“推测”状态下，值存放在其他结构（如 ROB）内。另外，需要一个表项记录指令值是存在 ROB 还是已写入寄存器。隐式重命名需要的硬件资源较少，但延迟较大。