

嵌入式:

9.(1) cycle 1-4: fld f2,0(a0)

cycle 5 : fdiv.d f8,f0,f2

cycle 6 : fmul.d f2,f6,f2 fdiv.d f8,f0,f2

cycle 7-10: fmul.d f2,f6,f2 fld f4,0(a1) fdiv.d f8,f0,f2

cycle 11-13: fadd.d f4,f0,f4 fdiv.d f8,f0,f2

cycle 14-15: fadd.d f8,f0,f2

cycle 16-17: fadd.d f10,f8,f2

cycle 18: fsd f10,0(a0)

cycle 19: fsd f4,0(a1) addi a0,a0,8

cycle 20: addi a1,a1,8

cycle 21: sub x20,x4,a0

cycle 22-25: bnez x20,Loop

故一次迭代需 25 个周期执行完成。

(2) cycle 1-4: fld f2,0(a0)

cycle 5 : fdiv.d f8,f0,f2 fmul.d f2,f6,f2

cycle 6-9: fdiv.d f8,f0,f2 fmul.d f2,f6,f2 fld f4,0(a1)

cycle 10-12: fdiv.d f8,f0,f2 fadd.d f4,f0,f4

cycle 13-15: fdiv.d f8,f0,f2

cycle 16-18: fadd.d f10,f8,f2

cycle 19: fsd f10,0(a0) fsd f4,0(a1)

cycle 20: fsd f10,0(a0) fsd f4,0(a1) addi a0,a0,8 addi a1,a1,8

cycle 21: sub x20,x4,a0

cycle 22-23: bnez x20,Loop



扫描全能王 创建

(3) 前7条指令顺序不变

- 8 addi a0, a0, 8
- 9 fsd f4, 0(a1)
- 10 sub X20, X4, a0
- 11 addi a1, a1, 8
- 12 bnez X20, Loop

改变后需要 22 个周期。

10. fld T13, 0(T9)  
fmul.d T12, T11, T12  
fdiv.d T15, T13, T12  
fld T16, 0(T10)  
fadd.d T14, T11, T16  
fsub.d T15, T15, T14  
fsd T15, 0(T10)

重命名表:

|    |     |     |     |     |     |     |     |
|----|-----|-----|-----|-----|-----|-----|-----|
| T9 | T10 | T11 | T12 | T13 | T14 | T15 | T16 |
| a0 | a1  | f0  | f2  | f4  | f6  | f8  | f4  |

~~其中 f0, f2, f6, f8 分别对应 T0, T2, T6, T8,~~  
~~f4 对应 T4 与 T9.~~

寄存器

11. 显式重命名安排了比 ISA 数量更多的物理寄存器，这些物理寄存器不仅包括已经提交的寄存器，也包括尚未提交处于“推测”状态的寄存器。在重命名的同时，每个指令的寄存器指示符指向所使用的物理寄存器。隐式重命名中物理寄存器数目与 ISA 数目相同，ISA 寄存器只保存已提交的指令的值，“推测”状态的值由 ROB <sup>寄存器</sup> 保存，指令提交时 ROB 将值提交给 ISA 寄存器堆。

相比于显式重命名，隐式重命名需要的物理寄存器更少，但每个操作数在其周期中需保存在 ROB 和 ARF 两个位置，读取数据复杂度较高，功耗更高。



扫描全能王 创建