

9.(1) 需要的周期数  $4+1+5+3+1+2+1+1+2 = 30$  个周期

(2) 大致流程图:

- |          |           |
|----------|-----------|
| ① fld    | f2,0(a0)  |
| ⑥ fdiv.d | f8,f0,f2  |
| ⑦ fmul.d | f2,f6,f2  |
| ② fld    | f4,0(a1)  |
| ⑧ fadd.d | f4,f0,f4  |
| ⑩ fadd.d | f10,f8,f2 |
| ⑪ fsd    | f10,0(a0) |
| ⑨ fsd    | f4,0(a1)  |
| ③ addi   | a0,a0,8   |
| ④ addi   | a1,a1,8   |
| ⑤ sub    | x20,x4,a0 |
| ⑫ bnz    | x20,Loop  |



共23个周期

(3) 调整为:

- |        |           |
|--------|-----------|
| fld    | f2,0(a0)  |
| fld    | f4,0(a1)  |
| addi   | a0,a0,8   |
| addi   | a1,a1,8   |
| sub    | x20,x4,a0 |
| fdiv.d | f8,f0,f2  |
| fmul.d | f2,f6,f2  |
| fadd.d | f4,f0,f4  |
| fsd    | f4,0(a1)  |
| fadd.d | f10,f8,f2 |
| fsd    | f10,0(a0) |
| fsd    | f4,0(a1)  |
| addi   | a0,a0,8   |
| addi   | a1,a1,8   |
| sub    | x20,x4,a0 |
| bnz    | x20,Loop  |

- |          |           |
|----------|-----------|
| ① fld    | f2,0(a0)  |
| ⑥ fdiv.d | f8,f0,f2  |
| ⑦ fmul.d | f2,f6,f2  |
| ② fld    | f4,0(a1)  |
| ⑧ fadd.d | f4,f0,f4  |
| ⑩ fadd.d | f10,f8,f2 |
| ⑪ fsd    | f10,0(a0) |
| ⑨ fsd    | f4,0(a1)  |
| ③ addi   | a0,a0,8   |
| ④ addi   | a1,a1,8   |
| ⑤ sub    | x20,x4,a0 |
| ⑫ bnz    | x20,Loop  |



共18个周期

10. fld T4,0(T0)  
fmul.d T2,T10,T2  
fdiv.d T8,T4,T11  
fld T12,0(T1)  
fadd.d T6,T10,T12  
fsub.d T8,T8,T6  
fsd T8,0(T1)

11 显式重命名：使用物理寄存器实现的伪寄存器显示实现。优点是可预测性好，可控性强，缺点是编写难度大，开销大。可能的实现方式有让物理寄存器具有的真实寄存器数目比ISA定义的寄存器数目更多，然后利用空闲列表和重命名列表进行调度。

隐式重命名：通过处理器自动地将逻辑寄存器重命名为物理寄存器，无需编写额外的程序。优点有编写简单，运行快速，缺点有预测性较差，可行性较弱。可能的实现方式有使用一个虚拟寄存器组来存储程序中的所有寄存器，然后使用一个重命名寄存器文件记录每个虚拟寄存器对应的重命名寄存器。