

可知，循环单次迭代需要的周期数为12.

| (3).           | 1  | 2  | 3  | 4   | 5   | 6   | 7   | 8  | 9 | 10 |  |
|----------------|----|----|----|-----|-----|-----|-----|----|---|----|--|
| lw a4, 0(a3)   | IF | ID | EX | MEM | WB  |     |     |    |   |    |  |
| addw a1, a4+a1 | IF | ID | EX | MEM | WB  |     |     |    |   |    |  |
| addiw a2-a2+   |    | IF | ID | EX  | MEM | WB  |     |    |   |    |  |
| addi a3,a3,4   |    |    | IF | ID  | EX  | MEM | WB  |    |   |    |  |
| bnez a3,loop   |    |    |    | IF  | ID  | EX  | MEM | WB |   |    |  |

可知，周期数为9.

4.22.

| 9. 题(1) #        | 开始周期—结束周期 |            |
|------------------|-----------|------------|
| fld f2,sqd 0(a0) | 1-4       | > RAW      |
| fdivd f8,f0,f4   | 5-15      |            |
| fmuld f2,f6,f4   | 6-10      |            |
| fld f4,0(a1)     | 7-10      | > RAW, WAW |
| fadd.d f4,b0,f4  | 11-13     | > RAW      |
| fadd.d f10,f1,f2 | 16-18     |            |
| fsd f10,0(b0)    | 19-20     | > WAW      |
| fsd f4,0(a1)     | 20-21     |            |
| addi a0,0,0,8    | 21        |            |
| addi a1,0,1,8    |           |            |
| snb x20,x4,0     |           |            |
| bne x20,loop     |           |            |

综上，共需要25个周期执行完成

|         |     |       |       |
|---------|-----|-------|-------|
| (2) fld | 1-4 |       |       |
| fdiv.d  |     | 5-15  |       |
| fmul.d  |     | 5-9   |       |
| fld     |     | 6-9   |       |
| fadd.d  |     | 10-12 |       |
| fadd.d  |     | 16-18 |       |
| fsd     |     |       | 19-20 |
| fsd     |     |       | 19-20 |
| addi    |     |       | 20    |
| addi    |     |       | 20    |
| sub     |     |       | 21    |
| bnz     |     |       | 22-23 |

由上圖可知，双发射，共需 23 个周期执行。

(3). 周期如下：

|                                                        |       |            |
|--------------------------------------------------------|-------|------------|
| fld f <sub>2</sub> , 0(a0)                             | 1-4   |            |
| fdiv.d f <sub>8</sub> ,f <sub>0</sub> ,f <sub>2</sub>  | 5-15  |            |
| fmul.d f <sub>2</sub> ,f <sub>6</sub> ,f <sub>2</sub>  | 5-9   |            |
| fld f <sub>4</sub> , 0(a1)                             | 6-9   |            |
| fadd.d f <sub>4</sub> ,f <sub>0</sub> ,f <sub>4</sub>  | 10-12 |            |
| fsd f <sub>4</sub> , 0(a1)                             | 13-14 | 共需 22 个周期。 |
| fadd.d f <sub>10</sub> ,f <sub>8</sub> ,f <sub>2</sub> | 16-18 |            |
| fsd f <sub>10</sub> , 0(a0)                            | 19    |            |
| addi a <sub>1</sub> ,a <sub>1</sub> ,8                 | 20    |            |
| sub x <sub>20</sub> ,x <sub>14</sub> ,a <sub>0</sub>   | 20    |            |
| bnz x <sub>20</sub> ,loop                              | 21-22 |            |

10. 隐式重命名的指令序列如下：

Loop: fld T9, 0(a0)  
fmul.d T10, f0, f2  
fdiv.d ~~T11~~, T9, T10  
fld T12, ~~T11~~ 0(a1)  
fadd.d ~~T13~~, f0, T12  
fsub.d ~~T11~~, T11, T13  
fsd T11, 0(a1)

11. 解释显式重命名：物理上的寄存器堆中具有的真实寄存器数比ISA定义的要多，对每条需写回的指令会新分配一个暂存寄存器。

而隐式重命名：物理寄存器数和ISA定义的寄存器数相同，ISA寄存器只保存指令的指针的值而不能挂处于推调状态的值。

(2) 显式寄存器重命名涉及到使用的硬件来实现重命名寄存器。该硬件维护程序使用的逻辑寄存器名称和处理器使用的物理寄存器之间的映射。当执行一条指令时，逻辑寄存器名称被转换为物理寄存器名称，并且结果被存储在适当的物理寄存器中。显示寄存器重命名的优点是它非常灵活，并且可以处理广泛的指令序列。缺点是需要额外的硬件，且增加了很多成本。

(3) 对于隐式重命名，处理器使用一组规则来确定每个指令使用哪个物理寄存器。这可以在软件中完成，也可以使用硬件和软件的组合。

优点是：相比显式重命名更简单，成本更低。

缺点：不是很灵活，且可能无法处理所有指令序列。

(4) 显式重命名实现：使用专用的寄存器重命名单元或使用硬件和软件的组合来执行。隐式——：使用一组规则来确定使用哪些物理寄存器。

重命名。