

## 一、填空题

1. RISC RAID
2. 计算机系统结构设计的升级(包括芯片设计,存储器技术等). 制造工艺的发展完善.
3. 记分牌算法 指令执行状态, 功能部件状态, 结果寄存器状态
4. 循环展开 指循环携带相关(数据相关)
5. 相联存储器
6. 监听式协议 目录式协议
7. ①: 7  
 ② 100%  
 ③ 10  
 ④ 50%  
 ⑤ 8  
 ⑥ 7  
 ⑦ 4  
 ⑧ 66.7%

## 二、

- ① 第一阶段(1978-1986) 年以 25% 每年的增长速度增长, 主要原因是计算机系统  
结构的发展.
- ② 第二阶段(1986-2003) 年以 52% 每年的增长速度飞速增长, 主要原因是由于晶体  
管代替电子管, 芯片制程更为先进, 达到纳米级.
- ③ 第三阶段(2003-2011) 年以 23% 每年的增长速度较快增长, 主要原因是 芯片  
由单核向多核发展.
- ④ 第四阶段(2011-2015) 年以 12% 每年的增长速度增长, 开始趋缓, 主要原因是  
存储子流的升级.
- ⑤ 第五阶段(2015-2018) 年以 3.5% 每年的增长速度增长, 增长缓慢近乎停滞,  
主要原因是暂时无新的技术爆发.

三、

考虑令  $i = 2k$ .

则原代码可转换为:

```
for (k=0; k<50; k+=1) {
    A[2k] = B[2k];
    B[2*2k+5] = A[2k];
}
```

即用GCD测试法判断  $B[4k+5]$  与  $B[2k]$ 

$$\therefore a=4, b=5, c=2, d=0$$

$$GCD(a, c) = 2$$

$$d - b = 0 - 5 = -5$$

GCD(a, c) 不能整除(d-b)

 $\therefore$  不存在循环携带的真数据相关.

四、

哈夫曼树:



哈夫曼编码

|          |                |                |
|----------|----------------|----------------|
| $a^3$    | I <sub>1</sub> | 11             |
| $a^21$   | I <sub>2</sub> | 01             |
| $a^{15}$ | I <sub>3</sub> | <del>101</del> |
| $a^{14}$ | I <sub>4</sub> | 100            |
| $a^{13}$ | I <sub>5</sub> | 001            |
| $a^6$    | I <sub>6</sub> | 0001           |
| $a^2$    | I <sub>7</sub> | 00001          |
| $a^1$    | I <sub>8</sub> | 00000          |

$$\text{操作码的平均码长} = 2 \times (0.3 + 0.21) + 3 \times (0.15 + 0.14 + 0.13)$$

$$+ 4 \times 0.04 + 5 \times (0.02 + 0.01)$$

$$= 2.59$$

五.

$$\begin{aligned}\text{平均访问时间}_{\text{直接映射}} &= 1 \times 0.35 \text{ ns} + 2.1\% \times 65 \text{ ns} \\ &= 1.715 \text{ ns}\end{aligned}$$

$$\begin{aligned}\text{平均访问时间}_{\text{两路组相联}} &= 1 \times 0.35 \text{ ns} \times 1.35 + 1.9\% \times 65 \text{ ns} \\ &= 1.7075 \text{ ns}\end{aligned}$$

$$\begin{aligned}\text{CPU时间}_{\text{直接映射}} &= IC \times (1.6 \times 0.35 \text{ ns} + 1.4 \times 2.1\% \times 65 \text{ ns}) \\ &= 2.471 IC\end{aligned}$$

$$\begin{aligned}\text{CPU时间}_{\text{两路组相联}} &= IC \times (1.6 \times 0.35 \text{ ns} \times 1.35 + 1.4 \times 1.9\% \times 65 \text{ ns}) \\ &= 2.485 IC\end{aligned}$$

由计算结果可知，两路组相联比直接映射的平均访问时间要短，但就CPU时间而言，直接映射比两路组相联 Cache 更优。

六.

$$(1) \text{Cube}_2(7) = \text{Cube}_2(00111) = (00011) = 3$$

$$\sigma(8) = \sigma(01000) = (10000) = 16$$

$$\beta(10) = \beta(01010) = (01010) = 10$$

$$\text{PM2I}_{13}(18) = \cancel{\text{PM2I}_{13}} (18 + 2^3) \bmod 32 = 26$$

$$\text{Cube}_0(\sigma(3)) = \text{Cube}_0(\sigma(00011)) = \text{Cube}_0(00110) = (00111) = 7$$

$$(2) \text{网络直径为 } (2 \log_2 N - 1) = 2 \times 5 - 1 = 9.$$

4号处理器到7号处理器最短路径要经过 5 步。



## 七、部件.



输入  $A_1 \quad A_2 \quad A_3 \quad \alpha_1 \quad A_4 \quad A_5 \quad \beta_1 \quad \alpha_4 \quad \alpha_5 \quad \beta_2$   
 $B_1 \quad B_2 \quad B_3 \quad \alpha_2 \quad B_4 \quad B_5 \quad \alpha_3 \quad \alpha_5 \quad \beta_3$

$$\begin{aligned}\alpha_1 &= A_1 \times B_1 \\ \alpha_2 &= A_2 \times B_2 \\ \alpha_3 &= A_3 \times B_3 \\ \alpha_4 &= A_4 \times B_4 \\ \alpha_5 &= A_5 \times B_5 \\ \beta_1 &= \alpha_1 + \alpha_2 \\ \beta_2 &= \beta_1 + \alpha_3 \\ \beta_3 &= \alpha_4 + \alpha_5\end{aligned}$$

$$(结果) Z = \beta_2 + \beta_3.$$

$$\text{吞吐率: } TP = \frac{9}{27at} = \frac{1}{3at}$$

$$\text{加速比} = \frac{5 \times 5at + 4 \times 5at}{27at} = \frac{5}{3} \approx 1.67.$$

$$\text{效率} = \frac{5 \times 5at + 4 \times 5at}{6 \times 27at} = \frac{5}{18} \approx 27.8\%.$$

## 八、

(1) 禁止向量 [1, 3, 6].

冲突向量  $C_0 = (100101)$

可用周期: 2, 4, 5.

2:  $C_1 = (101101)$

2:  $C_2 = (101111)$

4:  $C_3 = (100111)$

(2) 状态转移图



不发生冲突的调度策略

(2, 5)

3.5

(2, 2, 5)

3

(4)

4

(4, 5)

4.5

(3) 最优调度策略为 (2, 2, 5)

$$\text{最大吞吐率} = \frac{3}{9at} = \frac{1}{3at}.$$

(at为拍长)

(4)

$$\text{实际吞吐率} = \frac{12}{(2+2+5+2+2+5+2+2+5+2+2+7)at}$$

$$= \frac{12}{(38)at} = \frac{6}{19at} \quad (\text{at为拍长}).$$

$$\text{加速比} = \frac{12 \times 7at}{38at} = \frac{42}{19} \approx 2.21$$