

1. Si stimi il numero di colpi di clock al di sotto del quale non è possibile scendere nell'esecuzione del codice assegnato, qualunque sia il numero di RS, CRB e stadi di Fetch e Decode disponibili, nell'ipotesi che esista una sola unità di tipo **A**, una sola di tipo **D** e una sola di tipo **M** (tre unità funzionali in tutto) e si motivi la risposta (*In questa stima non si tenga conto delle dipendenze nel codice*) (**1 punto**)

|    |                            |               |
|----|----------------------------|---------------|
| ID | Blocco di Codice assegnato |               |
| 1  | FDIV                       | F1, F2, F3    |
| 2  | FMUL                       | F5, F10, F6   |
| 3  | FDIV                       | F10, F20, F30 |
| 4  | FADD                       | F4, F5, F1    |
| 5  | FADD                       | F5, F7, F15   |
| 6  | FADD                       | F1, F9, F4    |

**Si compilino i campi in arancione con le risposte**

| Descrizione unità di esecuzione |      | Numero di unità funzionali nel datapath | Numero di reservation stations per unità funzionale. |
|---------------------------------|------|-----------------------------------------|------------------------------------------------------|
| A:                              | FADD | 2                                       | T                                                    |
| M:                              | FMUL | 3                                       | T                                                    |
| D:                              | FDIV | 4                                       | T                                                    |

*Da completare con la soluzione dell'esercizio. Si stimi il numero di colpi di clock al di sotto del quale non è possibile scendere nell'esecuzione del codice assegnato. Si motivi la risposta nel campo "descrizione" sottostante.*

| Unità di Esecuzione / Tipo di istruzione | Numero di istruzioni per tipo | Numero di cicli spesi nell'unità di esecuzione | Numero di Cicli Extra | Numero di cicli totali. |
|------------------------------------------|-------------------------------|------------------------------------------------|-----------------------|-------------------------|
| A/FADD                                   | 3                             | 2                                              | 3                     | 9                       |
| M/FMUL                                   | 1                             | 3                                              | 3                     | 6                       |
| D/FDIV                                   | 2                             | 4                                              | 3                     | 11                      |

*Si compili il campo seguente con la descrizione (risposta e motivazione)*

Nel blocco di codice assegnato non è possibile scendere sotto gli 11 periodi di clock in quanto le due istruzioni DIV impiegano 8 cicli di execute ai quali va aggiunto un ciclo di WB, ID e IF.

2. Si disegni il grafo delle dipendenze e si deduca il numero minimo di periodi di clock necessario a eseguire il codice assegnato tenendo conto solo delle dipendenze trovate (1 punto).

| ID | Blocco di Codice assegnato | Alee: (WAW, RAW, WAR)<br>#si inseriscano le alee presenti per istruzione. |
|----|----------------------------|---------------------------------------------------------------------------|
| 1  | FDIV                       | F1, F2, F3                                                                |
| 2  | FMUL                       | F5, F10, F6                                                               |
| 3  | FDIV                       | F10, F20, F30                                                             |
| 4  | FADD                       | F4, F5, F1                                                                |
| 5  | FADD                       | F5, F7, F15                                                               |
| 6  | FADD                       | F1, F9, F4                                                                |

**Si compilino i campi in arancione con le risposte**

| Descrizione unità di esecuzione |      |   | Numero di unità funzionali nel datapath | Numero di reservation stations per unità funzionale. |
|---------------------------------|------|---|-----------------------------------------|------------------------------------------------------|
| A:                              | FADD | 2 | T                                       | 1                                                    |
| M:                              | FMUL | 3 | T                                       | 1                                                    |
| D:                              | FDIV | 4 | T                                       | 1                                                    |

Da completare con la soluzione dell'esercizio. Si riporti il grafo delle dipendenze e si deduca il numero minimo di periodi di clock necessario a eseguire il codice assegnato tenendo conto solo delle dipendenze trovate.

Si codifichi il grafo delle dipendenze come una lista con il seguente formato:

si descrivano i nodi del grafo tra parentesi tonde. Separando il numero dell'istruzione ed il numero di cicli spesi in execute dell'istruzione con una virgola all'interno di parentesi tonde. Es.: (id\_istruzione, numero\_cicli)

| Dipendenze                                                       | Si completi con il numero di cicli di clock spesi nei differenti stadi della pipeline per ciascun thread di istruzioni. Ciascun thread identifica un flusso indipendente di codice. |    |    |    |     |
|------------------------------------------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----|----|----|-----|
| (A,B): A è l'id dell'istruzione e B è il numero di cicli dell'EX | IF                                                                                                                                                                                  | ID | EX | WB | Tot |
| (1,4)->(4,2)->(6,2);                                             | 1                                                                                                                                                                                   | 1  | 8  | 3  | 13  |
| (2,3)->(4,2)->(6,2);                                             | 1                                                                                                                                                                                   | 1  | 7  | 3  | 12  |
| (5,2);                                                           | 1                                                                                                                                                                                   | 1  | 2  | 1  | 5   |
| (4,2)->(6,2);                                                    | 1                                                                                                                                                                                   | 1  | 4  | 2  | 8   |

Si compili il campo seguente con la descrizione (risposta e motivazione)

Il minimo tempo di esecuzione è pari a 13 cicli legato alla dipendenza RAW dell'istruzione 6 rispetto alla 4 a causa del registro R4, e dalla dipendenza dell'istruzione 4 a causa della istruzione 1 sul registro R1

3. Si mostri la dinamica dell'esecuzione nel caso della CPU considerata nel punto 1 con 1 CRB, uno stadio di IF e uno di ID, e 2 RS per ognuna delle tre unità funzionali

(3 punti)

(si ipotizzi che, in caso di conflitti sul CRB, la fase di WB dell'unità D abbia la priorità sulle altre).

| Descrizione unità di esecuzione |      |     | Numero di unità funzionali nel datapath | Numero di reservation stations per unità funzionale. |
|---------------------------------|------|-----|-----------------------------------------|------------------------------------------------------|
| A:                              | FADD | 2 T | 1                                       | 2                                                    |
| M:                              | FMUL | 3 T | 1                                       | 2                                                    |
| D:                              | FDIV | 4 T | 1                                       | 2                                                    |
| CRB                             |      |     | 1                                       |                                                      |

Si compilino i campi in arancione con le risposte

| Si mostri la dinamica dell'esecuzione nel caso della CPU considerata per il blocco di codice riportato. (Si ipotizzi che, in caso di conflitti sul CRB, la fase di WB dell'unità D abbia la priorità sulle altre). |       |     |     |     |                        |    |      |      |      |      |      |      |      |      |      |      |      |     |     |     |     |     |     |     |     |     |
|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------|-----|-----|-----|------------------------|----|------|------|------|------|------|------|------|------|------|------|------|-----|-----|-----|-----|-----|-----|-----|-----|-----|
| #Si riempiano le caselle con i seguenti simboli : [IF, ID, A0_W, A0_R, A0_E, A1_W, A1_R, A1_E, M0_W, M0_R, M0_E, M1_W, M1_R, M1_E, D0_W, D0_R, D0_E, D1_W, D1_R, D1_E, WB]                                         |       |     |     |     |                        |    |      |      |      |      |      |      |      |      |      |      |      |     |     |     |     |     |     |     |     |     |
| ID                                                                                                                                                                                                                 | Instr | Rd  | Rs1 | Rs2 | T1<br>Blocco di codice | T2 | T3   | T4   | T5   | T6   | T7   | T8   | T9   | T10  | T11  | T12  | T13  | T14 | T15 | T16 | T17 | T18 | T19 | T20 | T21 | T22 |
| 1                                                                                                                                                                                                                  | FDIV  | F1  | F2  | F3  | IF                     | ID | D0_E | D0_E | D0_E | D0_E | WB   |      |      |      |      |      |      |     |     |     |     |     |     |     |     |     |
| 2                                                                                                                                                                                                                  | FMUL  | F5  | F10 | F6  |                        | IF | ID   | M0_E | M0_E | M0_E | WB   | WB   |      |      |      |      |      |     |     |     |     |     |     |     |     |     |
| 3                                                                                                                                                                                                                  | FDIV  | F10 | F20 | F30 |                        | IF | ID   | D1_R | D1_R | D1_E | D1_E | D1_E | D1_E | WB   |      |      |      |     |     |     |     |     |     |     |     |     |
| 4                                                                                                                                                                                                                  | FADD  | F4  | F5  | F1  |                        |    | IF   | ID   | A0_W | A0_W | A0_W | A0_E | A0_E | WB   |      |      |      |     |     |     |     |     |     |     |     |     |
| 5                                                                                                                                                                                                                  | FADD  | F5  | F7  | F15 |                        |    |      | IF   | ID   | A1_E | A1_E | WB   |      |      |      |      |      |     |     |     |     |     |     |     |     |     |
| 6                                                                                                                                                                                                                  | FADD  | F1  | F9  | F4  |                        |    |      |      | IF   | ID   | ID   | ID   | ID   | A0_W | A0_W | A0_E | A0_E | WB  |     |     |     |     |     |     |     |     |

4. E' possibile ridurre il numero di periodi di clock necessario ad eseguire il codice assegnato rispetto al valore risultante dalla risposta al punto 3? Si punti al numero minore possibile di periodi di clock e al numero minimo di modifiche, supponendo di poter apportare solo le seguenti modifiche all'architettura:

- o aumento di RS da due a tre in una o più unità funzionali
- o raddoppio o triplicazione del CRB per poter eseguire due o tre fasi di WB per clock
- o aggiunta di una o più unità funzionali con due RS

Quali modifiche converrebbe apportare? Si motivi la risposta e si disegni la nuova dinamica di esecuzione. (3 punti).

*(In caso di raddoppio di una unità funzionale, si ipotizzi di fare lo scheduling a rotazione sulle due unità funzionali uguali)*

|                                 |      |                                                                                                                                 |                                                      |
|---------------------------------|------|---------------------------------------------------------------------------------------------------------------------------------|------------------------------------------------------|
| Descrizione unità di esecuzione |      | Si completi descrivendo la nuova architettura del datapath. Numero di unità funzionali nel datapath, CRB e profondità delle RSS |                                                      |
| Descrizione unità di esecuzione |      | Numero di unità funzionali nel datapath                                                                                         | Numero di reservation stations per unità funzionale. |
| A:                              | FADD | 2                                                                                                                               | T                                                    |
| M:                              | FMUL | 3                                                                                                                               | T                                                    |
| D:                              | FDIV | 4                                                                                                                               | T                                                    |
| X:                              | FADD | 2                                                                                                                               | T                                                    |
| Y:                              | ?    | ?                                                                                                                               | T                                                    |
| Z:                              | ?    | ?                                                                                                                               | T                                                    |
| CRB                             |      | 2                                                                                                                               |                                                      |

Si compilino i campi in arancione con le risposte

# eventuali unità di esecuzione agguntive.  
# eventuali unità di esecuzione agguntive.  
# eventuali unità di esecuzione agguntive.

# numero CRB complessivo.

| Si mostri la dinamica dell'esecuzione nel caso della CPU considerata per il blocco di codice riportato. (Si ipotizzi che, in caso di conflitti sul CRB, la fase di WB dell'unità D abbia la priorità sulle altre). |                  |       |     |     |     |           |           |           |           |           |           |           |           |           |            |            |            |            |            |            |            |            |            |            |            |            |            |
|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------|-------|-----|-----|-----|-----------|-----------|-----------|-----------|-----------|-----------|-----------|-----------|-----------|------------|------------|------------|------------|------------|------------|------------|------------|------------|------------|------------|------------|------------|
| #Si riempiano le caselle con i seguenti simboli : [IF, ID, A0_W, A0_R, A0_E, A1_W, A1_R, A1_E, M0_W, M0_R, M0_E, M1_W, M1_R, M1_E, D0_W, D0_R, D0_E, D1_W, D1_R, D1_E, WB]                                         |                  |       |     |     |     |           |           |           |           |           |           |           |           |           |            |            |            |            |            |            |            |            |            |            |            |            |            |
| ID                                                                                                                                                                                                                 | Blocco di codice | Instr | Rd  | Rs1 | Rs2 | T1<br>H L | T2<br>H L | T3<br>H L | T4<br>H L | T5<br>H L | T6<br>H L | T7<br>H L | T8<br>H L | T9<br>H L | T10<br>H L | T11<br>H L | T12<br>H L | T13<br>H L | T14<br>H L | T15<br>H L | T16<br>H L | T17<br>H L | T18<br>H L | T19<br>H L | T20<br>H L | T21<br>H L | T22<br>H L |
| 1                                                                                                                                                                                                                  | FDIV             | F1    | F2  | F3  |     | IF        | ID        | D0_E      | D0_E      | D0_E      | D0_E      | WB        |           |           |            |            |            |            |            |            |            |            |            |            |            |            |            |
| 2                                                                                                                                                                                                                  | FMUL             | F5    | F10 | F6  |     |           | IF        | ID        | M0_E      | M0_E      | M0_E      | M0_E      | WB        |           |            |            |            |            |            |            |            |            |            |            |            |            |            |
| 3                                                                                                                                                                                                                  | FDIV             | F10   | F20 | F30 |     |           |           | IF        | ID        | D1_R      | D1_R      | D1_E      | D1_E      | D1_E      | D1_E       | WB         |            |            |            |            |            |            |            |            |            |            |            |
| 4                                                                                                                                                                                                                  | FADD             | F4    | F5  | F1  |     |           |           | IF        | ID        | A0_W      | A0_W      | A0_E      | A0_E      | A0_E      | WB         |            |            |            |            |            |            |            |            |            |            |            |            |
| 5                                                                                                                                                                                                                  | FADD             | F5    | F7  | F15 |     |           |           |           | IF        | ID        | X0_E      | X0_E      | X0_E      | X0_E      | WB         |            |            |            |            |            |            |            |            |            |            |            |            |
| 6                                                                                                                                                                                                                  | FADD             | F1    | F9  | F4  |     |           |           |           |           | IF        | ID        | A1_W      | A1_W      | A1_W      | A1_E       | A1_E       | A1_E       | WB         |            |            |            |            |            |            |            |            |            |

5. Per due punti si disegni il film del registro F5 nel caso della dinamica di esecuzione di cui al punto 4. (Si riempino i campi tag valore di F5)

| Registro | Tag Val |
|----------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|---------|
| F5       | 0       | 5       | 0       | 5       | 0       | 5       | M0      | 5       | M0      | 5       | M0      | 5       | X0      | 5       | X0      | 5       | 0       | 22      | 0       | 22      | 0       | 12      | 0       | 22      |         |

4. E' possibile ridurre il numero di periodi di clock necessario ad eseguire il codice assegnato rispetto al valore risultante dalla risposta al punto 3? Si punti al numero minore possibile di periodi di clock e al numero minimo di modifiche, supponendo di poter apportare solo le seguenti modifiche all'architettura:

- o aumento di RS da due a tre in una o più unità funzionali
- o raddoppio o triplicazione del CRB per poter eseguire due o tre fasi di WB per clock
- o aggiunta di una o più unità funzionali con due RS

Quali modifiche converrebbe apportare? Si motivi la risposta e si disegni la nuova dinamica di esecuzione. (3 punti).

*(In caso di raddoppio di una unità funzionale, si ipotizzi di fare lo scheduling a rotazione sulle due unità funzionali uguali)*

| Descrizione unità di esecuzione |      |   |   | Si completi descrivendo la nuova architettura del datapath. Numero di unità funzionali nel datapath, CRB e profondità delle RSS |   |
|---------------------------------|------|---|---|---------------------------------------------------------------------------------------------------------------------------------|---|
| A:                              | FADD | 2 | T | 1                                                                                                                               | 3 |
| M:                              | FMUL | 3 | T | 1                                                                                                                               | 2 |
| D:                              | FDIV | 4 | T | 1                                                                                                                               | 2 |
| X:                              | ?    | ? | T | ?                                                                                                                               | ? |
| Y:                              | ?    | ? | T | ?                                                                                                                               | ? |
| Z:                              | ?    | ? | T | ?                                                                                                                               | ? |
| CRB                             |      | 2 |   |                                                                                                                                 |   |

Si compilino i campi in arancione con le risposte

|           |  |
|-----------|--|
| Nome      |  |
| Cognome   |  |
| Matricola |  |

# eventuali unità di esecuzione aggiuntive.

# eventuali unità di esecuzione aggiuntive.

# eventuali unità di esecuzione aggiuntive.

# numero CRB complessivo.

\*in questa soluzione aumento il numero di RS per l'unità A e raddoppio il numero di CRB

| Si mostri la dinamica dell'esecuzione nel caso della CPU considerata per il blocco di codice riportato. (Si ipotizzi che, in caso di conflitti sul CRB, la fase di WB dell'unità D abbia la priorità sulle altre). |                  |     |     |     |    |    |    |    |      |      |      |      |      |      |      |      |     |     |     |     |     |     |     |     |     |     |
|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------|-----|-----|-----|----|----|----|----|------|------|------|------|------|------|------|------|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|
| #Si riempiano le caselle con i seguenti simboli : [IF, ID, A0_W, A0_R, A0_E, A1_W, A1_R, A1_E, M0_W, M0_R, M0_E, M1_W, M1_R, M1_E, D0_W, D0_R, D0_E, D1_W, D1_R, D1_E, WB]                                         |                  |     |     |     |    |    |    |    |      |      |      |      |      |      |      |      |     |     |     |     |     |     |     |     |     |     |
| ID                                                                                                                                                                                                                 | Instr            | Rd  | Rs1 | Rs2 | T1 | T2 | T3 | T3 | T5   | T6   | T7   | T8   | T9   | T10  | T11  | T12  | T13 | T14 | T15 | T16 | T17 | T18 | T19 | T20 | T21 | T22 |
|                                                                                                                                                                                                                    | Blocco di codice |     |     |     | H  | L  | H  | L  | H    | L    | H    | L    | H    | L    | H    | L    | H   | L   | H   | L   | H   | L   | H   | L   | H   | L   |
| 1                                                                                                                                                                                                                  | FDIV             | F1  | F2  | F3  | IF |    | ID |    | D0_E | D0_E | D0_E | D0_E | WB   |      |      |      |     |     |     |     |     |     |     |     |     |     |
| 2                                                                                                                                                                                                                  | FMUL             | F5  | F10 | F6  |    | IF |    | ID | M0_E | M0_E | M0_E | M0_E | WB   |      |      |      |     |     |     |     |     |     |     |     |     |     |
| 3                                                                                                                                                                                                                  | FDIV             | F10 | F20 | F30 |    |    | IF |    | ID   | D1_R | D1_R | D1_E | D1_E | D1_E | WB   |      |     |     |     |     |     |     |     |     |     |     |
| 4                                                                                                                                                                                                                  | FADD             | F4  | F5  | F1  |    |    |    | IF | ID   | A0_W | A0_W | A0_W | A0_E | A0_E | WB   |      |     |     |     |     |     |     |     |     |     |     |
| 5                                                                                                                                                                                                                  | FADD             | F5  | F7  | F15 |    |    |    |    | IF   | ID   | A1_E | A1_E | WB   |      |      |      |     |     |     |     |     |     |     |     |     |     |
| 6                                                                                                                                                                                                                  | FADD             | F1  | F9  | F4  |    |    |    |    |      | IF   | ID   | A2_W | A2_W | A2_W | A2_E | A2_E | WB  |     |     |     |     |     |     |     |     |     |

5. Per due punti si disegni il film del registro F5 nel caso della dinamica di esecuzione di cui al punto 4. (Si riempino i campi tag valore di F5)

| Registro | Tag | Val | Tag |    |
|----------|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|-----|----|
| F5       | 0   | 5   | 0   | 5   | 0   | 5   | M0  | 5   | M0  | 5   | M0  | 5   | A1  | 5   | A1  | 5   | 0   | 22  | 0   | 22  | 0   | 22  | 0   | 22  | 0   | 22 |