

UNIVERSITÀ DEGLI STUDI DI VERONA

---

CORSO DI LAUREA IN INFORMATICA

# Architettura degli Elaboratori

Federico Brutti  
[federico.brutti@studenti.univr.it](mailto:federico.brutti@studenti.univr.it)

*"Bits are bits, oramai lo sapete... o forse dovrei ricordarvi il discorso sui CFU?" - Franco F.*

# Contents

|                                                                                |           |
|--------------------------------------------------------------------------------|-----------|
| <b>1 Codifica dell'Informazione</b>                                            | <b>4</b>  |
| 1.1 Sistemi ed elaborazione dati . . . . .                                     | 4         |
| 1.2 Codice Binario e operazioni in base 2 . . . . .                            | 6         |
| 1.3 Codifica dei numeri . . . . .                                              | 7         |
| 1.3.1 Codifica in modulo e segno . . . . .                                     | 8         |
| 1.3.2 Codifica in virgola fissa . . . . .                                      | 8         |
| 1.3.3 Codifica in virgola mobile . . . . .                                     | 9         |
| 1.3.4 Codifica in complemento a 1 e a 2 . . . . .                              | 11        |
| 1.3.5 Codifica in esadecimale . . . . .                                        | 12        |
| <b>2 Circuiti e Ottimizzazione</b>                                             | <b>13</b> |
| 2.1 Realizzazione di porte logiche . . . . .                                   | 14        |
| 2.2 Minimizzazione a due livelli . . . . .                                     | 15        |
| 2.2.1 Mappa di Karnaugh . . . . .                                              | 17        |
| 2.2.2 Algoritmo di Quine Mc-Cluskey . . . . .                                  | 17        |
| 2.2.3 Funzioni parzialmente specificate . . . . .                              | 18        |
| 2.3 Dispositivi programmabili . . . . .                                        | 18        |
| 2.4 Sintesi combinatoria multilivello . . . . .                                | 19        |
| 2.5 Mapping tecnologico . . . . .                                              | 19        |
| <b>3 Progettazione Digitale</b>                                                | <b>21</b> |
| 3.1 Circuiti sequenziali . . . . .                                             | 21        |
| 3.1.1 FSM - Finite State Machines . . . . .                                    | 21        |
| 3.2 Sintesi delle funzioni $\lambda$ e $\delta$ , assegnazione stati . . . . . | 22        |
| 3.3 Minimizzazione degli stati . . . . .                                       | 22        |
| 3.4 Datapath e componenti . . . . .                                            | 22        |
| 3.5 Modello FSMD - Finite State Machine with Datapath . . . . .                | 23        |
| 3.6 Derivazione FSMD da algoritmo . . . . .                                    | 23        |
| 3.7 Modello dispositivi programmabili . . . . .                                | 23        |

|                                                                         |           |
|-------------------------------------------------------------------------|-----------|
| <b>4 Architetture dei Calcolatori</b>                                   | <b>24</b> |
| 4.1 Modello di Von Neumann e Unità funzionali del calcolatore . . . . . | 24        |
| 4.2 CPU - Central Processing Unit . . . . .                             | 24        |
| 4.2.1 CPU Cablata . . . . .                                             | 24        |
| 4.2.2 CPU Microprogrammata . . . . .                                    | 24        |
| 4.2.3 Microistruzioni della CPU . . . . .                               | 24        |
| 4.3 Metodi di I/O, Segnale Interrupt . . . . .                          | 24        |
| 4.4 Direct Memory Access, BUS e Arbitraggio . . . . .                   | 24        |
| 4.5 Stati di un processo . . . . .                                      | 24        |
| 4.6 Pila e gestione Interrupt . . . . .                                 | 24        |
| 4.7 Tipi di Memoria RAM . . . . .                                       | 24        |
| 4.8 Caratteristiche delle memorie con relativa gerarchia . . . . .      | 25        |
| 4.9 Memoria Cache e Virtuale . . . . .                                  | 25        |
| 4.10 Pipelining . . . . .                                               | 25        |
| 4.11 Architettura LC-3 . . . . .                                        | 25        |
| 4.12 Modello CISC e RISC . . . . .                                      | 25        |
| 4.13 Architetture parallele . . . . .                                   | 25        |
| <b>5 SIS e Verilog</b>                                                  | <b>26</b> |
| 5.1 Introduzione a SIS . . . . .                                        | 26        |
| 5.2 Sintesi combinatoria esatta . . . . .                               | 26        |
| 5.3 Sintesi combinatoria approssimata multilivello . . . . .            | 26        |
| 5.4 Modellazione di FSM . . . . .                                       | 26        |
| 5.5 Modellazione di FSMD . . . . .                                      | 26        |
| 5.6 Introduzione a Verilog . . . . .                                    | 26        |
| 5.7 Modellazione in Verilog . . . . .                                   | 26        |
| 5.8 Modellazione di FSM . . . . .                                       | 26        |
| 5.9 Modellazione di FSMD . . . . .                                      | 26        |
| <b>6 Il linguaggio Assembly</b>                                         | <b>27</b> |
| 6.1 Introduzione ad Assembly . . . . .                                  | 27        |
| 6.2 Istruzioni e Sintassi . . . . .                                     | 27        |
| 6.3 Debugging e Makefile . . . . .                                      | 27        |
| 6.4 Relazione ISA-FSMD su LC-3 . . . . .                                | 27        |
| 6.5 Funzioni e passaggio di parametri . . . . .                         | 27        |
| 6.6 Confronto con il C . . . . .                                        | 27        |

# Chapter 1

## Codifica dell'Informazione

### 1.1 Sistemi ed elaborazione dati

Cominciamo col dire che lo scopo dell'informatica è la risoluzione dei problemi attraverso insiemi di istruzioni non ambigue, ovvero gli **algoritmi**. In questa materia ci occuperemo di studiare la progettazione ed ottimizzazione di sistemi digitali tramite programmi di **sintesi logica**<sup>1</sup> e rivolgeremo in seguito l'attenzione al linguaggio Assembly, per una corretta comprensione delle funzionalità di un'architettura. Ad oggi esistono due macro-categorie di architetture:

- **Sistemi embedded**: Macchine composte puramente da hardware, capaci di eseguire un solo algoritmo.
- **Sistemi general purpose**: Macchine composte dal connubio hardware-software, capaci di eseguire diversi algoritmi.

Generalmente, ogni sistema operativo lavora con il **linguaggio macchina** o codice oggetto; si tratta di una sequenza di "0" ed "1" con un significato specifico per la macchina e per essere leggibile dalle persone è necessaria una traduzione. Poniamoci quindi la domanda: "In che modo è possibile passare informazioni dal mondo reale ad un computer?"; stiamo parlando di un processo di due passi:

- **Input**: Le informazioni vengono prima recepite dalla macchina per la loro codifica e poi inviate al sistema operativo per l'elaborazione.
- **Output**: L'elaborato viene decodificato per risultare leggibile alle persone e poi mostrato all'utente.

---

<sup>1</sup>Comunicazione da algoritmo a hardware.



Figure 1.1: Ciclo di elaborazione informazioni

Questo vale come discorso generale; nello specifico è giusto chiarire che, avendo risorse limitate, non è possibile dare in input infinite informazioni. La soluzione a questo problema si ottiene con il seguente algoritmo:

1. **Campionamento:** Divisione in intervalli dell'informazione registrata.
2. **Discretizzazione:** Approssimazione degli stessi quanto possibile ad un numero leggibile dalla macchina.

Le informazioni sono recepite in un determinato arco di tempo, il quale viene misurato in **Hertz** ( $1Hz = 1ms$ ). Per ogni elaborazione vale inoltre il seguente teorema:

### **Teorema 1. Teorema di Shannon**

*Data una funzione in un intervallo di campionamento e discretizzazione, è garantita la presenza di un errore.*



Figure 1.2: Processo di ricezione delle informazioni

Ma in che modo vengono codificate le informazioni? Si tratta di un processo che vede l'assegnazione di un codice binario ad ogni frammento di informazione con un certo numero di *bits*. Con "bit" intendiamo il numero totale di cifre binarie usate per un dato.

**Esempio 1.** *Calcolo del numero di bits necessari per salvare informazioni*  
 Supponiamo di avere  $12M$  unità di dati da registrare; dobbiamo ragionare attraverso le potenze di 2 ed ottenere il valore più piccolo che sia maggiore o uguale al numero di dati da registrare.

In questo caso sarà  $2^4 = 16$  e l'esponente sarà il numero di bits necessari. Per fare ordine:

- Da registrare:  $12M = 12 \times 1000000 = 12000000$
- Potenza corretta:  $2^4 = 16$
- Numero di bits necessari:  $2^4 \implies 4b$

La codifica non è un procedimento sempre uguale; talvolta risulta necessario modificarlo in base alle specifiche del calcolatore, tra le quali notiamo in particolare la **facilità di calcolo**, che riguarda la semplicità delle istruzioni, e la **velocità di elaborazione**, la quale influenza la codifica. Se quest'ultima richiedesse più tempo rispetto alla frequenza di campionamento si perderebbero dei dati e per questo deve essere sempre maggiore o uguale al valore del campionamento.

Per il momento prenderemo in considerazione i **circuiti combinatori**, dove ad ogni codifica binaria è associata un'informazione e sequenze identiche verranno elaborate come la stessa informazione. In questo caso: **bits are bits**.

## 1.2 Codice Binario e operazioni in base 2

Il codice binario è fondamentalmente la "lingua" in cui è scritto il linguaggio macchina; come detto prima è una sequenza di 0 e 1 che rappresenta un'informazione. In particolare, il bit all'estremità sinistra è detto **più significativo**, mentre quello al lato opposto è il **meno significativo**.

È grazie alla codifica binaria che è possibile elaborare informazioni come immagini, musica e video, ma soprattutto numeri e caratteri, i quali hanno il codice **ASCII** con uno standard che vede i primi  $127b$  comuni a tutte le lingue.

Ma per quale motivo stiamo considerando solo le potenze del 2? Procediamo a fare un collegamento: il codice binario ha solo *due* cifre utilizzabili, quindi bisognerà ragionare in loro funzione. Noterai, per esempio, che per  $2b \implies 2^2 = 4$  puoi esprimere quattro combinazioni di numeri diverse senza ripetizione; estendendo il ragionamento a valori più alti avrai capito il funzionamento.

Lavorare in una base diversa dal 10 non comporta modifiche nella logica; infatti sono presenti tutte le operazioni elementari, come segue:

| - Addizione - | - Sottrazione - | - Moltiplicazione - |
|---------------|-----------------|---------------------|
| 0    0    0   | 0    0    0     | 0    0    0         |

|   |   |               |   |   |              |   |   |   |
|---|---|---------------|---|---|--------------|---|---|---|
| 0 | 1 | 1             | 0 | 1 | 1 (Carry-in) | 0 | 1 | 0 |
| 1 | 0 | 1             | 1 | 0 | 1            | 1 | 0 | 0 |
| 1 | 1 | 0 (Carry-out) | 1 | 1 | 0            | 1 | 1 | 1 |

La divisione può risultare contro-intuitiva a causa dell'utilizzo della sottrazione. Vediamo con un esempio:  $\frac{11001}{101} = \frac{25}{5}$ .

$$\begin{array}{r}
 \underline{\quad\quad\quad} \\
 \begin{array}{r} 11001 \\ - 101 \\ \hline 0010 \\ - 000 \\ \hline 0101 \\ - 101 \\ \hline 000 \end{array}
 \end{array}
 \qquad
 \begin{array}{r}
 \underline{\quad\quad\quad} \\
 \begin{array}{r} 101 \\ - 101 \\ \hline 010 \\ - 101 \\ \hline 000 \end{array}
 \end{array}$$

Bisogna poter sottrarre il divisore al dividendo quando questo "sta dentro" al primo.

Abbassa 110 e sottraigli 101 perché il divisore ci sta una volta. Otterrai 001, al quale dovrà aggiungere la cifra successiva del dividendo e scriverai "1" come prima cifra del risultato.

Osserva che 10 non ci sta in 101, quindi non gli si può sottrarre nulla e scriverai "0" come seconda cifra del risultato, procedendo ad abbassare l'ultima cifra del dividendo ed ottenere il numero 101 che, guarda un po', è uguale al divisore e quindi ci sta dentro.  $101 - 101 = 000$ , è una divisione intera senza resto. Scrivi "1" come ultima cifra del risultato e hai finito.

Esistono anche altre due operazioni, utili per la *codifica in virgola mobile*, la quale vedremo nelle prossime sezioni, e per velocizzare moltiplicazione e divisione:

- **Shift Left;** Aggiunge uno zero alla fine del numero (Sposta tutte le cifre a sinistra di una posizione).  $1101 \times SL = 11010$ .
- **Shift Right;** Sposta le cifre a destra ed aggiunge uno 0 a sinistra.  $1101 \times SR = 0110$ .

### 1.3 Codifica dei numeri

In questa sezione vedremo come codificare i numeri e le particolarità di ogni algoritmo che svolge tale funzione. Si lavora con cifre binarie con la regola della *Notazione posizionale*, dove il valore di un numero è dato dalla posizione delle sue cifre. Iniziamo con la **codifica standard**.

Questo è un algoritmo utile per lavorare con numeri interi positivi. Bisogna prendere la potenza del 2 più grande che si avvicina al numero da codificare, ma che non lo supera, per poi sottrarla all'altro. Ripetere fin quando il numero iniziale non è "0".

#### Esempio 2. Codifica del numero 683

$$683 - 512 = 171$$

Valore 1 in posizione bit 9

|                  |                             |
|------------------|-----------------------------|
| $171 - 128 = 43$ | Valore 1 in posizione bit 7 |
| $43 - 32 = 11$   | Valore 1 in posizione bit 5 |
| $11 - 8 = 3$     | Valore 1 in posizione bit 3 |
| $3 - 2 = 1$      | Valore 1 in posizione bit 1 |
| $1 - 1 = 0$      | Valore 1 in posizione bit 0 |

Codifica standard di 683: 1010101011.

### 1.3.1 Codifica in modulo e segno

La codifica in modulo e segno non è molto dissimile dalla precedente; infatti l'unica differenza è l'utilizzo di un ulteriore bit nella parte più significativa per marcare il segno positivo "0" o negativo "1".

#### Esempio 3. Codifica del numero -227

|                  |                             |
|------------------|-----------------------------|
| $227 - 128 = 99$ | Valore 1 in posizione bit 7 |
| $99 - 64 = 35$   | Valore 1 in posizione bit 6 |
| $35 - 32 = 3$    | Valore 1 in posizione bit 5 |
| $3 - 2 = 1$      | Valore 1 in posizione bit 1 |
| $1 - 1 = 0$      | Valore 1 in posizione bit 0 |

Ottenuta la codifica standard; 11100011 aggiungiamo il bit del segno:  
 $227 = 011100011 \implies -227 = 111100011$ .

### 1.3.2 Codifica in virgola fissa

La codifica in virgola fissa è un algoritmo capace di tradurre i numeri razionali considerando separatamente parte intera e decimale. Abbiamo La virgola rimane nella stessa posizione della base 10.

In primo luogo bisogna codificare la parte intera come una normale codifica in modulo e segno, mentre per trovare quella decimale bisogna moltiplicare per 2 il numero. Se il risultato è maggiore o uguale a 1, si scrive 1 e si verifica la stessa condizione per la parte decimale risultante. Di norma è specificato quanti bit di precisione deve avere la parte decimale, perché spesso troverai numeri periodici (dove trovi cifre decimali uguali in verifica) e andresti avanti all'infinito.

Se ti vuoi male e vuoi verificare la correttezza del tuo risultato decimale, puoi sommare tutte le potenze negative di 2 e vedere cosa ti esce. Molto probabilmente, un risultato approssimato.

#### Esempio 4. Codifica del numero 56,83 in 3b di precisione

|                  |                        |
|------------------|------------------------|
| Parte intera: 56 | Parte decimale: 0,83   |
| $56 - 32 = 24$   | $0,83 \times 2 = 1,66$ |
| $24 - 16 = 8$    | $0,66 \times 2 = 1,32$ |
| $8 - 8 = 0$      | $0,32 \times 2 = 0,64$ |
| 1 in bit 5       | 1 in bit -1            |
| 1 in bit 4       | 1 in bit -2            |
| 1 in bit 3       | 0 in bit -3            |

Risultato: 111000,110

### 1.3.3 Codifica in virgola mobile

La codifica in virgola mobile o *Floating Point* consente di ottenere numeri particolarmente grandi e piccoli. Risulta utile per avvicinarsi al concetto di numero reale. Un tale valore si esprime nella formula di **Notazione scientifica**:

$$N = \pm Mant \times Base^{\pm exp}$$

Si divide quindi in tre parti a cui è associato un numero specifico di bits da un totale di  $32b$  (float) oppure  $64b$  (double); le quali sono:

- *Segno*; 1b.
- *Esponente*; 8b, oppure 9b in doppia precisione.
- *Mantissa*; 23b, oppure 54b in doppia precisione.

Prima di poter lavorare sul numero è necessario **normalizzarlo**, ovvero portarlo in una forma dove rimane una singola cifra intera attraverso le operazioni di shifting a destra o sinistra.

Dipendentemente da quante posizioni sono modificate, sarà necessario sommare, se  $SR$  o sottrarre, se  $SL$ , tal numero all'esponente. Una volta ottenuto, bisogna sommargli  $+127^2$  e hai fatto.

Notare che nella codifica della mantissa la cifra intera non è mai scritta perché è sempre la stessa e si può omettere.

#### Esempio 5. Codifica del numero -30,375 in virgola mobile

1. Convertiamo in binario il numero con la codifica in virgola fissa:

|                          |                             |
|--------------------------|-----------------------------|
| Parte intera: 30 = 11110 | Parte decimale: 0,375 = 011 |
| $30 - 16 = 14$           | $0,375 \times 2 = 0,75$     |
| $14 - 8 = 6$             | $0,75 \times 2 = 1,5$       |
| $6 - 4 = 2$              | $0,5 \times 2 = 1$          |

---

<sup>2</sup>Questa operazione si chiama **Eccesso 127** ed è necessaria per codificare l'esponente nello standard IEEE754.

$$2 - 2 = 0$$

Codifica in virgola fissa: 11110,011

2. Procediamo con la normalizzazione:

$$11110,011 / 1000 = 1,1110011 \times 2^4 \quad \text{Sommeremo 4 all'esponente.}$$

La mantissa sarà: 1110011...0.

3. Troviamo l'esponente:

Non c'è un esponente nel numero richiesto, quindi:  $1*4 + 127 = 131$ .

$$131 - 128 = 3 \quad 1 \text{ in bit 7}$$

$$3 - 2 = 1 \quad 1 \text{ in bit 1}$$

$$1 - 1 = 0 \quad 1 \text{ in bit 0}$$

$131 = 10000011$  - Esponente trovato!

4. Ricomponiamo il tutto

- Segno: 1

- Esponente: 10000011

- Mantissa: 1110011...0

La codifica in virgola mobile di  $-30,375$  è: 1100000111110011...0

### Esempio 6. Trasformazione in decimale di 0100011001000110...0

1. Dividiamo nelle varie parti i bits

- Segno: 0

- Esponente: 10001100

- Mantissa: 1000110...0

2. Otteniamo l'esponente decimale

$$128 + 8 + 4 = 140$$

$140 - 127 = 13$  - Esponente trovato!

3. Ricaviamo la mantissa

Considera che ora stai lavorando con cifre decimali, quindi le potenze del 2 dove sta il valore 1 saranno negative. In questo caso notiamo che si trovano nelle posizioni -1, -5 e -6, quindi:

$2^{-1} + 2^{-5} + 2^{-6} = 0,547$  - Valore della mantissa trovato!

#### 4. Ricostruiamo il decimale

Il segno è positivo, ricorda di sommare 1 alla mantissa trovata e moltiplica ad essa l'esponente. Hai finito.

Risultato:  $1 \times 1,547 \times 2^{13} = 1,547 \times 2^{13}$

Ci sono infine alcuni casi di cifre particolari a cui fare attenzione:

- $+0$ ; Tutte le cifre sono 0.
- $-0$ ; Tutte le cifre sono 0, tranne quella del segno.
- $+\infty$ ; Esponente massimo, il resto a 0.
- $-\infty$ ; Esponente massimo e bit segno a 1, il resto a 0.
- **Not a Number**; Qualunque numero superi gli infiniti.
- $2$ ; Tutte le cifre sono 0, tranne il bit più significativo dell'esponente.
- $2^{-145}$ ; Tutte le cifre sono 0 tranne il bit meno significativo. Si tratta del numero più piccolo ottenibile.

### 1.3.4 Codifica in complemento a 1 e a 2

Parleremo solamente della codifica in complemento a 2 in quanto è un singolo passaggio in più rispetto all'altra.

Il suo scopo principale è dividere a metà il totale delle codifiche ottenibili da  $2^n b$ , rendendo più semplice ottenere numeri lunghi. Supponiamo di avere a disposizione 4 bits, quindi 16 combinazioni diverse. Per ottenere il complemento ad 1 basta invertire tutte le cifre, mentre per il complemento a 2 bisognerà poi sommare 1 ad ogni combinazione.

#### Esempio 7. Codifica di -3 in complemento a 2 con 4b di precisione

$3 = 0011 \rightarrow 1100$  in compl. ad 1  
 $1100 + 1 = 1101$  in compl. a 2

Segue una lista indicativa di tutte le codifiche in precisione 4b per il complemento ad 1 e 2:

| Codifica normale | Compl. ad 1 | Compl. a 2 |
|------------------|-------------|------------|
| 0000 = 0         | 1111 = -8   | 1111 = -1  |
| 0001 = 1         | 1110 = -7   | 1110 = -2  |
| 0010 = 2         | 1101 = -6   | 1101 = -3  |
| 0011 = 3         | 1100 = -5   | 1100 = -4  |
| 0100 = 4         | 1011 = -4   | 1011 = -5  |
| 0101 = 5         | 1010 = -3   | 1010 = -6  |
| 0110 = 6         | 1001 = -2   | 1001 = -7  |
| 0111 = 7         | 1000 = -1   | 1000 = -8  |

### 1.3.5 Codifica in esadecimale

Soon!

## Chapter 2

# Circuiti e Ottimizzazione

La domanda principale di questo capitolo è "Come realizzare un sistema digitale?" Ebbene, è necessario un modello apposito che consentirà di rappresentare appropriatamente la sua struttura. Per far ciò useremo l'**algebra di Boole**; uno spazio ad  $n$  dimensioni misurate in base all'alfabeto che voglio dare allo spazio. Qui sono presenti solo due valori come in base binaria: 0 e 1.

Secondo Boole, se si definisce una funzione che genera valori in un altro spazio, generalmente scritta  $f(B^n) \rightarrow B^m$ , questa potrà essere rappresentata tramite gli operatori elementari; in pratica ci puoi fare qualunque cosa.

Utilizzando questo spazio è possibile passare da una scrittura ambigua ad una formale, chiara per quelli che saranno i nostri scopi; la rappresentazione dei sistemi avviene infatti tramite le tabelle di verità, che mostrano le funzioni booleane.



Figure 2.1: Funzione booleana XNOR

Nella tabella di verità vengono definiti:

- **Onset:** L'insieme dei punti dello spazio di ingresso dove la funzione vale 1. Gli elementi si dicono **mintermini**.

- **Offset:** L'insieme dei punti dello spazio di ingresso dove la funzione vale 0. Gli elementi si dicono **maxtermini**.

L'unione di questi due insiemi è complementare, poiché rappresentano tutto lo spazio usato dalla funzione. Inoltre, per mettere in relazione i bit con gli operatori si utilizzano le seguenti espressioni:

$$m_3 = a \times b, m_0 = !a \times !b$$

In tal merito, definiamo **letterale** una qualunque coppia {variabile, Valore} ed è l'unità di misura usata per definire la complessità di un circuito. Infine, la funzione in output si scrive attraverso una somma di prodotti o somma di min/maxtermini, per esempio:  $O = abc + !ac + b!c$  e avremo una complessità di 7 letterali.

## 2.1 Realizzazione di porte logiche

Le porte logiche e di conseguenza qualunque circuito elettronico sono governati dal flusso di elettricità gestito dai **transistors**; interruttori comandati. Nella tecnologia **CMOS** (Complementary Metal Oxide Semiconductor) sono implementati solo due tipi:

- **Interruttore N:** Se riceve corrente, conduce l'elettricità.
- **Interruttore P:** Se riceve corrente, ferma il flusso.



Figure 2.2: Tipi di transistors

Per usare termini corretti, quando un transistor è chiuso e scorre la corrente si dice che è in **conduzione**, mentre se è aperto e la corrente è bloccata diciamo che c'è un segnale di **interdizione**.

Di base i circuiti vanno letti da sinistra a destra, e grazie ai due interruttori appena visti è possibile creare le porte logiche elementari **AND**, **OR**, **NOT**, **NAND**, **NOR**, **XOR**, **XNOR**. Adesso abbiamo tutti gli strumenti per la creazione di un circuito elettronico. Ciò non significa tuttavia che possiamo buttarci senza cognizione di causa; ragion per cui bisognerà ragionare sui costi e le parti effettivamente necessarie al processo di realizzazione. Il nostro scopo da adesso diventa l'**ottimizzazione** dei nostri progetti.



Figure 2.3: Porte logiche elementari

## 2.2 Minimizzazione a due livelli

Non esiste un solo modo per ottimizzare un circuito, bensì più tecniche, tutte con la loro ragion d'essere in base ai nostri scopi. Una prima semplice regola, per esempio è l'**assorbimento**, da utilizzare assieme all'algebra di Boole. Bisogna innanzitutto tenere a mente queste proprietà:

- Identità:  $1 \times x = x, 0 + x = x$
- Elemento nullo:  $0 \times x = 0, 1 + x = 1$
- Idempotenza:  $x \times x = x, x + x = x$

- Inverso:  $x \times \bar{x} = 0$ ,  $x + \bar{x} = 1$

Valgono anche le proprietà associative, commutative e distributive. Procediamo col dare la definizione della regola:

**Definizione 1. Regola dell'assorbimento**

Sia una funzione booleana scritta in somma di prodotti; se due di questi sono a distanza di Hamming 1, è possibile sommare le parti inverse ed ottenere il valore 1, riducendo i letterali e quindi la complessità della funzione.

$$x(x + y) = x, x + (xy) = x$$

**Esempio 8.** Si ottimizzi la seguente funzione in somma di prodotti:

$$O = \overline{xyz} + \overline{xy}z + x\overline{yz} + x\overline{y}z + xyz$$

Utilizziamo l'assorbimento; per prima cosa bisogna vedere se sono presenti termini a distanza di Hamming 1 per semplificarli; ripetere il processo fin quando non è più possibile.

$$\begin{aligned} O &= \overline{xyz} + \overline{xy}z + x\overline{yz} + x\overline{y}z + xyz \\ &= \overline{xy}(\overline{z} + z) + \overline{yz}(x + \overline{x}) + \overline{y}z(x + \overline{x}) + x\overline{y}(\overline{z} + z) + xz(\overline{y} + y) \\ &= \overline{xy} + \overline{yz} + \overline{y}z + x\overline{y} + xz \\ &= \overline{y} + \overline{y} + xz \\ &= \overline{y} + xz \end{aligned} \tag{2.1}$$

In parole molto povere, bisogna vedere uno per uno tutti i termini che presentano un solo bit di differenza fra di loro, ovvero a **distanza di Hamming 1**, e rimuovere le due parti inverse, poiché equivarranno ad 1. Nello svolgimento dell'ottimizzazione, chiameremo



Figure 2.4: Cubo delle distanze fra codifiche

i termini che non è più possibile ridurre come **implicanti primi**; dove è vero che li vogliamo, è possibile che più implicanti primi coprano lo stesso mintermine, creando una ripetizione inutile. Ci è quindi necessario cercare gli **implicanti primi essenziali**, ovvero un implicante che tocca un mintermine non raggiunto dagli altri.

Subentra di conseguenza la questione della **copertura minima**, ovvero il problema di trovare il numero minimo di implicanti necessari per coprire ogni mintermine; per lavorare useremo i due metodi nelle prossime sezioni.

### 2.2.1 Mappa di Karnaugh

Da me soprannominato "Il Sarrus dell'ottimizzazione", è un algoritmo utilizzabile con funzioni  $f(B^3)$  o massimo per  $f(B^4)$ . Servirà prendere il cubo delle distanze visto prima ed immaginare di piellarlo. Usciranno le celle corrispondenti agli spigoli del solido.

Una particolarità è che il cubo deve essere visto come se fosse impossibile andare out of bounds; quindi una volta superato un lato estremo, ci si trova subito dopo in quello opposto, esattamente come in Pacman. Le celle adiacenti sono quelle a distanza



Figure 2.5: Mappa di Karnaugh

di Hamming 1 e la funzione ottimizzata è quella di prima, con risultato  $O = \bar{y} + xz$ .

### 2.2.2 Algoritmo di Quine Mc-Cluskey

Trattasi del Laplace di questa materia, sarà l'algoritmo che useremo per l'ottimizzazione dei circuiti combinatori. Può essere utilizzato con ogni tipo di funzione, ma aumenta di complessità in base a quante entrate presenta. Generalmente, segue i passaggi:

1. Partendo dalla tabella di verità completa, prendere i suoi mintermini e ordinarli in base al numero di 1 contenuti nella combinazione di ingresso.
2. Confrontare ogni configurazione con tutte quelle del gruppo successivo. Se presenta distanza di Hamming a valore 1 (più semplicemente, se le due combinazioni di

entrate sono uguali tranne per un input), inserire un **don't care** dove gli inputs differiscono.

3. Ottenuta la tabella ridotta, ripetere il punto 2 fin quando non è più possibile ridurre i mintermini. Fatto ciò, abbiamo ottenuto gli implicanti primi.
4. Creare una seconda tabella indicando sulle  $y$  i mintermini e sulle  $x$  le entrate. Lo scopo è trovare quei mintermini sufficienti per coprire tutti gli inputs, saranno gli implicanti primi essenziali.
5. Scrivere la soluzione in somma di prodotti. Finito.

Metodo decisamente macchinoso, che tuttavia permette di ottenere tramite semplici passaggi la funzione ottima. Segue immagine per evidenziare il caso base.

### 2.2.3 Funzioni parzialmente specificate

Quine Mc-Cluskey è versatile. È possibile utilizzarlo anche con funzioni, le quali hanno combinazioni risultanti come don't cares. L'algoritmo non cambia molto, bisognerà solamente considerare il DC-set come altri mintermini per poi ignorarlo nella tabella finale.

## 2.3 Dispositivi programmabili

I dispositivi programmabili sono componenti hardware dotati di porte **PROM**, programmable read only memory. La loro implementazione comporta alcune conseguenze:

- Essendo il circuito programmabile, è modificabile anche dopo la sua produzione, quindi, in caso di necessità, si risparmierà sui materiali.
- Eventuali bug presenti nel circuito potranno essere facilmente risolti grazie a questa flessibilità.
- La logica di programmazione copre necessariamente spazio nell'area; verrà sempre utilizzata, richiedendo energia.
- Risulta tendenzialmente più lento rispetto ad un dispositivo dedicato.

Una prima evoluzione dei circuiti PROM sono i **PLA**, i programmable logic array, con due livelli di porte logiche. Col tempo si evolsero in **CPLD**, complex programmable logic devices, un'interconnessione di più circuiti PLA su una scheda di silicio. Dopodiché nacquero gli **FPGA**, field programmable gate array, che sono i dispositivi programmabili odierni. Sono composti da vari CPLD. Infine abbiamo gli **SoC**, system on chip, l'evoluzione più recente utilizzata su vasta scala. Si tratta di una FPGA controllata da una CPU.

## 2.4 Sintesi combinatoria multilivello

Finora è stato visto come sintetizzare circuiti combinatori ad un massimo di due livelli; è tuttavia possibile espandere il concetto ad  $n$  livelli, accettando un compromesso di ottenere soluzioni approssimate, tramite tecniche euristiche. In tal merito, introduciamo il concetto di **ritardo**, il valore tempo impiegato per ottenere gli outputs da un circuito, il quale è dato dal **cammino critico**, il percorso più lungo che la corrente attraversa dall'entrata all'uscita. Le tecniche sovramenzionate procedono su due passi principali:

1. Ottimizzazione eseguita ignorando i vincoli implementativi, come quelli imposti dalla libreria tecnologica o al fanin/fanout.
2. Raffinamento del precedente risultato in base ai vincoli implementativi.

Non sarà un risultato ottimo come lo darebbe la fattorizzazione, tuttavia riduce il carico computazionale. Per lavorarci, introduciamo i relativi **modelli di rappresentazione** e le **trasformazioni** con le quali si andrà ad operare.

La struttura di un circuito può essere rappresentata tramite una **rete logica**, una interconnessione di nodi associati a funzioni booleane ad una sola uscita, l'ultime chiamate **funzioni scalari**. Questa collega i comportamenti delle funzioni dei nodi e viene rappresentata tramite **grafi orientati aciclici**, "DAG"  $G(V, E)$ , dove;

- $V$  è l'insieme dei nodi, diviso in  $V^I$  (nodi d'ingresso),  $V^O$ , (nodi d'uscita)  $V^G$ , (nodi interni a cui è associata una funzione scalare)
- $E$  è l'insieme dei lati.
- Ad ogni nodo si associa una variabile temporanea.

Bisognerà quindi capire su quale parte operare per ottimizzare; il ritardo, riducendo i tempi di esecuzione, o l'area, riducendo il carico computazionale? Tendenzialmente si cerca di trovare un equilibrio fra i due e gli algoritmi o **scripts** usati si dividono in algoritmi di **ottimizzazione**, che riducono il livello di complessità, e di **ristrutturazione**, i quali restaurano il circuito ad uno stato più complesso ma meno carico. Si useranno esclusivamente strumenti automatici.

## 2.5 Mapping tecnologico

Il **mapping tecnologico** è il problema di implementazione dei circuiti sequenziali mediante le porte logiche di una data libreria tecnologica.

Una volta completato il processo di minimizzazione tramite gli scripts, si otterrà un risultato in somma di prodotti, rappresentativo della minima realizzazione teorica.

Ci occuperemo ora di mapparlo su una libreria tecnologica con lo scopo di renderlo realizzabile per la specifica architettura.

L'algoritmo alla base del processo è detto **tree-mapping**, una dispiegazione dei nodi come se fosse un grafico ad albero. L'unico limite risulta, quindi, la necessità di non avere nodi predecessori. Il circuito con la rispettiva libreria, ambo convertiti in grafici albero, potranno poi essere scritti sulle seguenti architetture:

- **ASIC:** Il cui processo è diviso in due parti:
  1. **Placing:** Posizionamento delle celle nella scheda.
  2. **Routing:** Collegamento delle celle fra loro.
- **FPGA:** Il cui processo di placing corrisponde alla programmazione delle celle, le quali hanno egual dimensione e capacità.

# Chapter 3

## Progettazione Digitale

### 3.1 Circuiti sequenziali

Nella progettazione dei sistemi digitali ci sono due principali classi di sistemi:

- **Circuiti combinatori:** Il valore delle uscite dipende interamente dalla combinazione di inputs.
- **Circuiti sequenziali:** Il valore delle uscite dipende dalla combinazione di input attuale e dalle precedenti ricevute.

Semplicemente, quando si parla di sistema sequenziale, abbiamo la possibilità di salvare in memoria uno **stato**, la compressione di tutto ciò che il sistema ha eseguito fino a quel momento. La loro necessità è presto detta, vedendo solo come un ciclo distrugge i circuiti combinatori.

Esistono anche due sottoinsiemi dei circuiti sequenziali, ovvero gli **asincroni**, indipendenti dalla variabile del tempo **clock**, e i **sincroni**, dalla quale sono dipendenti per un corretto funzionamento.

#### 3.1.1 FSM - Finite State Machines

Le **macchine a stati finiti** stanno alla base dell'informatica tutta; hanno lo scopo di salvare e mostrare l'evoluzione del programma fra gli stati in base ad una combinazione di ingresso e generandone una di uscita. La sua funzione è data da:

$$M = \langle S, I, O, \delta, \lambda, s \rangle$$

Dove le parti sono:

- $S$ : Insieme degli stati, necessariamente finito e non vuoto.

- $I$ : Alfabeto di ingresso,  $|I| = 2^n b$ .
- $O$ : Alfabeto di uscita,  $|O| = 2^m b$ .
- $\delta$ : Funzione allo stato prossimo. Riceve stato e ingresso correnti per ritornare il successivo.  $\delta = S \times I \rightarrow S$ .
- $\lambda$ : Funzione di uscita; la sua definizione dipende dal tipo di FSM usata:
  - **Macchina di Mealy**: Genera l'uscita in base a stato ed input correnti.  $\lambda = S \times I \rightarrow O$ .
  - **Macchina di Moore**: Genera l'uscita in base allo stato corrente.  $\lambda = S \rightarrow O$ .
- $s$ : Stato iniziale, probabile che non venga specificato.

Le FSM si possono rappresentare mediante i seguenti due costrutti:

#### State Transition Table

Per ogni coppia [STATO/INPUT] si indica lo stato prossimo e l'uscita. Nelle colonne saranno inseriti i simboli di ingresso, mentre nelle righe lo stato corrente. Le intersezioni dipendono dal tipo di macchina scelta.

$$M = \langle \{A, B, C\}, \{0, 1\}, \delta, \lambda \rangle$$

#### State Transition Graph

Costrutto matematico costituito da archi e nodi collegati. I nodi rappresentano gli stati, mentre gli archi lo spostamento da uno stato all'altro. Sono basati sulle state transition tables e vanno interpretati come dei percorsi.

### 3.2 Sintesi delle funzioni $\lambda$ e $\delta$ , assegnazione stati

### 3.3 Minimizzazione degli stati

### 3.4 Datapath e componenti

Inserire qui anche registro e mux segnati nella prima sezione di questo capitolo

- 3.5 Modello FSMD - Finite State Machine with Data-path**
- 3.6 Derivazione FSMD da algoritmo**
- 3.7 Modello dispositivi programmabili**

# **Chapter 4**

## **Architetture dei Calcolatori**

### **4.1 Modello di Von Neumann e Unità funzionali del calcolatore**

### **4.2 CPU - Central Processing Unit**

#### **4.2.1 CPU Cablata**

#### **4.2.2 CPU Microprogrammata**

#### **4.2.3 Microistruzioni della CPU**

### **4.3 Metodi di I/O, Segnale Interrupt**

### **4.4 Direct Memory Access, BUS e Arbitraggio**

### **4.5 Stati di un processo**

### **4.6 Pila e gestione Interrupt**

### **4.7 Tipi di Memoria RAM**

Static RAM, Dynamic RAM, Banchi di memoria ed esercizi.

**4.8 Caratteristiche delle memorie con relativa gerarchia**

**4.9 Memoria Cache e Virtuale**

**4.10 Pipelining**

**4.11 Architettura LC-3**

**4.12 Modello CISC e RISC**

**4.13 Architetture parallele**

# **Chapter 5**

## **SIS e Verilog**

**5.1 Introduzione a SIS**

**5.2 Sintesi combinatoria esatta**

**5.3 Sintesi combinatoria approssimata multilivello**

**5.4 Modellazione di FSM**

**5.5 Modellazione di FSMD**

**5.6 Introduzione a Verilog**

**5.7 Modellazione in Verilog**

**5.8 Modellazione di FSM**

**5.9 Modellazione di FSMD**

5 - comprende: Sis - Subsequential interactive synthesis Linguaggi HDL - Verilog

# **Chapter 6**

## **Il linguaggio Assembly**

### **6.1 Introduzione ad Assembly**

### **6.2 Istruzioni e Sintassi**

Stringhe e numeri

### **6.3 Debugging e Makefile**

### **6.4 Relazione ISA-FSMD su LC-3**

### **6.5 Funzioni e passaggio di parametri**

### **6.6 Confronto con il C**