

# **Elaborato del Progetto di Reti Logiche**

Oleg Nedina



Anno Accademico: 2024/2025

Matricola: 225897      Codice Persona: 10905938

Docente Referente: Fabio Salice

# Indice

## **Capitolo 1: Introduzione e definizione del progetto.**

- 1.0 : Introduzione.
- 1.0.1 : Definizione della specifica.
- 1.1 : Definizione e logica delle componenti.
- 1.2 : Storico delle implementazioni e scelta del design finale.

## **Capitolo 2: Definizione dell'architettura del componente.**

- 2.0 : Logica implementata.
- 2.1 : Definizione della FSA e flusso comportamentale.
- 2.2 : Definizione degli stati.
  - 2.2.1 RESET.
  - 2.2.2 IDLE.
  - 2.2.3 SETUP\_REQUEST.
  - 2.2.4 SETUP\_WAIT\_DATA.
  - 2.2.5 SETUP.
  - 2.2.6 LOAD\_REQUEST.

- 2.2.7 LOAD\_WAIT.
- 2.2.8 LOAD.
- 2.2.9 SHIFT\_WAIT.
- 2.2.10 START\_FILTER.
- 2.2.11 FILTER\_WAIT.
- 2.2.12 NORMALIZ.
- 2.2.13 SATUR\_WAIT.
- 2.2.14 SATUR.
- 2.2.15 WRITE\_WAIT.
- 2.2.16 WRITE REQUEST.
- 2.2.17 DONE.

2.3 : Conclusioni sul comportamento.

### **Capitolo 3: Testbench e risultati sperimentali.**

- 3.0 : Strumenti utilizzati e obiettivi dei test.
- 3.1 : I test e la loro copertura.
  - 3.1.1 tb\_2425.
  - 3.1.2 tb\_no\_rewrite\_input.
  - 3.1.3 tb\_s\_masking.
  - 3.1.4 tb\_sign\_symmetry.
  - 3.1.5 tb\_midrun\_reset.

- 3.1.6 tb\_setup\_reset.
- 3.1.7 tb\_k\_small\_edges.
- 3.1.8 tb\_coeff\_extremes\_sat.
- 3.1.9 tb\_ignore\_start\_while\_busy.
- 3.1.10 tb\_addr\_high\_boundary.
- 3.1.11 tb\_back\_to\_back\_runs.
- 3.1.12 tb\_k\_high\_stress.
- 3.1.13 tb\_k\_zero.
- 3.1.14 tb\_final\_stress.

## **Capitolo 4: Conclusioni.**

- 4.0 : Conclusioni Generali.
  - 4.0.1 Riscontri sperimentali.
  - 4.0.2 Possibilità di miglioramento.

## CAP.1: INTRODUZIONE E DEFINIZIONE DEL PROGETTO

### 1.0 INTRODUZIONE

L'elaborato si occupa di descrivere il progetto finale di *Reti Logiche* svolto relativamente all'anno accademico 2024/25. Si vanno ad affrontare i problemi posti dalla specifica, il modo in cui questa è stata analizzata e i vari tentativi che hanno portato alla sintesi del modulo finale, comprendendo considerazioni su ciò che si è testato e sui possibili margini di miglioramento, i quali però verrano solo accennati non essendo stati richiesti esplicitamente dalla stessa.

Il progetto è stato svolto individualmente da me: Oleg Nedina, Matricola 225897, Codice Persona 10905938, con professore di riferimento Fabio Salice.

L'elaborato comprenderà varie parti; doveroso però informare che la specifica non verrà completamente trascritta all'interno del lavoro, ma verranno riportate solo le informazioni utili per comprendere le scelte di design. Si rimanda al file ufficiale fornito dai docenti per maggiori dettagli.

## 1.0.1 DEFINIZIONE DELLA SPECIFICA

La specifica richiede di creare un modulo in VHDL che, dopo un segnale di *start*, richieda la lettura di dati da memoria per il setup di un filtro differenziale da applicare successivamente ad una sequenza di ordine prestabilito durante la fase iniziale.

I vari dati dopo essere stati modificati tramite il filtro verranno poi trascritti dal modulo stesso nella memoria con cui si interfaccia. Più nel dettaglio, ci si occupa, leggendo un byte alla volta, di:

1. leggere i primi 17 byte che contengono la lunghezza della sequenza di dati da rielaborare, l'ordine del filtro e i coefficienti del filtro stesso;
2. rielaborare e scrivere in memoria i dati della sequenza.



Il modulo quindi è composto principalmente da un'interfaccia che presenta tutti i segnali standard per comunicare con la memoria e vari "sotto moduli" interni per il corretto comportamento dello stesso.

Si riportano i segnali di comunicazione e una breve spiegazione:

- ▶ *i\_clk*: consente la sincronizzazione sul medesimo segnale di clock fornito dalla memoria;
- ▶ *i\_RST*: unico segnale asincrono; corrisponde al reset del sistema ed è usato per inizializzare la macchina prima dell'arrivo del segnale di *start*;
- ▶ *i\_start*: segnale che avvia il funzionamento del modulo;
- ▶ *o\_done*: segnale che permette al modulo di notificare alla memoria la fine della rielaborazione;
- ▶ *o\_mem\_addr*: segnale in uscita per inviare l'indirizzo alla memoria;
- ▶ *i\_mem\_data*: segnale in ingresso contenente il dato in seguito alla richiesta di lettura;
- ▶ *o\_mem\_data*: segnale in uscita contenente il dato da scrivere in memoria;
- ▶ *o\_mem\_en*: segnale di enable per comunicare con la memoria;
- ▶ *o\_mem\_we*: segnale di enable per la scrittura in memoria.

Si considerino gli *enable* attivi a 1.

I segnali contenenti dati sono vettori, mentre i segnali di *clock*, *start*, *done*, *rst* ed *enable* sono a singolo bit.

## 1.1 DEFINIZIONE E LOGICA DELLE COMPONENTI

Il componente si comporta come una macchina che gestisce tutta l'interazione con la memoria al di fuori dello *start* e del *reset*.

Richiede i vari dati per configurare il proprio setup e poi inizia con la elaborazione dei dati di sequenza.

È divisibile in cinque parti fondamentali: *interfaccia di comunicazione*, *modulo richiesta di lettura*, *modulo di contenimento dati*, *modulo di applicazione del filtro*, *modulo di richiesta scrittura*.

L'organo di controllo è una macchina a stati finiti (FSA); ogni blocco è stato suddiviso in sottofasi facenti parte della stessa. La descrizione dettagliata seguirà in seguito.



## 1.2 STORICO DELLE IMPLEMENTAZIONI E SCELTA DI DESIGN FINALE

Inizialmente il progetto è stato sviluppato come un insieme di vari moduli separati tra di loro, tutti volti a fare specifiche macro-azioni. Questo *approccio*, per quanto facilmente comprensibile a livello di scrittura, portava a codice molto lungo e a molti rischi di *incongruenze* tra la comunicazione dei vari moduli.

La logica implementata all'inizio non è stata però *abbandonata* in maniera completa. Prendendo sempre più padronanza con il programma di sviluppo (Vivado v. 2016.1) mi sono reso conto di come molte parti dei vari sotto-moduli non necessitassero di componenti *ad hoc*, ma il programma stesso fosse in grado, sfruttando le funzionalità standard, di creare automaticamente tutti i vari *mux*, *adders* etc... necessari alla costruzione di un modulo come quello richiesto da specifica.

Si passa quindi da una *versione 0* a una *versione 1* che comprendeva una vera e propria macchina a stati collegata ancora a vari sotto-moduli, i quali — versione dopo versione — sono stati sempre più implementati all'interno della FSA come stati veri e propri più che componenti a parte.

Si arriva così alla *versione 2*, una FSA che implementa un solo modulo esterno, ovvero uno *shift register* a 7 celle, ma non per una questione pratica bensì per una scelta personale.

Si cerca di implementare una logica classica, ovvero "uno stato per uno scopo preciso" e, in base a dei segnali interni (contatori), evolve di stato in stato in maniera differente nel tempo.

## 2 considerazioni sulle implementazioni:

- ▶ la prima è che la logica dei moduli iniziali si era dimostrata corretta ma incompatibile con uno sviluppo *scalabile* (questo dipende dal tipo di progetto richiesto); si è quindi preso ciò che funzionava indipendentemente dallo stato della macchina e lo si è trascritto sotto forma di stati;
- ▶ la seconda è che per garantire robustezza si sono utilizzati molti più stati del necessario; non avendo limiti a livello di performance ho preferito rimanere il più sicuro possibile.



Versione 0: *modulare*.



Versione 2: *FSA finale*.

## CAP.2: DEFINIZIONE DELL'ARCHITETTURA DEL COMPONENTE

## 2.0 LOGICA IMPLEMENTATA

È stata scelta una FSA ; questa scelta favorisce semplicità di scrittura e di comprensione, mantenendo al contempo una buona capacità di elaborazione. Ogni stato è da interpretare come un *sotto-modulo* che svolge determinate azioni al fine del corretto funzionamento complessivo.

Il modulo è composto da due *process* sincroni principali: uno dedicato univocamente al calcolo dello *stato presente* e dello *stato prossimo*; l'altro dedicato alla implementazione dei calcoli svolti dai singoli stati della FSA.



## 2.1 DEFINIZIONE DELLA FSA E FLUSSO COMPORTAMENTALE

La FSA comprende un totale di **17 stati** che verranno specificati nel paragrafo successivo.

Il flusso è quello tipico di un'architettura di questo tipo e in questo mini-paragrafo si descrivono i segnali e i componenti usati all'interno della implementazione:

- ▶ **Shift register a 7 celle** per mantenere i valori letti da memoria e usarli nel filtro; è collegato tramite 7 linee di uscita (una per dato), una linea di ingresso per il caricamento , un segnale di sincronizzazione con il resto della macchina e un segnale di rst.
- ▶ **Due segnali di tipo state** per tracciare l'evoluzione del modulo: `current_state` e `next_state`.
- ▶ **Due contatori interi**: `cnt_setup` (0..17) per i dati di setup, e `cnt_data` (0..2 147 483 647) per i dati da rielaborare.



Shift register 7 celle.



Adder+registro (logica di conteggio/accumulo).

- ▶ **Segnali** `k1` e `k2` per memorizzare la lunghezza della sequenza, combinati nel segnale `K`.
- ▶ **Segnale** `s` per il tipo di filtro ( se  $S(0) = 0 \rightarrow$  ordine 3,  $1 \rightarrow$  ordine 5), mappato nel segnale di supporto `filter_type` a singolo bit.
- ▶ **Coefficienti** `C1..C14` memorizzati nell'ordine descritto dalla specifica; saranno usati nelle applicazioni del filtro.
- ▶ **Segnali di supporto** `acc` e `norm` (tipo `integer`) per facilitare i calcoli del filtro; il risultato, prima della scrittura in memoria, viene troncato in `result_byte` di tipo `std_logic_vector(7 downto 0)`.
- ▶ **Segnali di mappatura** per ciascun segnale dell'interfaccia (stesso tipo, non *in/out*) così da semplificare i calcoli e favorire la sintesi.

## 2.2 DEFINIZIONE DEGLI STATI

Si procede quindi a definire ogni stato della FSA e a specificare che cosa svolgono all'interno del modulo:

- ▶ **2.2.1 RESET**

Azzera tutti i segnali del modulo e dei componenti collegati, in modo da reinizializzare la macchina.

- ▶ **2.2.2 IDLE**

Raggiunto dopo il *reset*; è lo stato di attesa per *start* = 1. Lo *start* avvia il contatore di setup. Se dopo *reset* arriva subito *start*, questo stato è saltato e si passa al successivo.

- ▶ **2.2.3 SETUP\_REQUEST**

Porta alto il segnale di richiesta lettura da memoria e calcola l'indirizzo da cui leggere.

- ▶ **2.2.4 SETUP\_WAIT\_DATA**

Stato di supporto per consentire l'assestamento dei segnali.

- ▶ **2.2.5 SETUP**

Comportamento dipendente da *cnt\_setup*. L'ordine dei dati (fisso per specifica) consente di associare, in base a *cnt\_setup*, il dato letto al registro corretto. Se *cnt\_setup* < 17 si torna a **SETUP\_REQUEST**; altrimenti si passa a **LOAD\_REQUEST** ed entra in funzione *cnt\_data*.

▶ **2.2.6 LOAD\_REQUEST**

Calcola l'indirizzo di memoria di lettura del dato su cui verrà applicato il filtro.

▶ **2.2.7 LOAD\_WAIT**

Garantisce che l'indirizzo di memoria di lettura sia valido/stabile.

▶ **2.2.8 LOAD**

Inserisce nello *shift\_register* (inizialmente azzerato) il dato letto al ciclo precedente. Se *cnt\_data* < K+6 si prosegue; se *cnt\_data* = K+6 si va a **DONE**.

▶ **2.2.9 SHIFT\_WAIT**

Stato di supporto per l'assestamento dei segnali dopo lo shift.

▶ **2.2.10 START\_FILTER**

In base al *filter\_type* (ordine 3 o 5) calcola acc come somma dei prodotti tra i 7 dati nello *shift* e i coefficienti:  $C_{i2}$  ( $i2 = 2..6$ ) per ordine 3, oppure  $C_{i3}$  ( $i3 = 8..14$ ) per ordine 5. Il calcolo è in integer; seguiranno conversione e saturazione prima del ritorno a *std\_logic\_vector*.

▶ **2.2.11 FILTER\_WAIT**

Stato di supporto per l'assestamento dei segnali dopo il calcolo di acc.

▶ **2.2.12 NORMALIZ**

Prepara la normalizzazione: limita a 127 per eccesso e a -128 per difetto usando una variabile di supporto come accumulatore secondo la specifica. Per i valori negativi si applica la correzione +1 di approssimazione. Qui si calcola solo il numero da normalizzare; la saturazione vera e propria avverrà in **SATUR**.

▶ **2.2.13 SATUR\_WAIT**

Stato di supporto per la stabilizzazione dei segnali.

▶ **2.2.14 SATUR**

Applica la saturazione a 127 / -128; se non necessaria, il dato resta invariato. Il risultato è scritto in `result_byte` convertito in `std_logic_vector(7 downto 0)`. Conclude i sotto-stati avviati da **START\_FILTER**.

▶ **2.2.15 WRITE\_WAIT**

Stato di supporto; carica il dato calcolato in `result_byte` e attende l'assestamento.

▶ **2.2.16 WRITE REQUEST**

Scrive il dato in memoria se `cnt_data` è  $> 3$  e  $< K + 3$ . Calcola l'indirizzo di scrittura come  $\text{base} + 17 + K + \text{cnt\_data} - 3$ ; abilita i segnali di lettura/scrittura, incrementa `cnt_data` e ritorna a **LOAD\_REQUEST**.

▶ **2.2.17 DONE**

Come **RESET**, ma alza `done` per indicare la fine dell'elaborazione; segue reinizializzazione dell'intero modulo.

## 2.3 CONCLUSIONI SUL COMPORTAMENTO

La FSA ha un comportamento standard e coerente; i dati vengono scritti solo se  $\text{cnt\_data} \in (3, K + 3)$  perché il filtro si applica al dato in **posizione centrale** dello *shift register* (quarta cella).

Per ottenere l'allineamento corretto bisogna dunque caricare almeno tre dati prima di iniziare ad elaborare.

Una volta fatto ciò si prosegue normalmente fino a quando non viene terminata la sequenza di  $K$  dati reali, dopo il quale è necessario caricare 3 zeri così che l'ultimo dato "scorra" al centro e il funzionamento resti corretto fino a completamento.

## CAP.3: TB E RISULTATI Sperimentali

### 3.0 STRUMENTI UTILIZZATI E OBIETTIVI DEI TEST

Lo strumento usato per effettuare i vari test di copertura è lo stesso impiegato per la progettazione e la sintesi del modulo, ovvero **Vivado** (versione **2016.1**). Per chiarezza, con tb si intende *testbench*.

Tutti i tb sono stati eseguiti tramite *Run Simulation* all'interno dell'applicativo, sia in *Behavioral Simulation* sia in *Post-Synthesis Functional Simulation*, e sono risultati **passati** in entrambe le modalità , ovvero il comportamento del modulo è stato quello previsto dai tb stessi.

I vari test cercano di coprire il maggior numero possibile di casi, mettendo in evidenza punti di forza e di debolezza del modulo. Non vengono riportati i primi tb usati per versioni precedenti del progetto; e si includono solo i più significativi per l'ultima versione (FSA integrata).

### 3.1 I TEST E LA LORO COPERTURA

- ▶ **3.1.1 tb\_2425**

Test fornito dai docenti per verificare il funzionamento di base: *reset*, logica *start/done*, scrittura corretta in memoria. Nelle fasi iniziali ha motivato l'introduzione di più stati di *wait* e la specializzazione degli stati per ridurre le differenze dei risultati tra pre- e post-sintesi.

- ▶ **3.1.2 tb\_no\_rewrite\_input**

Verifica che il modulo non sovrascriva i dati in ingresso durante l'elaborazione e controlla il corretto *handshake* memoria–modulo.

- ▶ **3.1.3 tb\_s\_masking**

Due run con lo stesso LSB di S per verificare che gli output coincidano e che la scelta del filtro dipenda solo da S(0).

- ▶ **3.1.4 tb\_sign\_symmetry**

Doppia run con una sequenza W e una seconda  $-W$ ; verifica coerenza rispetto al segno e le differenze dovute a normalizzazione/saturazione.

- ▶ **3.1.5 tb\_midrun\_reset**

Esegue una prima run A; dopo alcune scritture effettua un *reset* e avvia la run B; resetta anche B, la riavvia e verifica la coincidenza con i risultati attesi.

- ▶ **3.1.6 tb\_setup\_reset**  
Esegue un *reset* durante la lettura del preambolo.
- ▶ **3.1.7 tb\_k\_small\_edges**  
Verifica proprietà di base con K molto piccoli ( $K = 1, 2, 3$ ). Non richiesto da specifica, ma curioso da testare.
- ▶ **3.1.8 tb\_coeff\_extremes\_sat**  
Proprietà di base con dataset W che satura agli estremi a ogni scrittura; ha portato ad aumentare i bit usati nei calcoli prima della normalizzazione per gestire valori molto grandi.
- ▶ **3.1.9 tb\_ignore\_start\_while\_busy**  
Ignora ogni *start* proveniente dalla memoria se il modulo è già in elaborazione, per evitare elaborazioni fantasma. Ha portato alla creazione dello stato IDLE.
- ▶ **3.1.10 tb\_addr\_high\_boundary**  
Scelta di ADDR e K in modo che l'ultima scrittura sia a 0xFFFF, garantendo assenza di overflow/wrap.
- ▶ **3.1.11 tb\_back\_to\_back\_runs**  
Verifica corretto funzionamento e proprietà di base in due run consecutive senza *re-assert*, anche se non richiesto dalla specifica. Ha portato lo stato DONE a essere rinizializzante.
- ▶ **3.1.12 tb\_k\_high\_stress**  
Sequenze con K molto grandi; i risultati hanno portato a definire cnt\_data su 32 bit (invece di 8) per garantire robustezza anche in condizioni di forte stress.

► **3.1.13 tb\_k\_zero**

Comportamento con K=0; non richiesto da specifica ma testato.

► **3.1.14 tb\_final\_stress**

Esegue 6 elaborazioni, vari reset intermedi, testa saturazioni e troncamenti, la correttezza dei filtri e utilizza circa **48 KB** della RAM disponibile.

## 4.0 CONCLUSIONI

### 4.0.1 Riscontri sperimentali

I vari tb creati e provati garantiscono una buona copertura degli *edge cases*. Il modulo passa tutti i tb proposti sia in pre che post sintesi e risulta **robusto**; tuttavia, come emerso nei test più pesanti, è relativamente **lento** a causa dell'elevato numero di stati. L'abbandono della struttura a componenti, pur preferibile su progetti molto grandi, in questo contesto ha reso la soluzione a FSA integrata più semplice da *debuggare* e migliorare in fase di sviluppo.

### 4.0.2 Possibilità di miglioramento

Si possono aumentare le **performance** riducendo il numero di stati totale e adottando un flusso meno spezzettato, ovvero unendo più micro-stati in macro-stati. A parte l'aspetto prestazionale, il modulo si dimostra **molto robusto**, capace di superare tb non richiesti e di reggere bene dati/situazioni estreme (nei limiti richiesti dalla specifica).



*RTL progetto.*



*Device.*

**Oleg Nedina**

Matr. **225897**

Cod.Persone **10905938**

Il codice e l'elaborato sono stati scritti interamente da me.

Il progetto è stato realizzato fino alla **sintesi comportamentale come richiesto**.

Gli schemi sono stati disegnati a mano da me, tranne le ultime due immagini che sono state ricavate direttamente da Vivado.