

# Übung -03

## 3.1 Halbaddierer und Volladdierer (6 Punkte)

Hier werden Sie sich zunächst mit den grundlegenden Bausteinen von Addierern vertraut machen.

### 3.1.1 Halbaddierer

Der Algorithmus des schriftlichen Addierens zerlegt die binäre Addition in die folgenden elementaren Additionen. Es ergibt sich für die Eingaben  $A$  und  $B$  eine Summe  $S$  und ein Übertrag  $C$  (Carry) mit der zugehörigen Funktionstabelle:

$$\begin{aligned} A + B &= S, C \\ 0+0 &= 0, C = 0 \\ 0+1 &= 1, C = 0 \\ 1+0 &= 1, C = 0 \\ 1+1 &= 0, C = 1 \end{aligned}$$

Eine Digitalschaltung, die diese Funktion rechnen soll, habe die Eingänge  $A$  und  $B$  und die Ausgänge  $S$  und  $C$ :



**Aufgaben:**

- (1 Punkte) Zeichnen Sie die Rechenschaltung des Halbaddierers. Geben Sie des Weiteren die Berechnungsvorschrift des Halbaddierers mit XOR und AND Operationen an. ( $S = (R \wedge T) \vee L$  wäre zum Beispiel eine Berechnungsvorschrift.)
- (2 Punkte) Vervollständigen Sie die Implementierung des Halbaddierers (mit XOR und AND Operationen). Nutzen Sie dazu die bereitgestellte Vorlage (*ha.vhdl*). Testen Sie den Halbaddierer in der Testbench (*ha\_tb.vhdl*) mit allen Inputkombinationen von 0 und 1.

a.



$$A \wedge B = C$$

$$A \oplus B = S \quad \text{bzw. } \neg(A \leftrightarrow B) = S$$

b.

Quellcode wurde hier exakt, wie in der gegebenen Struktur implementiert.

### 3.1.2 Volladdierer

Für die Addition zweier mehrstelliger Binärzahlen müssen drei Binärziffern addiert werden können: die beiden Summanden und der Übertrag von der vorhergehenden Stelle. Nur in der niedrigwertigsten Stelle (LSB = least significant bit) gibt es keinen Übertrag. Es gilt  $S_n = A_n \oplus B_n \oplus C_{n-1}$ . Es ergibt sich folgende Funktionstabelle:

| $C_{n-1}$ | $a$ | $b$ | $c$ | $s$ |
|-----------|-----|-----|-----|-----|
| 0         | 0   | 0   | 0   | 0 ✓ |
| 0         | 0   | 1   | 0   | 1 ✓ |
| 0         | 1   | 0   | 0   | 1 ✓ |
| 0         | 1   | 1   | 1   | 0 ✓ |
| 1         | 0   | 0   | 0   | 1 ✓ |
| 1         | 0   | 1   | 1   | 0   |
| 1         | 1   | 0   | 1   | 0   |
| 1         | 1   | 1   | 1   | 1   |

⇒

$$\begin{aligned} A_n + B_n + C_{n-1} &= S_n, C_n \\ 0+0+0 &= 0, C_n = 0 \\ 0+0+1 &= 1, C_n = 0 \\ 0+1+0 &= 1, C_n = 0 \\ 0+1+1 &= 0, C_n = 1 \\ 1+0+0 &= 1, C_n = 0 \\ 1+0+1 &= 1, C_n = 1 \\ 1+1+0 &= 0, C_n = 1 \\ 1+1+1 &= 1, C_n = 1 \end{aligned}$$

Darin bedeuten die Indizes, dass die Schaltung bei der Addition zweier mehrstelliger Binärzahlen die Addition für die  $n$ -te Stelle durchführen soll. Das Blockdiagramm des Volladdierers sieht wie folgt aus:



**Aufgaben:**

- (1 Punkt) Zeichnet die Rechenschaltung des Volladdierers.
- (2 Punkte) Vervollständigen Sie die Implementierung des Volladdierers. Füllen Sie dazu die bereitgestellte Vorlage aus (*fa.vhdl*). Testen Sie alle Inputkombinationen von 0 und 1 mit der Testbench (*fa\_tb.vhdl*). Hinweis: Sie können den Volladdierer wahlweise direkt implementieren oder mit Hilfe der in Aufgabenteil 3.1.1 erstellten Halbaddierer.

a.

$$S = C_{n-1} \oplus A_n \oplus B_n$$

$$C = (C_{n-1} \wedge (A_n \oplus B_n)) \vee (A_n \wedge B_n)$$



b.

Quellcode wurde hier exakt, wie in der gegebenen Struktur implementiert.

### 3.2 Ripple-Carry-Addierwerk (3 Punkte)

Mit  $n$  Volladdierern (alternativ mit  $n - 1$  Volladdierern und einem Halbaddierer) kann man eine Digitalschaltung aufbauen, die zwei  $n$ -stellige Binärzahlen  $A_{n-1}, \dots, A_0$  und  $B_{n-1}, \dots, B_0$  addiert:



Im Addierwerk des Ripple-Carry-Adders arbeiten die Volladdierer parallel, d.h. gleichzeitig. Die von den Volladdierern berechneten Summen stehen aber nicht zur gleichen Zeit zur Verfügung, weil jeder der Volladdierer einen Übertrag von der nächstniedrigeren Stelle erhält. Die Summenwerte an den Ausgängen des Addierwerks sind erst dann gültig, wenn der Volladdierer der Stelle  $m$  den Übertrag  $C_{m-1}$  erhalten hat. Die Überträge entstehen also nacheinander. Erst wenn der Übertrag  $C_{n-2}$  vorliegt, steht das Ergebnis zur Verfügung. In diesem Sinne arbeitet der Ripple-Carry-Adder seriell.

**Aufgabe:** (3 Punkte) Vervollständigen Sie die Implementierung eines 8 bit Ripple-Carry-Addierwerk in der bereitgestellten Vorlage (rca.vhdl). Nutzen Sie dazu die HA und VA-Bausteine die Sie in den vorherigen Aufgaben implementiert haben. Testen Sie Ihre Implementierung in einer Testbench mit (mindestens) 4 Inputkombinationen.

Quellcode wurde hier erkt, wie in der gegebenen Struktur implementiert.

| Testbench: | Wert                                                                                                                          | Wert                                                                                                                              |
|------------|-------------------------------------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------|
| (Nutz)     | $0\ 0\ 1\ 0\ 1\ 1\ 0\ 1$<br>$A_{0-1} = (45)_{10}$<br>$B_{0-1} = (43)_{10}$<br>$C_{1a} = 0$<br>$S_{0-1} = 0$<br>$C_{out} = 0$  | $1\ 1\ 0\ 0\ 1\ 0\ 1\ 0$<br>$A_{0-1} = (202)_{10}$<br>$B_{0-1} = (170)_{10}$<br>$C_{1a} = 0(1)$<br>$S_{0-1} = 0$<br>$C_{out} = 0$ |
|            | $(0\ 1\ 0\ 1\ 1\ 1\ 1\ 0)_2 = (114)_{10}$<br>$sum = 5E$                                                                       | $(1\ 0\ 1\ 1\ 1\ 0\ 1\ 0)_2 = (272)_{10}$<br>$sum = 74$                                                                           |
|            | $428\ 64\ 31\ 45\ 8\ 4\ 2\ 1$<br>$74$                                                                                         | $428\ 64\ 31\ 45\ 8\ 4\ 2\ 1$                                                                                                     |
|            | $0\ 1\ 0\ 1\ 0\ 0\ 0\ 0$<br>$A_{0-1} = (80)_{10}$<br>$B_{0-1} = (255)_{10}$<br>$C_{1a} = 0$<br>$S_{0-1} = 0$<br>$C_{out} = 0$ | $1\ 1\ 1\ 1\ 1\ 1\ 1\ 1$<br>$A_{0-1} = (255)_{10}$<br>$B_{0-1} = (255)_{10}$<br>$C_{1a} = 0(0)$<br>$S_{0-1} = 0$<br>$C_{out} = 1$ |
|            | $(1\ 0\ 1\ 0\ 0\ 1\ 1\ 1\ 1)_2 = (335)_{10}$<br>$sum = 4F$                                                                    | $(1\ 1\ 1\ 1\ 1\ 1\ 1\ 0)_2 = (510)_{10}$<br>$sum = FE$                                                                           |

### 3.3 Carry-Look-Ahead Addierwerk (8 Punkte)

Die Idee des Carry-Look-Ahead-Adders ist es, die Carry-Signale nicht mehr von Adder-Modul zu Adder-Modul weiterzureichen, sondern in einer zusätzlichen kombinatorischen Schaltung direkt aus den Eingangsgrößen  $A_n$  und  $B_n$  zu erzeugen. Dabei sollen die Signale parallel über möglichst wenige Gatter laufen und alle Carry-Signale nach der selben Verzögerungszeit berechnet werden.

Als Beispiel wählen wir ein vierstelliges Addierwerk, das kaskadierbar ist. Dadurch kann ein Carry  $C_{-1}$  von einem Addierwerk übernommen werden und es kann ein Carry  $C_3$  an ein anderes Addierwerk weitergeleitet werden.

Das Addierwerk berechnet folgende Summen und Carry-Werte:

$$\begin{aligned} S_0 &= A_0 \oplus B_0 \oplus C_{-1}, \quad C_0 = (A_0 \wedge B_0) \vee ((A_0 \vee B_0) \wedge C_{-1}) \\ S_1 &= A_1 \oplus B_1 \oplus C_0, \quad C_1 = (A_1 \wedge B_1) \vee ((A_1 \vee B_1) \wedge C_0) \\ S_2 &= A_2 \oplus B_2 \oplus C_1, \quad C_2 = (A_2 \wedge B_2) \vee ((A_2 \vee B_2) \wedge C_1) \\ S_3 &= A_3 \oplus B_3 \oplus C_2, \quad C_3 = (A_3 \wedge B_3) \vee ((A_3 \vee B_3) \wedge C_2) \end{aligned}$$

Hinweis: Die Klammerung bindet stärker als  $\wedge$  was wiederum stärker bindet als  $\vee$ . Daher sind, z.B., die Klammern um  $(A_0 \vee B_0) \wedge C_{-1}$  in  $(A_0 \wedge B_0) \vee ((A_0 \vee B_0) \wedge C_{-1})$  nicht nötig, wurden aber zur Erhöhung der Übersichtlichkeit gesetzt.

Wir führen zwei Hilfsvariablen  $g_n$  und  $p_n$  ein:

$$g_n = A_n \wedge B_n, \quad p_n = A_n \vee B_n$$

Setzt man  $g_n$  und  $p_n$  ein ergibt sich für die  $C_n$ :

$$\begin{aligned} C_0 &= g_0 \vee (p_0 \wedge C_{-1}) \\ C_1 &= g_1 \vee (p_1 \wedge C_0) \\ C_2 &= g_2 \vee (p_2 \wedge C_1) \\ C_3 &= g_3 \vee (p_3 \wedge C_2) \end{aligned}$$

Nach Ersetzen von  $C_1$ ,  $C_2$  und  $C_3$  auf den rechten Seiten ergibt sich:

$$\begin{aligned} C_0 &= g_0 \vee (p_0 \wedge C_{-1}) \\ C_1 &= g_1 \vee (p_1 \wedge g_0) \vee (p_1 \wedge p_0 \wedge C_{-1}) \\ C_2 &= g_2 \vee (p_2 \wedge g_1) \vee (p_2 \wedge p_1 \wedge g_0) \vee (p_2 \wedge p_1 \wedge p_0 \wedge C_{-1}) \\ C_3 &= g_3 \vee (p_3 \wedge g_2) \vee (p_3 \wedge p_2 \wedge g_1) \vee (p_3 \wedge p_2 \wedge p_1 \wedge g_0) \vee (p_3 \wedge p_2 \wedge p_1 \wedge p_0 \wedge C_{-1}) \end{aligned}$$

Wenn man nun die Volladdiererschaltung so umbaut, dass sie neben der Summe  $S_n$  auch die Hilfsvariablen  $g_n$  und  $p_n$  liefert, kann man einen  $n$ -stelligen Carry-Look-Ahead-Adder bauen:



Die Blackboxes FACLA (Full-Adder-Carry-Look-Ahead) enthalten die umgebauten Volladdiererschaltung. Der CLAG (Carry-Look-Ahead-Generator) erzeugt aus den  $g$ - und  $p$ -Hilfsvariablen die Überträge  $C_n$ . Man beachte: Die in dieser Schaltung benutzten Volladdierer in den FACLAs erzeugen keine Überträge.

Über die Ein/Ausgänge  $C_{-1}$ ,  $C_3$ ,  $G$  und  $P$  können mit mehreren CLAGs mehrstufige Carry-Look-Ahead-Generatoren erzeugt werden. Dabei werden  $G$  und  $P$  wie folgt berechnet:

$$G = g_3 \vee (p_3 \wedge g_2) \vee (p_3 \wedge p_2 \wedge g_1) \vee (p_3 \wedge p_2 \wedge p_1 \wedge g_0)$$

$$P = p_3 \wedge p_2 \wedge p_1 \wedge p_0$$

Eine Kaskadierung mit  $C_3$ ,  $G$ ,  $P$  sowie  $C_{-1}$  wird bei unseren Versuchen nicht benötigt. Daher ist  $C_{-1} = 0$ .

#### Aufgaben:

a. (2 Punkte) Geben Sie ein Rechenbeispiel für einen CLA-Durchlauf an bei dem zwei 4-bit Werte addiert werden, mit den zugehörigen  $A$ ,  $B$ ,  $g$ ,  $p$ ,  $C_n$ ,  $S$ .

b. (4 Punkte) Implementieren Sie einen 4-bit CLA in VHDL. Dabei sollen der CLAG- und der FACLA-Baustein als separate Komponenten implementiert werden. Der CLAG und FACLA sollen in einem CLA-Baustein als component genutzt werden. Es sollen folgende Dateien erweitert werden, welche mit dem Blatt hochgeladen werden sind: `clag.vhdl`, `facta.vhdl`, `cla.vhdl`. Schreiben Sie zudem eine Testbench und testen Sie Ihren Addierer mit (mindestens) 4 Inputkombinationen.

Hinweis: Die Fehlersuche fällt leichter, wenn Sie erst `facta.vhdl` und `clag.vhdl` implementieren und die Korrektheit dieser Bausteine mit Hilfe einer Testbench überprüfen, bevor diese in `cla.vhdl` verwendet werden.

c. (2 Punkte) Welche Vor- und Nachteile haben die jeweiligen Addierwerke RCA und CLA? Halten Sie diese in einer Tabelle fest.

a. Zu addieren:  $A = (A_3\ A_2\ A_1\ A_0)_2$ ,  $B = (B_3\ B_2\ B_1\ B_0)_2$ ,  $C_{-1} = 0$

$\text{Signal in CLA} \quad \text{Signal aus CLA}$

$n=0$ :  $S_0 = A_0 \oplus B_0 \oplus C_{-1} = 0 \oplus 1 \oplus 0 = 1$  } in FACLA  
 $g_0 = A_0 \wedge B_0 = 0 \wedge 1 = 0 \quad p_0 = A_0 \vee B_0 = 0 \vee 1 = 1$  } in CLAG  
 $c_0 = g_0 \vee (p_0 \wedge C_{-1}) = 0 \vee (1 \wedge 0) = 0$  } in CLAG

von CLAG liegt  $C_0$ -Signal bei FACLA mit  $n=1$  an

$n=1$ :  $S_1 = A_1 \oplus B_1 \oplus C_0 = 1 \oplus 0 \oplus 0 = 1$  } in FACLA  
 $g_1 = A_1 \wedge B_1 = 1 \wedge 0 = 0 \quad p_1 = A_1 \vee B_1 = 1 \vee 0 = 1$  } in CLAG  
 $c_1 = g_1 \vee (p_1 \wedge C_0) = 0 \vee (1 \wedge 0) = 0$  } in CLAG  
 $= g_1 \vee (p_1 \wedge g_0) \vee (p_1 \wedge g_0 \wedge C_{-1}) = 0 \vee (1 \wedge 0) \vee (1 \wedge 0 \wedge 1) = 0$

von CLAG liegt  $C_1$ -Signal bei FACLA mit  $n=2$  an

$n=2$ :  $S_2 = A_2 \oplus B_2 \oplus C_1 = 0 \oplus 1 \oplus 0 = 1$  } in FACLA  
 $g_2 = A_2 \wedge B_2 = 0 \wedge 1 = 0 \quad p_2 = A_2 \vee B_2 = 0 \vee 1 = 1$  } in CLAG  
 $c_2 = g_2 \vee (p_2 \wedge C_1) = 0 \vee (1 \wedge 0) = 0$  } in CLAG  
 $= g_2 \vee (p_2 \wedge g_1) \vee (p_2 \wedge g_1 \wedge g_0) \vee (p_2 \wedge p_1 \wedge p_0 \wedge C_{-1}) = 0$

von CLAG liegt  $C_2$ -Signal bei FACLA mit  $n=3$  an

$n=3$ :  $S_3 = A_3 \oplus B_3 \oplus C_2 = 1 \oplus 1 \oplus 0 = 0$  } in FACLA  
 $g_3 = A_3 \wedge B_3 = 1 \wedge 1 = 1 \quad p_3 = A_3 \vee B_3 = 1 \vee 1 = 1$  } in CLAG  
 $c_3 = g_3 \vee (p_3 \wedge C_2) = 1 \vee (1 \wedge 0) = 1$  } in CLAG  
 $= g_3 \vee (p_3 \wedge g_2) \vee (p_3 \wedge g_2 \wedge g_1) \vee (p_3 \wedge p_2 \wedge p_1 \wedge p_0 \wedge C_{-1})$

Mögl. für Test:

|                                                      |
|------------------------------------------------------|
| Signal-Output von CLA ist: $(1\   0\   1\   1\   1)$ |
| $s_0 = 0 \quad g_0 = 0 \quad p_0 = 1 \quad g_1 = 1$  |
| $p_1 = 1 \quad p_2 = 1 \quad p_3 = 1$                |
| $C_0 = 0 \quad C_1 = 0 \quad C_2 = 0 \quad C_3 = 1$  |
| $\Phi = 1 = 1 \wedge 1 \wedge 1 \wedge 1$            |
| $C_{-1} = 1$ , da $g_3 = 1$                          |

b. Quellcode wurde hier exakt, wie in der gegebenen Struktur implementiert.

C.

|     | Vorteile                                                                                                                                                                                                                                                                                               | Nachteile                                                                                                                                                                                                                                                                                                                                                                                                                                      |
|-----|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| RCA | <ul style="list-style-type: none"><li>wenige Ressourcen / sehr klein</li><li>→ Größe eines RCA ist <math>S_{n-3}</math>, wobei <math>n</math> ein logisches Gatter darstellt</li><li>• einfach zu implementieren ⇒ der Garry eines VA muss einfach nur mit dem nächsten VA verbunden werden.</li></ul> | <ul style="list-style-type: none"><li>• Schnelligkeit ist geringer, da VA aufeinander "warten" müssen ⇒ sehr lange Schaltung</li><li>• Ineffizienz höchst linear mit seines Größe ⇒ für Bitvektorlen von Größe <math>n</math>, höchst die Verzögerung linear mit durch proportional gleich viel eingesetzte VA</li></ul>                                                                                                                       |
| CLA | <ul style="list-style-type: none"><li>• hohe Geschwindigkeit ⇒ durch eine parallele Berechnung der Garry Überträge</li><li>• gleich bleibende Tiefe von 4 von beliebig langen Bit-Vektoren ⇒ Verzögerung entspricht einer sub-linearen Entwicklung statt linear wie beim RCA</li></ul>                 | <ul style="list-style-type: none"><li>• großer Ressourcenverbrauch ⇒ Verknüpfung für C,G,P Signale stark anwächst, somit eine erhöhte Anzahl von insbesondere &amp;-Gattern und Verknüpfung der Gatter realisiert werden muss (höherer Energieverbrauch auf physikalischer Ebene)</li><li>• Komplexität in der Realisierung ⇒ bedingt durch sich vergrößernde Logik-formeln (insb. für G und P-Signal) und Verknüpfungen der Signale</li></ul> |