

## CUPRINS

---

|                                                                                                                                    |           |
|------------------------------------------------------------------------------------------------------------------------------------|-----------|
| <b>CUPRINS.....</b>                                                                                                                | <b>1</b>  |
| <b>1. INTRODUCERE ÎN SISTEMELE DE PROCESARE A INFORMAȚIEI ..</b>                                                                   | <b>4</b>  |
| 1.1. CALCULATORUL – DISPOZITIV UNIVERSAL DE CALCUL .....                                                                           | 8         |
| 1.2. STRUCTURA UNUI SISTEM DE CALCUL. PRINCIPII DE BAZĂ .....                                                                      | 15        |
| 1.3. EXERCIȚII ȘI PROBLEME .....                                                                                                   | 23        |
| <b>2. REPREZENTAREA INFORMAȚIILOR. CONVERSII DE VALORI ÎNTRE SISTENE DE NUMERAȚIE. ARITMETICĂ BINARĂ. OPERAȚII LOGICE .....</b>    | <b>25</b> |
| 2.1. REPREZENTAREA INFORMAȚIILOR ÎN SISTEMELE DE CALCUL .....                                                                      | 25        |
| 2.1.1. REPREZENTAREA INFORMAȚIILOR NUMERICE FĂRĂ SEMN. SISTEME DE NUMERAȚIE .....                                                  | 29        |
| 2.1.2. REPREZENTAREA NUMERELEOR CU SEMN .....                                                                                      | 33        |
| 2.1.3. REPREZENTAREA NUMERELEOR ÎN VIRGULĂ FLOTANTĂ. FORMATUL IEEE 754 .....                                                       | 36        |
| 2.1.4. REPREZENTAREA INFORMAȚIILOR ALFANUMERICE – STANDARDUL ASCII .....                                                           | 40        |
| 2.1.5. REPREZENTAREA INFORMATIILOR MULTIMEDIA .....                                                                                | 41        |
| 2.2. CODIFICAREA INFORMAȚIEI .....                                                                                                 | 43        |
| 2.2.1. CODURI ZECIMALE .....                                                                                                       | 43        |
| 2.2.2. CODURI PENTRU DETECTAREA ȘI CORECTAREA ERORILOR .....                                                                       | 44        |
| 2.3. OPERAȚII LOGICE PE BIȚI. FUNCȚII LOGICE. .....                                                                                | 45        |
| 2.3.1. FUNCȚIA ȘI LOGIC ( <i>AND</i> ) .....                                                                                       | 45        |
| 2.3.2. FUNCȚIA SAU LOGIC ( <i>OR</i> ) .....                                                                                       | 46        |
| 2.3.3. FUNCȚIA NOT LOGIC .....                                                                                                     | 46        |
| 2.3.4. FUNCȚIA SAU EXCLUSIV ( <i>XOR</i> ) .....                                                                                   | 46        |
| 2.4. EXERCIȚII ȘI PROBLEME .....                                                                                                   | 47        |
| <b>3. STRUCTURI LOGICE DIGITALE. TRANZISTORUL. PORTI LOGICE. STRUCTURI LOGICE COMBINAȚIONALE. UNITATEA ARITMETICO-LOGICĂ .....</b> | <b>50</b> |
| 3.1. TRANZISTORUL .....                                                                                                            | 50        |
| 3.2. PORTI LOGICE .....                                                                                                            | 53        |
| 3.2.1. INVERSORUL CMOS .....                                                                                                       | 53        |
| 3.2.2. POARTA NOR ( <i>NOT OR</i> ) .....                                                                                          | 53        |
| 3.2.3. POARTA NAND ( <i>NOT AND</i> ) .....                                                                                        | 54        |
| 3.3. STRUCTURI LOGICE DIGITALE .....                                                                                               | 56        |
| 3.3.1. STRUCTURI LOGICE (CIRCUITE) COMBINAȚIONALE .....                                                                            | 56        |
| 3.3.2. PROIECTAREA UNEI UNITĂȚI DE CALCUL ARITMETICO-LOGIC .....                                                                   | 65        |
| 3.4. EXERCIȚII ȘI PROBLEME .....                                                                                                   | 70        |
| <b>4. ELEMENTE PRIMARE DE MEMORARE. REGIȘTRII. MEMORII. AUTOMATE CU NUMĂR FINIT DE STĂRI .....</b>                                 | <b>78</b> |
| 4.1. STRUCTURI LOGICE SECVENTIALE .....                                                                                            | 78        |
| 4.1.1. BISTABILUL R-S .....                                                                                                        | 79        |
| 4.1.2. BISTABILUL DE TIP D (DELAY). .....                                                                                          | 81        |
| 4.1.3. REGIȘTRII. .....                                                                                                            | 82        |

|                                                                                                                                                                                                  |            |
|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------|
| 4.1.4. MEMORIA                                                                                                                                                                                   | 85         |
| 4.2. AUTOMATE SECVENTIALE ȘI PROGRAMABILE                                                                                                                                                        | 92         |
| 4.3. EXERCITII ȘI PROBLEME                                                                                                                                                                       | 100        |
| <b>5. MODELUL ARHITECTURAL VON NEUMANN. COMPO朱NTE DE BAZĂ. PRINCIPIILE PROCESĂRII INSTRUCȚIUNILOR .....</b>                                                                                      | <b>104</b> |
| 5.1. COMPO朱NTELE DE BAZĂ ALE MODELULUI ARHITECTURAL VON NEUMANN                                                                                                                                  | 104        |
| 5.2. PRINCIPIILE PROCESĂRII INSTRUCȚIUNILOR                                                                                                                                                      | 108        |
| 5.2.1. CICLUL INSTRUCȚIUNII                                                                                                                                                                      | 109        |
| 5.2.2. TIPURI DE INSTRUCȚIUNI                                                                                                                                                                    | 112        |
| 5.2.3. CEASUL PROCESORULUI                                                                                                                                                                       | 114        |
| 5.3. EXERCITII ȘI PROBLEME                                                                                                                                                                       | 115        |
| <b>6. LC-3 – ARHITECTURA SETULUI DE INSTRUCȚIUNI. CALEA FLUXULUI DE DATE. ORGANIZAREA MEMORIEI LA LC-3 [Patt03].</b>                                                                             | <b>119</b> |
| 6.1. LC-3 – ARHITECTURA SETULUI DE INSTRUCȚIUNI                                                                                                                                                  | 119        |
| 6.1.1. LC-3 ISA: ORGANIZAREA MEMORIEI ȘI SETUL DE REGIȘTII GENERALI                                                                                                                              | 120        |
| 6.1.2. LC-3 ISA: FORMATUL INSTRUCȚIUNII ȘI SETUL DE INSTRUCȚIUNI                                                                                                                                 | 121        |
| 6.1.3. LC-3 ISA: APlicații REZOLVATE                                                                                                                                                             | 141        |
| 6.2. FLUXUL DE DATE LA LC-3 ISA                                                                                                                                                                  | 145        |
| 6.3. EXERCITII ȘI PROBLEME                                                                                                                                                                       | 148        |
| <b>7. LIMBAJUL DE ASAMBLARE AFERENT ARHITECTURII LC-3. ASAMBLORUL. ETAPELE GENERĂRII CODULUI MAȘINĂ. TABELA DE SIMBOLURI.....</b>                                                                | <b>156</b> |
| 7.1. MOTIVE PENTRU A PROGRAMA ÎN LIMBAJ DE ASAMBLARE                                                                                                                                             | 156        |
| 7.2. SINTAXA ASAMBLOR LC-3 [Patt03]                                                                                                                                                              | 158        |
| 7.2.1. CORESPONDENȚA LIMBAJ DE ASAMBLARE LC-3 – LIMBAJ MAȘINĂ SPECIFIC LC-3 ISA                                                                                                                  | 162        |
| 7.2.2. APELURI SISTEM                                                                                                                                                                            | 163        |
| 7.3. PROCESUL DE ASAMBLARE – ETAPELE GENERĂRII CODULUI MAȘINĂ                                                                                                                                    | 164        |
| 7.3.1. GENERAREA TABELEI DE SIMBOLURI (TS)                                                                                                                                                       | 165        |
| 7.3.2. OBȚINEREA CODULUI ÎN LIMBAJUL MAȘINĂ                                                                                                                                                      | 166        |
| 7.3.3. CREAREA LEGĂTURILOR ÎNTRE MODULE, ÎNCĂRCAREA ȘI LANSAREA ÎN EXECUȚIE                                                                                                                      | 169        |
| 7.4. EXERCITII ȘI PROBLEME                                                                                                                                                                       | 170        |
| <b>8. ÎNTRERUPERI SOFTWARE LA NIVEL LOW. APELURI DE SUBRUTINE – DIRECTE ȘI INDIRECTE. REVENIRI. SALVAREA ȘI RESTAURAREA REGIȘTRILOR. STRATEGIILE “CALLER-SAVE” RESPECTIV “CALLEE SAVE” .....</b> | <b>177</b> |
| 8.1. ÎNTRERUPERI. DEFINIȚIE. CLASIFICARE                                                                                                                                                         | 177        |
| 8.2. ÎNTRERUPERI SOFTWARE LA NIVEL LOW – INSTRUCȚIUNILE TRAP                                                                                                                                     | 178        |
| 8.2.1. RUTINELE DE TRATARE AFERENTE APELURILOR SISTEM LA LC-3 ISA                                                                                                                                | 179        |
| 8.2.2. SALVAREA ȘI RESTAUREA REGIȘTRILOR ÎN CAZUL RUTINELOR DE SERVICIU                                                                                                                          | 190        |
| 8.3. SUBRUTINE                                                                                                                                                                                   | 192        |
| 8.3.1. MECANISMUL DE APEL SUBRUTINE ȘI REVENIRE                                                                                                                                                  | 193        |
| 8.3.2. TRANSFERUL PARAMETRILOR CĂtre Și DE LA SUBRUTINE                                                                                                                                          | 198        |
| 8.3.3. SALVAREA ȘI RESTAUREA REGIȘTRILOR ÎN CAZUL SUBRUTINELOR. RUTINE (FUNCTII) DE BIBLIOTECĂ                                                                                                   | 199        |
| 8.4. EXERCITII ȘI PROBLEME                                                                                                                                                                       | 200        |

|                                                                                                                                                                   |            |
|-------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------|
| <b>9. STIVA – STRUCTURĂ. PRINCIPIU DE FUNCȚIONARE. OPERAȚII AFERENTE (PUSH &amp; POP).....</b>                                                                    | <b>208</b> |
| 9.1. STRUCTURA DE DATE DE TIP STIVĂ .....                                                                                                                         | 208        |
| 9.1.1. PRINCIPIU DE FUNCȚIONARE .....                                                                                                                             | 208        |
| 9.1.2. IMPLEMENTARE HARDWARE ȘI SOFTWARE. ....                                                                                                                    | 208        |
| 9.1.3. OPERAȚII AFERENTE (PUSH & POP) .....                                                                                                                       | 211        |
| 9.1.4. MODUL DE LUCRU PRIN ÎNTRERUPERI HARDWARE. ....                                                                                                             | 214        |
| 9.2. OPERAȚII ARITMETICE FOLOSIND STIVA .....                                                                                                                     | 222        |
| 9.3. CONVERSIA INFORMAȚIEI DIN FORMAT ASCII ÎN ZECIMAL .....                                                                                                      | 225        |
| 9.3.1. CONVERSIA DIN ASCII ÎN BINAR .....                                                                                                                         | 226        |
| 9.3.2. CONVERSIA DIN ZECIMAL ÎN ASCII .....                                                                                                                       | 230        |
| 9.4. EXERCIȚII ȘI PROBLEME .....                                                                                                                                  | 233        |
| <b>10. FACILITĂȚI ALE MAȘINII PENTRU IMPLEMENTAREA ÎN HARDWARE A FUNCȚIILOR DIN PROGRAMELE DE NIVEL ÎNALȚ. STIVA DE DATE AFERENTĂ FUNCȚIILOR .....</b>            | <b>237</b> |
| 10.1. OBȚINEREA CODULUI OBIECT PENTRU O ARHITECTURĂ DATĂ .....                                                                                                    | 237        |
| 10.1.1. DESCRIEREA COMPONENTELOR UNUI COMPILATOR .....                                                                                                            | 238        |
| 10.1.2. ETAPELE PARCURSE PENTRU RECOMPILEAREA INSTRUMENTELOR SIMPLESCALAR 3.0 [F1005] .....                                                                       | 246        |
| 10.2. IMPLEMENTAREA GESTIUNII STIVELOR DE DATE ASOCIAȚE FUNCȚIILOR C .....                                                                                        | 249        |
| 10.2.1. SUBPROGRAME. GENERALITĂȚI. FUNCȚII C .....                                                                                                                | 249        |
| 10.2.2. STIVA DE DATE AFERENTĂ FUNCȚIILOR [Patt03, Vin03] .....                                                                                                   | 256        |
| 10.3. EXERCIȚII ȘI PROBLEME .....                                                                                                                                 | 260        |
| <b>11. INTRODUCERE ÎN RECURSIVITATE. COMPARAȚIA DINTRE RECURSIV ȘI ITERATIV ÎN ALEGAREA ALGORITMULUI DE REZOLVARE A PROBLEMELOR. AVANTAJE / DEZAVANTAJE .....</b> | <b>265</b> |
| 11.1. SCOP ȘI COMPETENȚE NECESARE .....                                                                                                                           | 265        |
| 11.2. RECURSIVITATEA .....                                                                                                                                        | 265        |
| 11.2.1. STIVA DE DATE ASOCIAȚĂ UNEI FUNCȚII [Patt03] .....                                                                                                        | 266        |
| 11.3. IMPLEMENTAREA RECURSIVITĂȚII LA NIVELUL STIVEI DE DATE .....                                                                                                | 274        |
| 11.4. TIPURI DE FUNCȚII RECURSIVE. ELIMINAREA RECURSIVITĂȚII .....                                                                                                | 277        |
| 11.5. EXERCIȚII ȘI PROBLEME .....                                                                                                                                 | 278        |
| <b>12. POINTERI ȘI TABLOURI. TRANSFERUL PARAMETRILOR PRIN REFERINȚĂ. POINTERI SPRE FUNCȚII .....</b>                                                              | <b>282</b> |
| 12.1. INTRODUCERE .....                                                                                                                                           | 282        |
| 12.2. SEMNIFICAȚIE ȘI DECLARARE .....                                                                                                                             | 284        |
| 12.3. ALOCAREA ȘI ACCESAREA DE VARIABILE. LEGĂTURA DINTRE NIVELUL HIGH ȘI LOW VĂZUTĂ PRIN INTERMEDIUL MODURILOR DE ADRESARE .....                                 | 287        |
| 12.4. TRANSFERUL PARAMETRILOR PRIN REFERINȚĂ LA APELUL FUNCȚIILOR .....                                                                                           | 290        |
| 12.5. POINTERI SPRE FUNCȚII .....                                                                                                                                 | 295        |
| 12.6. TABLOURI. RELAȚIA DINTRE POINTERI ȘI TABLOURI .....                                                                                                         | 302        |
| 12.6.1. FUNCȚII CU PARAMETRI DE TIP TABLOU (VECTOR) .....                                                                                                         | 305        |
| 12.7. EXERCIȚII ȘI PROBLEME .....                                                                                                                                 | 307        |
| <b>BIBLIOGRAFIE.....</b>                                                                                                                                          | <b>311</b> |



## **1. INTRODUCERE ÎN SISTEMELE DE PROCESARE A INFORMAȚIEI**

**Ştiinţa Calculatoarelor** constituie unul din cele mai **dinamice** domenii ale ştiinţelor inginereşti. Dezvoltarea fără precedent a domeniului *Calculatoare și tehnologia informației* ca o componentă fundamentală a societății actuale (*societate informațională*), aflată într-o continuă schimbare și progres, este evidentă și face parte integrantă din realitatea pe care o trăim. Evoluția explozivă a tehnologiilor de înaltă performanță, coroborată cu acumulări teoretice și experimentale, au făcut posibilă pătrunderea în cele mai diverse domenii ale vieții sociale, economice, industriale, culturale, a ceea ce poartă în mod generic numele de “*sistem de calcul / calculator, tehnică / echipament de calcul*”. Importanța informației și a sistemelor de comunicații cu infrastructura aferentă pentru societate și economie se accentuează odată cu valoarea și cantitatea informației transmisă și stocată pe aceste sisteme. În acest context apare în mod stringent necesitatea îmbunătățirii performanțelor sistemelor de calcul actuale atât din punct de vedere cantitativ cât mai ales din punct de vedere calitativ. De asemenea, prezentul tehnologiei informației, ca să nu mai spunem de viitor, centrat pe Internet și tehnologia *World Wide Web*, impun ca alături de performanță în sine, fiabilitatea, disponibilitatea și scalabilitatea să devină criterii esențiale, ceea ce implică iarăși necesitatea unei noi vizuri pentru proiectantul de sisteme de calcul. Criticalitatea în societatea informațională, unde informația circulă prin cyberspațiu<sup>1</sup> fără constrângeri de distanță sau viteză, se datorează în egală măsură dependenței sporite de informație, sistemelor care o furnizează dar și vulnerabilității crescânde pe fondul unui spectru larg de amenințări de genul războiului și poluării informaționale (război cibernetic, etc.).

Într-adevăr, calculatoarele au făcut progrese importante iar microprocesoarele sunt principalele răspunzătoare pentru această creștere deosebită a performanței. Performanța microprocesoarelor a evoluat în

<sup>1</sup> Conform enciclopediei Wikipedia [Wik], termenul de „cyberspațiu” (Cyberspace) reprezintă o metaforă atribuită rețelelor de sisteme electronice de calcul care permit stocarea de date și comunicarea *online*. Deși în anumite lucrări, „cyberspațiul” este folosit cu sensul de Internet, termenul trebuie înțeles ca și un spațiu care cuprinde, identitățile și obiectele care există în rețelele de calculatoare și sunt folosite de indivizii umani în diverse scopuri [Chi04].

ultimii 10 ani într-un ritm exponențial, cu o rată aproximativă de 60% pe an. Cercetătorii susțin că progresele arhitecturale au o pondere mai mare decât cele tehnologice. Tendențele tehnologice se referă la creșterea gradului de integrare al tranzistorilor pe cip, creșterea frecvenței ceasului procesorului, diminuarea timpului de acces la memorie, reducerea costurilor de implementare hardware la aceeași putere de calcul ori capacitate de memorare etc. Tendențele arhitecturale urmăresc exploatarea și creșterea paralelismului la nivelul instrucțiunilor atât prin tehnici statice cât și dinamice sau hibride (cazul arhitecturii IA-64, procesorul *Intel Itanium*), o ierarhizare a sistemului de memorie prin utilizarea unor arhitecturi evoluționate de memorii tip cache, reducerea latentei căii critice de program, etc.

În cadrul unor prestigioase conferințe științifice internaționale dedicate microarhitecturilor avansate de procesare a informației (1999-2007) se agreează tot mai mult ideea potrivit căreia pentru a continua și în viitor creșterea exponențială a performanței microprocesoarelor, sunt necesare concepte noi, revoluționare chiar, pentru depășirea limitărilor paradigmelor actuale din punct de vedere conceptual. Există încă o puternică tendință de specializare îngustă care face adesea ca abordarea domeniului să fie una încisă în tipare preconcepute. Abordări recente, arată însă că sinergia unor instrumente aparent disjuncte ale științei calculatoarelor converge spre realizări novatoare ale acestui domeniu de cercetare (arhitectura calculatoarelor și inteligența artificială). Alte posibile soluții constau în abordări integratoare de gen *hardware-software, tehnologie-arhitectură, algoritmi, concepte, metode*.

Cercetările în domeniul Științei Calculatoarelor trebuie să aibă un **caracter fundamental**, și se recomandă a se efectua în universități încrânată implicită investigarea unor aspecte noi, neimplementate în actualele microprocesoare. Comunitatea academică și industrială internațională investește bugete importante în cercetarea arhitecturilor noi de calcul. Astfel de exemplu, programe de cercetare europene de tip FP6 (*HiPEAC - High-Performance Embedded Architecture and Compilation*) sunt finanțate de către Uniunea Europeană cu fonduri de milioane de euro. Abordarea cantitativă și calitativă a acestui domeniu de studiu și cercetare în România reprezintă o necesitate formativă dar și o necesitate legată de **menținerea cercetării științifice românești în cadrul tendințelor și standardelor actuale de calitate** din Europa de Vest, Japonia și SUA. Consider că mediul universitar este ideal pentru dezvoltarea unor asemenea cercetări fundamentale cu privire la tehnologia informației, inclusiv prin diseminarea rezultatelor către studenții anilor terminali și celor masteranzi.

Această lucrare reprezintă o introducere axată pe **înțelegerea principiilor fundamentale ale științei și ingineriei calculatoarelor** și este destinată în primul studenților din anul I ai studiilor de licență, dar și celor care doresc să pătrundă în tainele calculatoarelor și care văd în acestea nu doar simple instrumente de lucru. Cartea de față, bogată în aplicații practice, se bazează în parte pe structura lucrărilor *Introduction to Computing Systems: from bits & gates to C & beyond* [Patt03] și *Computer Organisation and Design: The Hardware/Software Interface* [Pat05], cărți folosite ca referință la cursul de *Introducing to Computing Systems* introdus pentru prima dată în universitățile americane în toamna anului **1995** de către Profesorul Kevin Compton de la Universitatea Michigan. În acest moment este predat în mai bine de 75 de universități americane și la cursuri înrudite de gen: *Introduction to Computing for Biomedical Engineers*, *Computer Systems and Programming in C*, abordarea optimă fiind de 2 semestre. De asemenea, mai sunt folosite drept referințe o suită de peste 30 de lucrări – cărți și articole științifice – atât din domeniul software (centrate pe limbaje și tehnici de programare, compilatoare, structuri de date) cât și hardware (focalizate pe circuite digitale, automate secvențiale, microarhitecturi de procesare) cu scopul de a exemplifica mai bine necesitatea abordării integratoare *hardware-software* a domeniului științei și ingineriei calculatoarelor. Accentul în lucrarea de față nu este pus pe memorarea detaliilor tehnice ci pe **interfața dintre ceea ce software-ul necesită și respectiv ceea ce hardware-ul poate executa**. Sunt prezentate noțiuni introductory dar cu caracter fundamental aferente mai multor discipline din domeniul științei calculatoarelor: limbaje de programare, algoritmi și structuri de date, compilatoare, sisteme de operare, respectiv – arhitectura calculatoarelor, sisteme cu microprocesoare.

■ Abordarea **bottom-up** a cărții este axată pe două componente:

- **Structura de bază a calculatoarelor** folosind simulatorul LC-3 (*Little Computer*  
[www.ece.utexas.edu/~ambler/ee306/Software&Doc/LC3WinGuide.pdf](http://www.ece.utexas.edu/~ambler/ee306/Software&Doc/LC3WinGuide.pdf)) dezvoltat la Catedra de Calculatoare și Inginerie Electrică, Universitatea din Austin, Texas. Se pornește de la tranzistoare MOS porți logice, bistabili, structuri logice (Multiplexoare, Decodificatoare, Sumatoare, memorii). Se continuă cu modelul de execuție **von Neumann**, cu arhitectura unui calculator (procesor) simplu LC-3, cu limbajul de asamblare aferent acestui procesor. Sunt studiate de asemenea: interfața cu tastatura și monitorul, apelurile sistem (întreruperi software reprezentând servicii ale sistemului de operare prin instrucțiuni dedicate), modurile de adresare pentru instrucțiunile

cu referire la memorie (load / store), mecanismul de apel și revenire din subrutină.

- **Exemplificarea la nivelul limbajului C și legătura sau implicațiile în hardware a structurilor de control, a diverselor tehnici de alocare a memoriei, lucrul cu stiva, apel de funcții și revenire, stivele de date aferente funcțiilor, transmiterea parametrilor în cazul apelului, recursivitate** (care pare „magică”, dincolo de înțelegere), tablouri și chiar structuri elementare de date. Se va insista, de asemenea, pe lucrul cu pointeri; pe modul în care C-ul (limbajul, compilatorul) alocă și accesează variabile. Se va exemplifica arătându-se diferența dintre adresa unei locații de memorie (*p* din declaratia int \**p*;) și conținutul acesteia (\**p* – din aceeași declaratie). Se va demonstra ineficiența la nivelul arhitecturii a modului de adresare indirect memorie (la o adresă în memorie se află adresa operandului care va fi folosit – \*\**cap*, în cazul transmiterii de parametrii unei funcții prin referință).

Aspectul novator al abordării va consta în prezentarea **interfeței arhitectură (ISA, limbaj de șamblare specific) – aplicație de nivel înalt** (incluzând **compilatorul ca și generator de cod pentru respectiva arhitectură**).

#### ■ Ce este LC-3 ?

- Simulator care descrie funcționarea unei arhitecturi pe 16 biți; Arhitectura înglobează cele mai importante caracteristici ale procesoarelor Intel 8088 – folosit în primul sistem IBM PC în 1981, Motorola 68000 – folosit la Macintosh 1984, sau Intel Pentium III integrat în sistemele anilor 2000. Simulatorul permite execuția programelor scrise în limbaj de șamblare LC-3, depanare interactivă – stabilire de puncte de întrerupere, execuție pas cu pas, vizualizare conținut regiștrui. În urma etapei de șamblare codul sursă șamblare este translatat în limbaj mașină. De asemenea, poate fi vizualizat și fișierul care conține tabela de simboluri.
- Include porturi de I/O, interfațare cu tastatura și monitorul, apeluri sistem (întreruperi software reprezentând servicii ale sistemului de operare prin instrucțiuni), salturi condiționate pe coduri de condiție =0, ≠0, set minimal de instrucțiuni, moduri de adresare pentru instrucțiunile cu referire la memorie (load / store) – indirect registru, indexat, mecanism de apel și revenire din subrutină (recursivitatea determinată necesitarea salvării adresei de revenire în programul apelant în momentul apelului).

- Simulatorul arhitecturii LC-3 permite testare / depanare a programelor scrise în limbaj de asamblare, stabilire de puncte de intrerupere. De la adresa <http://users.ece.utexas.edu/~ambler/ee306/software&doc.htm> pot fi descărcate în mod gratuit pentru utilizare în scop didactic atât simulatorul LC-3 (LC301.exe), un simulator realizat în Macromedia Flash Player versiunea 6, care descrie operațiile de citire – scriere dintr-o memorie cu 4 locații având 3 biți fiecare (memory.exe), precum și ghidul de utilizare al simulatorului LC-3.

## 1.1. CALCULATORUL – DISPOZITIV UNIVERSAL DE CALCUL

### Universalitatea

Un sistem de calcul<sup>2</sup> (calculatorul) trebuie să ofere următoarele funcționalități:

- cum să adune / scadă două numere
- cum să înmulțească / împărăță două numere
- cum să ordeneze alfabetic
- nu trebuie proiectat sau cumpărat un calculator nou pentru fiecare nouă operație care trebuie rezolvată.
- dacă este definit un alt set de instrucțiuni același calculator trebuie să opereze cu ele.

### Istoric

Exceptând *abacul* (strămoșul socotitoarei – folosit pentru prima dată, cu peste 2000 de ani în urmă în China), se poate spune că mașinile de calcul au apărut cu mult ( $\approx$ 300 de ani) înaintea calculatoarelor de azi. Acestea pot fi clasificate în:

- Dispozitive **analogice** (măsurarea unor cantități fizice cum ar fi tensiune, curent). Mașini de adunat, înmulțit folosind diverse rigle

<sup>2</sup> Conform enciclopediei Wikipedia [Wik], termenul de **sistem de calcul** reprezintă o combinație de componente hardware și software. Un sistem de calcul tipic conține o memorie și un set de stări care definesc legătura dintre intrările și ieșirile sistemului. Pe parcursul acestei lucrări s-a folosit pentru simplitate în loc de sistem de calcul noțiunea de calculator. Pe lângă calculator însă, sisteme de calcul mai pot fi: sisteme dedicate din aparatele electrocasnice, din automobile, dispozitive PDA (*Personal digital assistants*), etc.

gradeate logaritmice. Sunt caracterizate de **acuratețe scăzută** (Ex: ceasul).

- Dispozitive **digitale** (calculează manipulând un set finit de digiți sau caractere).

■ **Prima mașină de calcul** funcțională a fost construită de către **Blaise Pascal** în anul **1642**. Reprezinta o socotitoare mecanică, construită din roți dințate și o manivelă, cu care se puteau efectua *adunări* și *scăderi*.

■ În anul **1674**, **Gottfried von Leibniz** a construit o mașină de calcul care pe lângă adunări și scăderi efectua și *înmulțiri* și *împărțiri*. Căutând să simplifice mecanismele de efectuare a calculelor a considerat cel mai potrivit *sistemul binar de numerație*.

■ **Charles Babbage** a proiectat în **1840** prima mașină analitică de uz general, care (dacă ar fi fost posibilă construirea ei) ar fi fost programabilă, având patru componente principale: *magazia* (memoria), *moara* (unitatea de calcul), *secțiunea de intrare* (cititorul de cartele) și *secțiunea de ieșire* (perforatorul sau imprimanta).

■ În **1854** matematicianul englez **George Boole** a inventat **calculul logic** care folosește numai două valori (*adevărat* și *fals*) cu care se pot efectua operații de tip And, Or, Not. Aceste funcții (operatori), numite ulterior **algebră booleană**, pot fi ușor simulate cu ajutorul unei **rețele de comutatoare**.

■ **Konrad Zuse** (student german) a creat la sfârșitul anilor **1930** o serie de mașini de calcul folosind **relee electromagnetice**.

■ **Calculatoarele electronice** au fost inițial propuse sub forma unui aparat abstract (**descriere matematică**) care poate realiza sau simula orice tip de mașină mecanică. Forma teoretică a fost introdusă de **Alan Turing** în **1936** la Universitatea Cambridge sub denumirea de **mașina Turing universală**.

Primele calculatoare construite erau foarte diferite de cele de astăzi. Nu doar ca dimensiuni și capacitate (care depind doar de tehnologie), ci referitor la structura lor fundamentală. Acele calculatoare erau construite pentru a rezolva o *singură problemă*; nu erau universale. Ele constau dintr-o colecție de unități funcționale, care puteau face calcule simple. „Programatorii” aveau sarcina de a conecta unitățile funcționale între ele cu fire (sârme), pe care le inserau manual în tot felul de mufe. De exemplu, dacă vroiau să calculeze  $(a+b)^2$ , programatorii luau o unitate care făcea adunări și una care făcea înmulțiri și le cuplau ca în figura 1.1.



**Figura 1.1.** Implementarea în hardware a expresiei  $(a+b)^2$ . Variabilele devin sârme, iar operațiile sunt executate de unități funcționale

Ideea de a descrie un program folosind un limbaj (și nu prin conexiuni între unități funcționale) este mai veche; în 1936 Alan Turing folosise noțiunea de „**mașină Turing universală**” (U) pentru a descrie un calculator universal, care poate executa orice program. Programele erau stocate în memoria calculatorului, reprezentate ca șiruri de numere. Mașina Turing (T) este un calculator abstractizat (figura <http://www.cs.cmu.edu/~mihai/b/articles/complex/complex-html.html#turing>) compusă din următoarele piese [Bud99].



**Figura 1.2.** Mașina Turing

1. O bandă infinită de hârtie cu pătrătele; în fiecare pătrătel se poate scrie exact un caracter din alfabetul nostru; banda este inițial plină cu „spații”, mai puțin partea de la început, unde este scris sirul cu datele de intrare –memorie cu acces linear;
2. Un cap de citire-scriere, care se poate mișca deasupra benzii, la stânga sau la dreapta;
3. O unitate de control, care conține un număr finit de reguli. Unitatea de control este la fiecare moment dat într-o *stare*; stările posibile sunt fixate dinainte, și sunt în număr finit. Fiecare regulă are forma următoare:

*Dacă*

- sunt în starea  $Q_1$ ;
- sub capul de citire este litera  $X$ ;

*atunci:*

- trec în starea  $Q_2$ ;
- scriu pe bandă litera  $Y$ ;
- mut capul de citire/scriere în direcția D.

În pofida simplității ei, mașina Turing poate calcula orice poate fi calculat cu cele mai performante supercomputer. Un algoritm de calcul este descris de o astfel de mașină, prin toate stările posibile, și toate aceste reguli, numite *reguli de tranziție*, care indică cum se trece de la o stare la alta.

De exemplu:

```
if ((stare_veche==Qi)&&(intrare==Ti))
{
    ieșire=Oj;
    stare_nouă=Qj;
}
```

Orice alte modele de calcul care au fost propuse de-a lungul timpului, au fost dovedite a fi mai puțin expresive, sau tot atât de expresive cât mașina Turing. Nimeni nu a fost în stare, până în prezent, să demonstreze că „mașina Turing are limitări”: adică, dispunând de operații elementare capabile să exprime orice algoritm, să ofere ceva care să fie construibil, și să poată face lucruri pe care mașina Turing nu le poate face.

Din cauza asta logicianul Alonzo Church a emis ipoteza că **mașina Turing este modelul cel mai general de calcul care poate fi propus**; acest enunț, care nu este demonstrabil în sens matematic, se numește „**Teza lui Church**”. Aceasta este un **postulat** asupra căruia trebuie căzut de acord înainte de a putea analiza orice alt lucru privitor la teoria complexității.

Complexitatea unui model de calcul prin prisma modelului Turing, se definește prin:

**Timpul de calcul** – pentru un șir dat la intrare, este numărul de mutări făcut de mașina Turing înainte de a intra în starea „terminat”;

**Spațiul** – consumat pentru un șir de intrare, este numărul de căsuțe de pe bandă pe care algoritmul le folosește în timpul execuției sale.

Anticipând puțin complexitatea unui algoritm este dată de timpul de execuție al acestuia în situația cea mai defavorabilă. *Timpul de execuție al unui algoritm* pentru un anumit set de date de intrare este determinat de numărul de operații primitive sau "pași" execuți și se calculează ca suma tuturor timpilor de execuție corespunzători (pas = linia i din pseudocod executată într-o durată (presupusă) constantă de timp ci).

Când se spune că mașina Turing este la fel de puternică ca orice alt model de calcul, nu înseamnă că poate calcula la fel de repede ca orice alt model de calcul, ci că poate calcula aceleași lucruri.

Se pot imagina tot felul de modificări minore ale mașinii Turing, care o vor face să poată rezolva anumite probleme mai repede. De exemplu, putem să ne imaginăm că mașina are dreptul să mute capul la orice căsuță dintr-o singură mișcare, fără să aibă nevoie să meargă pas-cu-pas; atunci banda s-ar comporta mai asemănător cu o memorie RAM obișnuită.

### **Simulări; mașina Turing universală [Bud99]**

Demonstrația faptului că mașina Turing este atât de puternică încât este echivalentă cu orice alt model propus de calcul să făcut prin simulare. De fapt mașina Turing este atât de puternică încât se poate construi o mașină Turing care să simuleze orice altă mașină Turing posibilă. Atât calculatoarele cât și mașina universală Turing pot calcula orice întrucât ele sunt **programabile**.

Pentru a înțelege cum este posibil aşa ceva, trebuie realizate două lucruri:

- Descrierea oricărei mașini Turing (T) este finită, și poate fi făcută cu alfabetul nostru. Dacă am o mașină Turing, pot enumera stările ei și regulile de tranziție sub forma unui șir de caractere;
- Mașina universală (U) primește două intrări pe bandă: una este descrierea mașinii de simulație (ce trebuie să calculeze), iar a doua este intrarea pentru care trebuie să simuleze mașina. Mașina universală apoi urmărește regulile de tranziție ale mașinii simulate, folosind propria ei bandă în acest scop.

**Figura 1.3.** Mașina Turing universală

(model abstract de calcul al unui produs dintre un termen și o sumă)

- Dezvoltarea dispozitivelor de calcul a fost influențată de cel de-al doilea război mondial prin încercările de calcul a traiectoriilor rachetelor Collosus și Eniac și respectiv de decodare a codului Enigma folosit de Germania pentru protecția mesajelor. **Primul calculator digital de succes, ENIAC** (*Electronic Numeric Integrator and Computer*) înlocuiește releele electromagnetice cu tuburile electronice. A fost construit în **1946** de **John Mauchly** și **Presper Eckert** de la Universitatea Pensylvania și conținea 18000 de tuburi electronice și 1500 de relee. Cântărea 20 de tone, avea 20 de regiștri, care reținea fiecare câte un număr zecimal de 10 cifre, era programat prin intermediul a 6000 de comutatoare și era posibilă efectuarea a până la 500 de adunări sau scăderi și 300 de înmulțiri pe secundă. A fost folosit de armata americană până în **1952**.
- În anii '40, matematicianul **John von Neumann** analizează starea de fapt a calculatoarelor și scrie în **1945** un raport intitulat „First Draft of a Report on the EDVAC” (Prima ciornă a unui raport despre **EDVAC – Electronic Discrete Variable Automatic Computer**), în care sugerează o arhitectură revoluționară. În această arhitectură, programul nu mai este reprezentat de felul în care sunt cuplate unitățile funcționale, ci este stocat în memorie, fiind descris folosind un limbaj numit cod-mașină. În cod-mașină, operațiile de executat sunt codificate sub forma unor numere numite *instrucțiuni*. Programul de executat este descris printr-un sir de instrucțiuni, care se execută consecutiv. Pe lângă unitățile funcționale care fac operații aritmetice, calculatorul mai are o unitate de control, care *citește secvențial instrucțiunile programului și care trimite semnale între unitățile funcționale pentru a executa aceste instrucțiuni. Rezultatele intermedii sunt stocate în memorie*. Această arhitectură se numește „**von Neumann**”.



Figura 1.4. Schema simplificată a arhitecturii von Neumann

- Marea majoritate a calculatoarelor din ziua de azi sunt bazate pe această arhitectură; noțiunea de limbaj-mașină, și cea înrudită, de limbaj de programare, folosite pentru descrierea programelor, sunt concepte foarte naturale pentru toți cei care manipulează calculatoarele. Von Neumann propune **calculatorul** să fie văzut ca sistem de procesare a informației (bazat pe procesor – CPU), adică un **mecanism care direcționează dar și realizează procesarea informației**.
- Apariția **tranzistorului**, înlocuitorul tuburilor electronice – a generat începutul celei de-a doua generații de **calculatoare electronice, a minicalculatoarelor (1955-1965)**. PDP-1, realizat de firma Digital Equipment Corporation este un reprezentant al acestor calculatoare. Față de cel mai rapid calculator din lume la acea dată, IBM 7090, un calculator cu tranzistori, PDP-1 era de 2 ori mai rapid și de 9 ori mai ieftin.
- **A treia generație (1965-1980)** – a debutat prin inventarea de către **Robert Noyce a circuitului integrat de siliciu** care permitea montarea pe o singură pastilă de siliciu numită **cip**, de câțiva centimetri pătrați, a zeci, apoi mii de tranzistoare. Descoperirea cipului a permis constructorilor de calculatoare să creeze mașini mai mici, mai rapide și mai ieftine decât cele precedente. A apărut noțiunea de *familie de calculatoare*: mașini care au același limbaj de asamblare dar au puteri (performanțe) și capacitați diferite. S-a introdus noțiunea de *multitasking*; aceasta implică existența în memorie a mai multor programe în același timp: când unul dintre ele așteaptă terminarea unei operații de intrare / ieșire, un altul poate efectua calcule.
- **A patra generație de calculatoare** (începând cu **1980**) – poartă amprenta **circuitelor integrate pe scară largă – VLSI**. Această tehnologie a permis a plasarea pe un singur cip a sute de

milioane de componente electronice elementare. Datorită prețului scăzut al calculatoarelor s-a creat posibilitatea achiziționării acestora de fiecare persoană; a început perioada calculatoarelor personale (*PC*). Procesoarele anilor '80 erau construite din 10 sau mai multe plăci electronice, fiecare de dimensiuni  $\approx 18''$  (inch) și conținând 50 sau mai multe componente electronice integrate. La nivelul anilor 2000 procesoarele sunt integrate pe o singură pastilă de siliciu de dimensiune sub 1'' (inch). În cazul microprocesoarelor, gradul de integrare al tranzistorilor pe cip crește cu cca. 55% pe an. Tehnologia de integrare a microprocesoarelor a evoluat de la 10 microni (1971) la 0.18 microni (2001), la 0.13 microni (2003) – versiunea Northwood a procesorului Intel Pentium 4 și 0.09 microni (2004) – versiunea Prescott a aceluiași procesor. Frecvența ceasului crește și ea cu cca. 50% pe an.

## 1.2. STRUCTURA UNUI SISTEM DE CALCUL. PRINCIPII DE BAZĂ

**Principiul întâi – P1:** Toate calculatoarele (atât cel mai mare – resurse foarte mari, cât și cel mai mic, atât cel mai rapid – frecvență ridicată, cât și cel mai lent, atât cel mai scump cât și cel mai ieftin) sunt capabile să facă exact aceleași lucruri dacă au **suficient timp și suficientă memorie**.

„*Inteligenta*” aparentă a unui sistem de calcul provine din cantitatea de inteligență umană investită în respectivul program aflat în execuție. Marvin Minski, afirma despre programele de Inteligență Artificială din anii '80 că: „aceste programe care par inteligente iau decizii la fel de proaste ca și omul numai că mult mai repede” [Min82].

**Principiul al doilea – P2:** Toate problemele ce se doresc a fi rezolvate, sistemele de operare, compilatoarele, etc., sunt scrise într-un limbaj (și într-o limbă – uzual engleză). Dar toate sunt „rezolvate” prin electroni și caracteristici ale acestora (deplasare, viteza, etc). Practic, de la problema de rezolvat la tensiunea care antrenează (direcționează) fluxul de electroni au loc o serie de transformări sistematice (dezvoltate și îmbunătățite pe parcursul a mai bine de 50 de ani).

Viitorul va aduce probabil calculatoare cuantice, bazate pe procesoare moleculare organice, conform calculabilității ADN, etc.

## Nivele de transformare: de la Problemă de nivel înalt la Circuit electronic

Etapele succesive prin care se ajunge de la problema de rezolvat (descrișă într-un mod abstract) până la tensiunea care antrenează fluxul de electroni sunt următoarele:

1. Problemă (*High level*)
  2. Algoritm
  3. Limbaj de programare
  4. Arhitectura Setului de Instrucțiuni (ISA)
  5. Determinarea optimă a *microarhitecturii*
  6. Proiectarea la nivel de circuit logic (combinatorial / secvențial)
  7. Implementarea circuitelor folosind tehnologia CMOS
- 
1. **Problemele** sunt definite în limbaj natural. Dezavantaj – *ambiguitatea*.
  2. **Algoritmul** – reprezintă o succesiune finită și ordonată de operații univoc determinate, efectuate mecanic, care aplicate datelor inițiale ale unei probleme dintr-o clasă dată, asigură obținerea soluției acelei probleme. Cu alte cuvinte un algoritm este orice procedură de calcul bine definită care primește o anumită valoare sau o mulțime de valori ca date de intrare și produce o anumită valoare sau mulțime de valori ca date de ieșire. Comportarea unui algoritm poate fi diferită în funcție de datele de intrare. Proprietățile algoritmilor sunt:
    - **Claritatea** – operațiile algoritmului și succesiunea executării lor trebuie să fie descrise clar, precis, fără ambiguități, astfel încât să permită o executare mecanică, automată a acțiunilor algoritmului
    - **Generalitatea** – un algoritm permite, nu rezolvarea unei singure probleme particulare, ci a unei întregi clase de probleme.
    - **Finitudinea** – executarea algoritmului trebuie să cuprindă un număr finit de operații, chiar dacă numărul lor este foarte mare. Această proprietate diferențiază *metoda de calcul* de *algoritm*.
    - **Eficiența** – dintre algoritmii care rezolvă o anumită problemă, prezintă interes numai algoritmii performanți pentru care numărul operațiilor care se execută este cel mai mic.

La momentul actual sunt realizate cercetări serioase asupra algoritmilor care vizează nu numai o îmbunătățire a performanței ci și o reducere a puterii consumate, vitală mai ales la nivelul dispozitivelor de calcul de tip “*handheld*” și al sistemelor dedicate.

3. **Limbajele de programare** – sunt de două tipuri:

a) **de nivel înalt** (independente de mașina pe care se procesează – microarhitectura hardware)

- *C* destinat manipulării structurilor hardware ale calculatoarelor (reghiștri, memorie, porturi)
- *Fortran* – rezolvarea calculelor științifice
- *Cobol* – rezolvarea problemelor de procesare a datelor specifice afacerilor (aplicații economice)
- *Prolog* – folosit în aplicații care necesită proiectarea unui sistem expert.
- *LISP* – utilizat în rezolvarea problemelor de inteligență artificială.
- *Pascal* – dezvoltat pentru învățarea studenților să programeze (foarte apropiat de *pseudocod*).

b) **de nivel scăzut (low** – dependente de mașina pe care se procesează).

Există câte un astfel de limbaj specific fiecărei familii de procesoare.

- *Limbajul de asamblare*.

4. După cum se poate observa și din figura următoare (fig. 1.5), **Arhitectura Setului de Instrucțiuni (ISA)** – reprezintă interfața dintre software (programele de aplicație / sistem de operare) și hardware-ul care îl execută. ISA specifică modul de organizare a memoriei (zonă de date statice și dinamice, de cod, de stivă, zonă rezervată nucleului sistemului de operare), setul de regiștri, setul de instrucțiuni, formatul instrucțiunii, tipurile de date utilizate și modurile de adresare (mechanismul prin care calculatorul / procesorul localizează operanții).



Figura 1.5: Interfața hardware / software

Cele mai cunoscute ISA la nivelul anului 2001 sunt:

- IA-32 ISA (introdusă de Intel Corporation în 1979 și utilizată în prezent și de AMD)
- PowerPC (folosite de IBM și Motorola)
- Alpha (introdusă de Compaq Computer Corporation)
- PA-RISC (utilizată de Hewlett-Packard)
- SPARC (utilizată de SUN Microsystems)

**Translatarea unui program de nivel înalt** (fie acesta *C, Fortran*) **în ISA-ul aferent calculatorului care va executa respectivul program** (uzual IA-32) **se realizează prin intermediul compilatorului**. Este denumită *fază* a unui compilator o succesiune de operațiuni prin care un program de la intrare suferă anumite modificări. Prin *trecere* [Gol97] aparținând unui compilator se înțelege o citire a programului dintr-un fișier, transformarea lui conform unor faze și scrierea rezultatului în alt fișier (de ieșire). Se disting două faze majore ale procesului de compilare propriu-zisă:

- ☒ **analiza** - în care se identifică părțile constituente fundamentale ale programului și se construiește o reprezentare internă a programului original, numită „*cod intermedian*” (**analiza lexicală** produce un → sir de atomi lexicali -> **analiza sintactică** generează -> arborele syntactic → **analiză semantică** construiește o reprezentare a programului sursă în → *cod intermedian*).
- ☒ **sinteza** - generează cod mașină eventual optimizat. Se disting două etape:
  - **optimizare cod intermedian** (scheduling) pentru o anumită mașină;
  - **generare de cod mașină** (generare cod într-o gamă variată de formate: *limbaj mașină absolut*, *limbaj mașină relocabil* sau *limbaj de asamblare* urmat de alocare de resurse). Translatarea din limbaj de asamblare în cod mașină se realizează cu ajutorul unui asamblor.

Pentru fiecare limbaj de programare și pentru fiecare arhitectură target trebuie să existe un compilator corespondent. Ex: **gcc** în sistemul de operare Linux poate transforma un cod sursă C în cod obiect fie pentru procesor Intel, fie MIPS, fie pentru arhitectura virtuală SimpleScalar, în funcție de bibliotecile și instrumentele software folosite – asamblor, link-editor, interpretor.

##### 5. Microarhitectura – organizarea detaliată a unei implementări de ISA.

- IA-32 a fost implementată de-a lungul anilor de câteva microprocesoare diferite, fiecare având o microarhitectură unică: de la Intel 8086 în 1979 până la Pentium III în 1999.
- Alpha ISA este implementată în 4 microprocesoare diferite fiecare cu microarhitectura proprie 21064, 21164, 21264 și 21364.

Fiecare implementare reprezintă o oportunitate pentru proiectanții de calculatoare de a face diferențe compromisuri între costul microprocesoarelor și performanța acestora. Optimul se obține pe bază de simulare pe benchmarkuri standardizate. ISA descrie funcționalitatea de bază iar microarhitectura care o implementează reprezintă modelul particular obținut în funcție de compromisul cost/performanță (număr stații de rezervare și unități funcționale de execuție per fiecare tip de instrucțiune, număr de seturi de registri generali, valoarea factorului superscalar al microarhitecturii, numărul de faze pipeline de procesare Pentium III – 14, Pentium IV – 20, etc).

De exemplu, **tipul de date float va afecta numărul de faze pipeline de procesare a unităților de execuție** care operează asupra datelor flotante (de regulă  $n$  faze, cu  $n > 1$ ), tipului de date *int* corespunzându-i o fază pipeline. De asemenea, **setul de registri logici generali sunt implementați fizic la nivelul microarhitecturii. Setul de instrucțiuni aferent ISA impune ce tipuri de unități funcționale de execuție / stații de rezervare** specifice să fie implementate la nivel microarhitectural.

##### 6. Proiectarea la nivel de circuit logic – implementarea în limbaje de descriere hardware a fiecărui element component al microarhitecturii (registri, sumatoare, decodificatoare, multiplexoare, predictoare, cache-uri), urmată de modelare comportamentală și simulare la nivel de poartă logică pentru a face în final un compromis între cost / complexitate și performanță. Rezultatul acestei etape îl reprezintă *layout-ul* procesorului care va fi implementat hardware în etapa 7.

##### 7. Implementarea tehnologică la nivel de circuit – layout-ul obținut se implementează la nivel de tranzistor prin jonctiuni p-n respectiv n-p (tranzistoare CMOS), polarizate în pastila de siliciu pe mai multe straturi.

Conform celei mai generale clasificări, componentele unui sistem de calcul aparțin uneia dintre următoarele categorii:

- **hardware**-ul, care reprezintă componența fizică a unui sistem de calcul, în care circuitele electronice asigură prelucrarea automată a

informației precum și din echipamentele care realizează comunicarea între om și calculator. Trebuie să asigure cele 4 funcții conform teoriei lui von Neumann (de memorare/ de comandă și control / de prelucrare / de intrare-iesire).

- **software**-ul, care reprezintă ansamblul de programe care fac posibilă realizarea funcției sistemului de calcul de prelucrare a datelor și care constituie suportul logic de funcționare al sistemului de calcul. Se disting două mari componente:
  - software de bază* (sistemul de operare) care asigură legătura între componentele fizice și logice ale calculatorului, având funcții de gestionare a memoriei, a fișierelor, de protecție etc. Inițial se află pe hard-disk iar la pornirea calculatorului se încarcă în memoria principală. Exemple: DOS, Windows, Linux.
  - programele de aplicație* (limbaje și medii de programare, compilatoare, utilitare) – sunt scrise de către programatori la cererea utilizatorilor și codifică într-un limbaj de programare algoritmul de rezolvare al problemei respective.
- **firmware**-ul, care este componenta de programe încărcate în memoria fixă ROM (Read Only Memory) de către producătorul sistemului de calcul; aceasta componentă se află la limita dintre hardware și software, reprezentând partea de software integrat în hardware, prin metoda microprogramării.



Figura 1.5. Structura unui sistem de calcul

\*) **DMA** – dispozitive periferice a căror rată de transfer (octeți /secundă) este atât de ridicată încât, din motive de *timing*, face imposibil modul de lucru prin întreruperi. Ele accesează direct memoria fără intervenția procesorului. Exemple de dispozitive DMA sunt discurile magnetice și interfețele video.

**Unitatea centrală de calcul / procesare (CPU - central processing unit)**

- Realizează aducerea din memorie, decodificarea și execuția instrucțiunilor.
- Dispune de o memorie proprie, foarte mică și foarte rapidă (Regiștri – 32, 64 de uz general, PC, SP, RA)
- Execută:
  - Operații aritmetice (add/sub/mul/div)
  - Operații logice (and/or/xor/not)
  - Teste de comparație / salturi condiționate
  - Repetat anumite secvențe de instrucțiuni
- Comandă citirea / scrierea din / în memorie, porturi I/O
- Comandă trecerea în stare nedeterminată (*tristate*) a busului de date între procesor și memorie în cazul DMA.
- Este caracterizat de viteză mare de procesare
- Ceasul procesorului – circuit electronic ce conține un *cristal de cuarț*. Acesta generează impulsuri la intervale regulate stabilindu-se astfel tactul de lucru al procesorului.  $f=100 \text{ MHz} \Rightarrow$  într-o secundă (1s) sunt generate 100 de milioane de impulsuri de tact.

**Memoria internă** – realizează stocarea programelor și datelor necesare acestora.

- RAM (memorie cu acces aleator) - are caracter dinamic volatil
- ROM (memorie cu caracter permanent – folosită doar în citire)
- Poate fi statică sau dinamică caz în care un condensator va reprezenta celula inițială de memorare, necesitând reîncărcarea sa periodică (regenerare).
- Unitatea de măsură elementară a memoriei este **bitul** (*Binary Digit*). Definiția bitului: *probabilitatea unui element cu două stări să ia una dintre ele*. O succesiunea de biți din memoria internă poate corespunde unei instrucțiuni, unei date reprezentând valori numerice, text, diverse coduri (imagini, sunet, text).
- Este organizată în diviziuni (locații sau cuvinte) de o mărime egală cu cea a numărului de biți ce poate fi procesată simultan de procesor. **O locație de memorie** este caracterizată de **adresă** și de **conținut**. Un cuvânt de adresă pe  $m$  biți poate indexa un spațiu de  $2^m$  locații de memorie.

**Bus** (magistrală) – interconectează CPU cu memoria și dispozitivele periferice. Este formată dintr-o mulțime de fire paralele prin care sunt transmise adrese, date, semnale de comandă și control (Read / Write,

INTerupt Acknowledge), stări ale memoriei sau ale perifericelor (Cereri de întrerupere – semnalul INT, cereri de transfer DMA, Ready – dacă este activ semnifică faptul că Memoria / Dispozitivele de Intrare-iEșire sunt pregătite pentru transferul de date cu CPU). Magistrala reprezintă practic un set de reguli și mijloace de a realiza transferul într-un sistem de calcul. Constituie o cale de a transporta informații între două dispozitive / echipamente numite sursă și destinație. Din punct de vedere al dialogului pe magistrală (al coordonării transferului de informații) modulele implicate se pot afla într-o din următoarele stări:

- Master
- Slave

**Dispozitivele periferice** – intermediază comunicația calculatorului cu mediul înconjurător. Se disting două clase:

- a) **Dispozitive de Intrare / Ieșire** – tastatură, mouse, scanner, microfon (intrare) și monitor, imprimantă, plotter, difuzor (ieșire).
- b) **Memorii externe** – cu caracter nevolatil: hard-disk, floppy disk, CD-ROM, CD-RW. *Sunt mai lente decât memoria internă însă sunt mai ieftine per bit memorat.*

### **În loc de concluzie:**

Cele două "emisfere", hardware și software, în care își desfășoară activitatea cercetătorii din știința calculatoarelor sunt **doar aparent disjuncte**. Ideea că arhitectura procesoarelor interacționează "accidental" cu domeniul software este complet greșită, între hardware și software existând **în realitate o simbioză și o interdependență puternică, încă neexplorate corespunzător**. Procesoarele se proiectează odată cu compilatoarele care le folosesc iar relația dintre ele este foarte strânsă:

- **benchmark-urile** (programe de test standardizate) **sunt compilate pentru arhitectura respectivă** iar,
- **compilatorul trebuie să genereze cod care să exploateze caracteristicile arhitecturale**, altfel codul generat va fi ineficient.

Preocupările programatorilor nu trebuie să vizeze doar interfață care atrage sau diversele artificii care fac din utilizator un simplu robot ci și implicațiile pe care aplicația creată o are asupra microarhitecturii. Scopul aplicației trebuie să fie utilizarea cu justățe atât a resurselor software avute la dispoziție cât și a algoritmilor / conceptelor de programare cunoscute (moștenire, polimorfism, apeluri de funcții prin pointer chiar și acolo unde nu este cazul). În caz contrar, "*răul*" (a se citi în primul dificultatea procesării rapide datorită ramificațiilor de program, cod obiect masiv, resurse hardware suplimentare) se răsfrânge asupra performanțelor

arhitecturii. În ce-i privește pe proiectanții de arhitecturi, schemele propuse de aceștia ar putea fi mai eficiente dacă nu ar analiza numai codul obiect al benchmark-urilor avute la dispoziție dezbrăcat de orice semantică ci ar privi "mai sus" spre sursa de nivel înalt a acestora.

### 1.3. EXERCIȚII ȘI PROBLEME

1. Numiți și explicați noțiunea de algoritm și trei caracteristici ale acestuia. Pentru fiecare din caracteristici dați un exemplu de procedură care nu o îndeplinește (3 contraexemple).
2. Specificați avantajele și dezavantajele programării într-un limbaj de nivel înalt față de programarea la nivel apropiat de procesor (asamblare).
3. Numiți cel puțin trei noțiuni specificate de ISA (arhitectura setului de instrucțiuni). Descrieți pe scurt diferența dintre ISA și microarhitectură. Câte ISA sunt implementate în mod normal de o singură microarhitectură. Invers, câte microarhitecturi pot exista pentru o singură ISA ?
4. Enumerați nivelele de transformare și dați câte un exemplu la fiecare nivel.
5. Care sunt principalele provocări (tendințe) în proiectarea sistemelor de calcul și ce compromisuri se fac ?
6. Să considerăm următoarea „cutie neagră - *black box*” care preia două numere și realizează suma lor (vezi figura (a)). Considerăm o altă casetă capabilă să înmulțească două numere (vezi figura (b)). Cele două casete pot fi interconectate pentru a calcula  $p \times (m + n)$  (vezi figura (c)). Presupunând că dispunem de un număr nelimitat de astfel de casete arătați cum vor fi interconectate pentru a calcula următoarele expresii:
  - a)  $a \cdot x + b$
  - b) Media aritmetică a patru numere w, x, y, și z.
  - c)  $a^3 + 3a^2b + 3ab^2 + b^3$  (folosind doar o singură casetă de adunare și două de înmulțire)



7. Ce a revoluționat tehnologia și a pus bazele miniaturizării, deschizând calea spre apariția calculatoarelor moderne ? [Log06]

8. Care a fost primul calculator digital de succes, cine sunt constructorii și unde a fost el utilizat ? Ce operații putea el să execute ? Ce performanțe și volum avea ? [Log06]

9. Prin ce se caracterizează arhitectura revoluționară propusă de John von Neumann ?

10. Selectați răspunsul corect pentru următorul enunț: „*Ce este memoria RAM din punct de vedere al programatorului?*” [Zah04]

  - un dispozitiv de stocare în masă
  - o zonă de păstrare pentru manipularea / prelucrarea informațiilor curente.
  - o parte mecanică

11. Selectați continuarea corectă pentru următorul enunț: „*Un algoritm* ” [Zah04]

  - este o însiruire de comenzi
  - este un lanț de instrucțiuni
  - este o descriere sintetică a unei probleme
  - rezolvă problema într-un număr finit de pași
  - toate variantele de mai sus sunt corecte.

## **2. REPREZENTAREA INFORMAȚIILOR. CONVERSII DE VALORI ÎNTRE SISTEME DE NUMERAȚIE. ARITMETICĂ BINARĂ. OPERAȚII LOGICE**

### **2.1. REPREZENTAREA INFORMAȚIILOR ÎN SISTEMELE DE CALCUL**

În acest capitol se urmărește identificarea tipurilor de informații reprezentate într-un calculator și definirea modurilor de codificare a acestora în vederea memorării, prelucrării și transmiterii. Se vor efectua conversii de date între sistemele de numerație binar, zecimal și hexazecimal. Se vor reprezenta numere pozitive și negative în semn și mărime, complement față de 1 și complement față de 2; se vor comenta avantajele și dezavantajele celor 3 variante de reprezentare. Se vor efectua operații aritmetico-logice cu valori numerice reprezentate în cod complementar. Se vor reprezenta numere în virgulă flotantă; se vor analiza limitările acestei forme de reprezentare și se va face o comparație cu reprezentarea în virgulă fixă.

**Informația – Definiție. Cuantificare. Convenții de memorare în calculator. Clasificare.**

■ **Definirea informației**

- noțiune primară - greu de definit, reprezintă un atribut al materiei
- *“mesaj” obiectiv care aduce o clarificare privind starea unui proces care are mai multe stări și elimină nedeterminarea în legătură cu realizarea unui eveniment.*

■ **Cantitatea de informație - entropia informațională ( $E$ )**

- Claude E. Shannon [Sha48] a introdus noțiunea de **bit** (*binary digit*) ca fiind „**unitatea de măsură a informației**”. Shannon afirmă că există o corelație între **informația produsă prin apariția unui eveniment în cadrul unui experiment și logaritmul inversului probabilității de apariție a acestui eveniment**. Plecând de la această definiție, Shannon a introdus conceptual de entropie

informațională (E), element de maximă importanță în teoria informației și a științei comunicațiilor.

- E reprezintă o măsură a gradului de incertitudine (nedeterminare) dintr-un sistem. Este dependentă de numărul maxim de stări posibile al respectivului sistem. Gradul de organizare a sistemului este direct proporțional cu cantitatea de informație înmagazinată și invers proporțional cu entropia informațională a sistemului.

Exemple: aruncarea unei monede, aruncarea unui zar

$$\begin{array}{cccc} x_1 & x_2 & \dots & x_n \\ p_1 & p_2 & \dots & p_n \end{array} \quad \boxed{E = - \sum p_i \log_2 p_i}$$

**Observație:** Entropia devine maximă (*dezordine maximă*) pentru o distribuție echiprobabilă. Astfel dacă  $p_i = \frac{1}{n}, \forall i = \overline{1, n}, \Rightarrow E = \max = \log_2 n$  – valoare ce reprezintă numărul minim de biți necesar codificării entropiei. Analog, entropia devine minimă (*ordine maximă*) când  $p_k = 1$  și  $p_i = 0 \forall i \neq k, i = \overline{1, n}, \Rightarrow E = \min = 0$ , considerând prin convenție  $\log_2 0 = 0$ .

De exemplu, pentru 2 stări echiprobabile entropia este:

$E = - 2 * 0.5 * \log_2 0.5 = 1$  unitate de informație (1 bit). O înșiruire de 8 biți formează un octet (1 byte). Multiplii octetilor sunt **kilo/mega/giga/tera/peta octeți**:

- **1kO** (kilo octet) =  $2^{10}(1.024)o \approx 10^3 o$
- **1Mo** (mega octet) =  $2^{20}(1.048.576)o \approx 10^6 o$
- **1Go** (giga octet) =  $2^{30}(1.073.741.824)o \approx 10^9 o$
- **1To** (tera octet) =  $2^{40}(1099511627776)o \approx 10^{12} o$
- **1Po** (peta octet) =  $2^{50}(1099511627776)o \approx 10^{15} o$

### ■ Convenții de memorare a informației în calculator

Memoria internă a unui calculator este alcătuită dintr-o succesiune de locații; fiecare locație are un număr fix de biți, număr stabilit de către proiectantul de arhitectură în momentul în care se decide modul de organizare a memoriei. Astfel, în mod ușual numărul de biți ai unei locații este un multiplu de 8. Locația este unitatea elementară de adresare a unei memorii; la majoritatea procesoarelor (cu excepția microcontrolerelor) informația din memorie nu se poate adresa la nivel de bit. Indexarea locațiilor de memorie se face, pe bază de adresă. La procesoarele Intel, MIPS unitatea minimă de adresare (locația de memorie) are 8 biți. În același

timp însă memoria se poate adresa la nivel de semi-cuvânt (*halfword* – 16 biți), cuvânt (*word* – 32 biți) sau dublu-cuvânt (*double* – 64 biți).

Ca în cazul oricărui sistem de numerație pozitonal (8,10,16) și în cazul sistemului binar bitul **cel mai puțin semnificativ** al unui octet (bitul D<sub>0</sub>) se află în poziția cea mai din dreapta a datei, iar **bitul cel mai semnificativ** în poziția stângă. Importanța acestei convenții se remarcă în cazul operațiilor logice de deplasare și rotire spre dreapta sau spre stânga.



Dacă o dată este reprezentată pe un număr mai mare de octeți atunci se pune problema modului de amplasare a octeților la adrese consecutive de memorie (așa numită *ordine a octeților*). Procesoarele pot numerota octeții din interiorul unui cuvânt de 32 de biți astfel încât octetul cu numărul cel mai mic este fie cel mai din stânga fie cel mai din dreapta. Există două convenții de reprezentare:

- *big endian* – partea mai semnificativă a numărului se pune la adrese mai mici (se pune în față).

| Byte # |   |   |   |
|--------|---|---|---|
| 0      | 1 | 2 | 3 |

- *little endian* – partea mai puțin semnificativă a datei se amplasează la adrese mai mici (se pune în față).

| Byte # |   |   |   |
|--------|---|---|---|
| 3      | 2 | 1 | 0 |

De exemplu în convenția *little endian* o valoare hexazecimală de forma 11223344h se memorează la adresa fizică 400h în felul următor:

De exemplu, procesoarele Alpha, Intel și MIPS folosesc convenția “little-endian”, în timp ce în cazul procesoarelor Macintosh, HP Bobcat sau SPARC ordinea folosită este “big-endian”.

### ■ Clasificare

Se reamintește că una din funcțiile de bază ale calculatorului este de prelucrare a informațiilor. Pentru a putea fi prelucrate, informațiile trebuie reprezentate (codificate) într-un anumit format, pe baza unor reguli bine definite și lipsite de ambiguități. Modul de reprezentare a informațiilor depinde de tipul informațiilor și de obiectivele prioritare urmărite.

Informațiile prelucrabile pe un calculator sunt de mai multe tipuri:

- program (executabil) – secvență de coduri de instrucțiuni
- date:
  - o numerice:
    - întregi
      - fără semn – numere naturale
      - cu semn – numere întregi
    - reale – numere cu parte întreagă și parte fracționară (practic sunt numere din mulțimea Q a numerelor fracționare)
  - o alfanumerice – text
  - o logice – adevărat/fals
  - o multimedia
    - audio
    - video
      - imagini statice
      - secvență de cadre (film)
  - o semnale – mărimi fizice de proces, detectate prin senzori sau transmise prin elemente de acționare

Interschimbarea noțiunilor „**dată**” respectiv „**informație**” este larg răspândită în lumea largă, nefăcându-se distincție de cele mai multe ori între ele, fiind tratate ca și sinonime. În realitate însă [Bel04], există diferențe între cele două noțiuni: **informația are un conținut semantic** (obținut în urma unui proces de interpretare), pe când **data este forma fizică de reprezentare a unei informații**. Potrivit cercetătorului Russell Ackoff [Ack89] conținutul minții umane poate fi clasificat în 5 categorii (fiecare categorie bazându-se pe cele de dinaintea sa): *date, informații, cunoaștere, înțelegere și înțelepciune*. Se pune întrebarea ce decurge din aceste observații: *Calculatorul prelucrează date sau informații?* Dacă se consideră în mod simplist că un program specifică o secvență de transformări prin care

trec datele inițiale în scopul generării unui rezultat, atunci se poate spune că un calculator prelucrează date. Prin interpretarea datelor un utilizator le transformă însă în informație. De exemplu data 49 poate fi o valoare de temperatură, o vîrstă, o poziție într-un sir, o dimensiune sau codul ASCII al cifrei 1 (49=0x31) văzut ca și caracter ('1'). Există însă și cazuri, mai ales în domeniul inteligenței artificiale [Seb, Gor05], în care calculatorul identifică și percepce anumite concepte sau relații, care nu mai sunt simple date.

Pentru fiecare tip de informație [Seb] există una sau mai multe forme de reprezentare (codificare). Alegerea unei anumite forme de codificare se face în funcție de anumite obiective urmărite, cum ar fi:

- reprezentarea coerentă, a informațiilor în vederea stocării, transmiterii și a prelucrării acestora
- utilizarea eficientă a spațiului alocat (spațiu minim)
- detecția și corecția erorilor
- simplificarea operațiilor de prelucrare, stocare și transmitere
- securizarea datelor

### 2.1.1. REPREZENTAREA INFORMAȚIILOR NUMERICE FĂRĂ SEMN. SISTEME DE NUMERAȚIE

Pentru **reprezentarea valorilor numerice** se pot folosi diferite sisteme de numerație [Gor05, Seb, Măr96]. Un astfel de sistem este definit printr-un *set finit de simboluri și un set de reguli pentru reprezentarea valorilor prin combinații de simboluri* (numere și litere). Se cunosc două tipuri de sisteme de numerație: *ponderate* (Ex: binar, zecimal, hexazecimal) și neponderate (Ex: codul Gray). Un *sistem ponderat de numerație* atribuie ponderi pentru fiecare poziție dintr-o reprezentare. De regulă, ponderile sunt puteri crescătoare ale unei valori; această valoare considerându-se baza sistemului ponderat de numerație. Un sistem de numerație ponderat se definește în felul următor:

- *simboluri*:  $0, 1, 2, 3, \dots (b-1)$  (1), unde  $b$  reprezintă baza sistemului de numerație
- *reprezentare*:  $N_b \rightarrow x_n \dots x_2 x_1 x_0, x_n \neq 0$  (2)
- *calculul valorii*:  $N_b = x_n * b^n + \dots + x_2 * b^2 + x_1 * b^1 + x_0$  (3)

Codurile neponderate asociază fiecărei cifre zecimale o tetradă binară, cifrele binare neavând însă semnificația unor ponderi. Codul Gray are

caracteristic faptul că fiecare cifră zecimală, reprezentată pe 4 cifre binare, diferă de următoarea cifră zecimală, prin modificarea unei singure cifre binare din tetradă și a fost introdus pentru a minimiza o serie de erori în proiectarea automatelor.

| Gray | Zecimal |
|------|---------|
| 0000 | 0       |
| 0001 | 1       |
| 0011 | 2       |
| 0010 | 3       |
| 0110 | 4       |
| 0111 | 5       |
| 0101 | 6       |
| 0100 | 7       |
| 1100 | 8       |
| 1101 | 9       |

**Tabelul 2.1.** Echivalența cod Gray – zecimal

*Sistemul de numerație binar* este practic cel mai potrivit pentru reprezentarea valorilor numerice într-un calculator. Există două explicații pentru această alegere:

- *Simplitatea implementării* folosind circuite care au 2 stări stabile corespunzătoare celor două simboluri ale sistemului binar 0 și 1.
- *Reguli de efectuare a operațiilor aritmetice mult mai puține* decât în oricare alt sistem de numerație, ceea ce simplifică structura unității aritmetice.

În sistemul binar pentru reprezentarea întregilor fără semn (naturale)  $b$  din (1) este egal cu 2. Pentru numerele întregi fără semn pe  $n$  biți pot reține  $2^n$  numere în intervalul  $0 \div 2^n - 1$ . Dacă  $A$  este un întreg fără semn rezultă că numărul de biți pe care poate fi reprezentat este:  $n_b = \lceil \log_2 A \rceil + 1$ . Demonstrația se bazează pe faptul că orice număr natural (fie  $A$  în acest caz) poate fi încadrat între două puteri consecutive ale lui 2 ( $2^{n_b-1} \leq A < 2^{n_b}$ ).

**Dezavantajul** sistemului binar de numerație constă în numărul mare de cifre necesare pentru reprezentarea unei anumite valori (mai mare decât în orice alt sistem de numerație).

Pentru reprezentarea numerelor cu parte fracționară s-a introdus încă un simbol suplimentar, și anume punctul zecimal. Toate cifrele care urmează după punctul zecimal sunt ponderate cu puteri negative ale bazei, după cum urmează:

- reprezentare:  $N_b \rightarrow x_n...x_2x_1x_0.x_{-1}x_{-2}...x_{-m}$
- calculul valorii:

$$N_b = x_n * b^n + ... + x_2 * b^2 + x_1 * b^1 + x_0 * b^0 + x_{-1} * b^{-1} + x_{-2} * b^{-2} + ... + x_{-m} * b^{-m}$$

## Conversii între sisteme de numerație

### a) Din zecimal în binar

Conversia unui număr dintr-o bază de numerație în alta se face separat pentru partea întreagă și pentru partea fracționară. *Partea întreagă se divide succesiv cu noua bază și se rețin resturile parțiale în ordinea inversă a generării lor. Partea fractionară se înmulțește succesiv cu baza și se refinează fiecare dată partea întreagă a rezultatului.* Corectitudinea acestor tehnici de conversie se demonstrează matematic.

#### ■ Partea întreagă

$$N = (...(x_m+0)b+x_{m-1})b+...+x_1)b+x_0$$

$$N = N_1 \cdot b + x_0$$

$$N_1 = N_2 \cdot b + x_1$$

...

$$N_m = 0 * b + x_m$$

#### ■ Partea fracționară

$$N = N_{\text{intr}} + N_{\text{zec}}$$

$$N_{\text{zec}} = x_{-1} \cdot b^{-1} + x_{-2} \cdot b^{-2} + ...$$

$$x_{-1} = [N_{\text{zec}} \cdot b]$$

$$N_{\text{zec}} \cdot b = x_{-1} + N_{2\text{zec}}$$

$$x_{-2} = [N_{2\text{zec}} \cdot b]$$

.....

De exemplu pentru conversia numărului  $23.45_{10}$  din zecimal în binar se fac următoarele operații:

|      |                     |        |                            |
|------|---------------------|--------|----------------------------|
| 23   | $23_{10} = 10111_2$ | 0,45   | $0,45_{10} = 0,01110..._2$ |
| 11 1 |                     | 0,9    | 0                          |
| 5 1  |                     | 1,8    | 1                          |
| 2 1  |                     | 1,6    | 1                          |
| 1 0  |                     | 1,2    | 1                          |
| 0 1  |                     | 0,4... | 0                          |

Se observă că în cazul conversiei părții fracționare de cele mai multe ori nu se obține un rezultat exact. Procesul de conversie se încheie atunci când se obține o precizie rezonabilă de exprimare a valorii fracționare. De exemplu în multe aplicații inginerești o precizie de 2 cifre zecimale după virgulă se consideră o precizie acceptabilă. Întrebarea este câte cifre binare sunt necesare pentru o precizie similară? La exprimarea în baza zece, prin două cifre după punctul zecimal se obține o eroare maximă de  $1/100$ . În baza 2 pentru o precizie similară trebuie să se utilizeze 7 cifre binare pentru a obține o eroare maximă de  $1/128$ , adică  $1/2^7$ . În mod similar pentru o precizie mai mare de  $1/1000$  (3 cifre zecimale după punct) sunt necesare 10 cifre binare ( $1/1024 = 1/2^{10}$ ).

Pozitia punctului zecimal nu se reprezintă în calculator. Prin convenție se consideră într-o poziție predefinită. Pentru reprezentarea numerelor strict întregi poziția punctului zecimal se consideră în dreapta reprezentării (după cifra cea mai puțin semnificativă). Din această cauză această codificare poartă numele de "*reprezentare în virgulă fixă*". Pentru operațiile de adunare și scădere poziția punctului zecimal nu influențează rezultatul generat. Situația este diferită pentru operațiile de înmulțire și împărțire, unde poziția punctului în rezultat se schimbă.

### b) Din binar în hexazecimal

Pentru a face trecerea de la sistemul zecimal la cel binar și invers adesea se utilizează un sistem de numerație intermediar, care se apropie de ambele sisteme. De exemplu sistemul hexazecimal este utilizat în acest scop deoarece, pe de-o parte permite exprimarea unor valori printr-un număr redus de cifre, iar pe de altă parte se poate converti relativ simplu în sistemul binar. În cazul în care se vizualizează conținutul unei zone de memorie sau a unor registrii informația este prezentată în format hexazecimal, chiar dacă în calculator informația există în binar. Sistemul octal și ulterior hexazecimal au fost introduse și datorită existenței afișoarelor cu 7 segmente.

Convertirea unui număr din sistemul binar în sistemul hexazecimal și invers (vezi tabelul 2.2) se face prin gruparea bițiilor câte 4 (cele 16 cifre - valori hexazecimale - sunt reprezentate pe 4 biți), începând de la punctul zecimal spre dreapta și spre stânga și echivalarea câte unei cifre hexazecimale cu o combinație de 4 biți.

| Binar | Hexazecimal | Zecimal |
|-------|-------------|---------|
| 0000  | 0           | 0       |
| 0001  | 1           | 1       |
| 0010  | 2           | 2       |
| 0011  | 3           | 3       |
| 0100  | 4           | 4       |
| 0101  | 5           | 5       |
| 0110  | 6           | 6       |
| 0111  | 7           | 7       |
| 1000  | 8           | 8       |
| 1001  | 9           | 9       |
| 1010  | A           | 10      |
| 1011  | B           | 11      |
| 1100  | C           | 12      |
| 1101  | D           | 13      |
| 1110  | E           | 14      |
| 1111  | F           | 15      |

**Tabelul 2.2.** Echivalență binar – hexazecimal – zecimal.

Exemple de conversie binar – hexazecimal și invers:

$$1011.0011.1100.11_2 \Rightarrow B3.CC_{16} \quad 1ED_{16} \Rightarrow 1.1111.1101_2$$

$$101.1111.011_2 \Rightarrow 5.F6_{16} \quad 33.3_{16} \Rightarrow 11.0011.0011_2$$

### 2.1.2. REPREZENTAREA NUMERELOR CU SEMN

Pentru reprezentarea numerelor pozitive și negative se alocă un bit suplimentar, care indică semnul. Există 3 forme de reprezentare a acestor numere:

- prin semn și magnitudine (mărime) sau *cod direct*
- în complement față de unu sau *cod invers*
- în complement față de 2 sau *cod complementar*

Indiferent de reprezentare, bitul de semn este egal cu 0 dacă numărul este pozitiv și 1 dacă numărul este negativ. Pentru evitarea ambiguităților, la acest tip de reprezentare este important să se stabilească de la început numărul de biți pe care se face reprezentarea.

### **Reprezentarea prin semn și magnitudine (SM) – cod direct:**

Se reprezintă valoarea absolută a numărului pe n-1 poziții binare (n – numărul total de biți ai reprezentării) și se adaugă un bit de semn (**0** - pt. numere **pozitive** și **1** pt. numere **negative**) pe poziția cea mai semnificativă a reprezentării. De exemplu:

$$-21_{10} \rightarrow 1001.0101_2 \quad 17_{10} \rightarrow 0001.0001_2 \quad 0_{10} \rightarrow 0000.0000_2$$

(reprezentări pe 8 biți)

$129_{10} \rightarrow$  valoarea absolută nu se poate reprezenta pe 7 biți (ca în cele trei exemple anterioare) => reprezentarea se poate face numai pe un număr mai mare de biți (minim 9)

$$129_{10} \rightarrow 0000.0000.1000.0001_2 \quad -129_{10} \rightarrow 1000.0000.1000.0001_2$$

(reprezentări pe 16 biți)

Deși această formă de reprezentare este simplă, ea nu este avantajoasă pentru implementarea operațiilor aritmetice întrucât unitatea aritmetică-logică ar trebui să țină cont de semnul operanzilor.

### **Reprezentarea în complement față de 1 (C1) – cod invers:**

Numerelor pozitive se reprezintă ca și în cazul anterior, adică n-1 biți pentru valoare și 1 bit, egal cu 0 pentru semn. În cazul numerelor negative se complementează fiecare poziție binară a reprezentării valorii absolute a numărului, inclusiv bitul de semn. De exemplu:

$$|-24_{10}| \rightarrow 0001.1000 \quad 19_{10} \rightarrow 0001.0011 \quad |-127_{10}| \rightarrow 0111.1111$$

$$-24_{10} \rightarrow 1110.0111 \quad 0001.0011 \quad -127_{10} \rightarrow 1000.0000$$

Se observă că  $-127 + 127 = 1111.1111$ . Dar  $-x+x=0 = 0000.0000$   
 $\forall x \in R \Rightarrow$  Dezavantaj: Există două reprezentări ale numărului 0.

### **Reprezentarea în complement față de 2 (C2) - cod complementar:**

Numerelor pozitive se reprezintă ca și în cazurile anterioare. Reprezentarea numerelor negative se obține prin adăugarea unei unități la reprezentarea în complement față de 1. De exemplu:

$$|-21_{10}| \rightarrow 0001.0101 \quad 15_{10} \rightarrow 0000.1111 \quad |-112_{10}| \rightarrow 0111.0000$$

$$\begin{array}{rcccl} -21_{10} & \rightarrow & 1110.1010 & + C1 & 0000.1111 \ C1 \\ & & 1 & & 1 \\ -21_{10} & \rightarrow & 1110.10\textcolor{blue}{11} & C2 & 0000.1111 \ C2 \end{array} \quad \begin{array}{rcccl} -112_{10} & \rightarrow & 1000.1111 & + C1 & 1 \\ & & 1 & & \\ -112_{10} & \rightarrow & 1001.0000 & C2 & 0001.0000 \ C2 \end{array}$$

Reprezentarea în complement față de 2 este avantajoasă deoarece simplifică modul de calcul al operațiilor aritmetice. La operațiile de adunare și scădere unitatea aritmetică nu trebuie să țină cont de semnul operanzilor, rezultatul generat fiind corect indiferent de semn. Mai mult rezultatul este corect și în cazul în care se consideră că reprezentările sunt numere strict pozitive. Pe baza acestei observații se poate utiliza aceeași unitate de adunare/scădere atât pentru numere pozitive cât și pentru numere cu semn.

De exemplu:

| Numere cu semn | Numere fără semn |
|----------------|------------------|
| -64+           | 1100.0000+       |
| 15             | 0000.1111        |
| -49            | 1100.1111 ->207  |
|                | 0011.0001 -> 49  |

În ziua de azi toate calculatoarele utilizează reprezentarea în complement față de 2. Celelalte două forme s-au folosit la primele calculatoare.

**Observație!!!** Reprezentarea în cod complementar a unui număr pozitiv nu înseamnă complementarea numărului, ci reprezentarea sa în formă pozitivă, care este identică în cele trei forme de reprezentare (SM, C1 și C2).

La reprezentarea în complement față de 2, dacă se trece de la o reprezentare pe 8 biți la una pe 16 biți sau mai mare atunci este necesară **extinderea semnului**, în aşa fel încât în noua reprezentare valoarea și semnul numărului să se păstreze. Regula constă în copierea valorii bitului de semn în fiecare poziție binară a porțiunii extinse. De exemplu:

| Valoare | Reprezentare C2 pe 8 biți | Reprezentare C2 pe 16 biți |
|---------|---------------------------|----------------------------|
| -6      | 1111.1010                 | 1111.1111.1111.1010        |
| 0       | 0000.0000                 | 0000.0000.0000.0000        |
| 6       | 0000.0110                 | 0000.0000.0000.0110        |

**Tabelul 2.3.** Extinderea semnului la reprezentarea pe mai mulți biți decât sunt necesari

### Conversia din binar în zecimal a numerelor întregi cu semn

Considerând o valoare reprezentată în cod complementar pe 8 biți ( $a_7a_6\dots a_1a_0$ ) rezultă că valoarea corespondentă în zecimal aparține intervalului  $[-2^7, 2^7-1]$ . Conversia se realizează în următorii pași:

1. Se examinează cel mai semnificativ bit.
  - Dacă  $a_7=0$  atunci numărul reprezentat este pozitiv și se poate trece la determinarea magnitudinii sale (vezi pasul 2).
  - Dacă  $a_7=1$  atunci numărul reprezentat este negativ. În acest caz se determină reprezentarea în cod complementar a numărului pozitiv care are aceeași magnitudine și se calculează mărimea acestuia.
2. Magnitudinea (valoarea absolută) se determină cu formula:  

$$a_6 \cdot 2^6 + a_5 \cdot 2^5 + \dots + a_0 \cdot 2^0$$
 (practic se adaugă puterile lui 2 acolo unde coeficienții  $a_i$  sunt 1).
3. În final dacă numărul inițial este negativ atunci valorii absolute determinate la punctul 2 îi este prefixat simbolul '-'.

Exemplu:

Se dă exprimată în cod complementar numărul: 11000111. Să se determine valoarea lui în zecimal.

Întrucât cel mai semnificativ bit este 1 rezultă că numărul este negativ. Se determină reprezentarea în cod complementar a numărului pozitiv care are aceeași magnitudine și anume:  $00111000+1=00111001$ . Magnitudinea acestuia este:  $2^5 + 2^4 + 2^3 + 2^0 = 57$ . Numărul inițial (11000111) fiind negativ rezultă că valoarea întreagă corespondentă în zecimal acestuia este -57.

### **2.1.3. REPREZENTAREA NUMERELEOR ÎN VIRGULĂ FLOTANTĂ. FORMATUL IEEE 754**

Această formă de codificare se utilizează pentru reprezentarea unor valori foarte mari, foarte mici sau dacă numerele au o parte fraționară. Pentru reprezentarea în virgulă flotantă numărul este adus la o formă normalizată (standard) în care există o parte strict subunitară (mantisa) care se înmulțește cu o putere a lui 2 (exponentul). La mantisa prima cifră de după virgulă este strict diferită de 0.

$$N = \pm 1.f \times 2^{ \pm e}$$

unde,

$N$  – este numărul reprezentat în virgulă mobilă

$f$  – reprezintă partea fraționară a lui  $N$

$\pm 1.f$  – se numește mantisa și trebuie să respecte relația de normalizare:

$$1 \leq |\pm 1.f| < 2$$

2 – baza sistemului de numerație

$\pm e$  – reprezintă exponentul bazei sistemului de numerație

IEEE (*Institute of Electrical and Electronics Engineers*) a dezvoltat un standard pentru reprezentarea numerelor în virgulă mobilă și operațiile aritmetice în această reprezentare. Scopul era facilitarea portabilității programelor între diferite calculatoare. Standardul IEEE 754 a fost publicat în 1985. Cele mai multe coprocesoare aritmetice, printre care și cele *Intel* pentru familia de microprocesoare 80x86, se conformează acestui standard. În reprezentarea standard IEEE se folosesc 3 câmpuri (vezi tabelul 2.4):

- un bit de semn (S) – indică semnul numărului
- un câmp pentru exponent (*caracteristică*) – indică magnitudinea numărului
- un câmp pentru mantisă (*fracție*) – indică un set de cifre semnificative ale numărului

|    |                |    |         |   |         |
|----|----------------|----|---------|---|---------|
| 31 | 30.....        | 23 | 22..... | 0 | Fracție |
| S  | Caracteristică |    |         |   |         |

**Tabelul 2.4.** Reprezentarea unui număr în virgulă mobilă simplă precizie

Standardul definește trei formate:

- Formatul *scurt* (simplă precizie) – 32 biți – 1 semn + 8 caracteristică + 23 mantisă
- Formatul *lung* (dublă precizie) – 64 biți – 1 semn + 11 caracteristică + 52 mantisă
- Formatul *temporar* (precizie extinsă) – 80 biți – 1 semn + 24 caracteristică + 56 mantisă

*Caracteristica* reprezintă exponentul deplasat. Pentru formatul scurt, deplasamentul este 127 (7Fh), iar pentru formatul lung deplasamentul este 1023 (3FFh). Valorile minime (0) și cele maxime (255, respectiv 2047) ale caracteristicii nu sunt utilizate pentru numerele normalizate, ele având utilizări speciale.

$$NS = (-1)^S \times \text{Mantisă} \times 2^{\text{Caracteristică}-127}$$

$$ND = (-1)^S \times \text{Mantisă} \times 2^{\text{Caracteristică}-1023}$$

Gama numerelor care pot fi reprezentate în precizie simplă este cuprinsă între aproximativ  $2,2 \times 10^{-38}$  și  $3,4 \times 10^{38}$ , iar cea a numerelor reprezentate în precizie dublă este cuprinsă între  $2,2 \times 10^{-308}$  și  $1,7 \times 10^{308}$ .

Mulți echivalează în mod greșit reprezentarea în virgulă flotantă cu mulțimea numerelor reale din matematică. Există câteva deosebiri esențiale:

- în virgulă flotantă se reprezintă valori discrete și nu domeniu continuu de valori (submulțimi de numere raționale a mulțimii numerelor reale)
- nu pot fi reprezentate numere foarte mari sau foarte mici; de exemplu sunt probleme în ceea ce privește reprezentarea valorii zero și a valorilor  $+\/-\infty$
- rezoluția absolută de reprezentare variază cu valoarea reprezentată
- compararea a două valori flotante poate genera surprize datorită preciziei de reprezentare și a rotunjirilor

## Operații efectuate în virgulă mobilă

- *Adunarea și scăderea* a două numere în virgulă mobilă se efectuează astfel:
  - ✓ Se compară cele doi exponenți pentru a-l determina pe cel mai mare.
  - ✓ Se aliniază mantisa numărului cu exponentul mai mic, prin deplasarea virgulei corespunzătoare exponentului mai mare.
  - ✓ Se adună / scad mantisile aliniate, atribuind exponentul comun.
  - ✓ Eventual se normalizează mantisa concomitent cu modificarea exponentului.
- *Înmulțirea și împărțirea* presupun:
  - ✓ Adunarea (scăderea) exponenților.
  - ✓ Înmulțirea (împărțirea) mantiselor.
  - ✓ Eventuală normalizare a mantiselor.

Exemple [Mâr96]:

Să se reprezinte numerele în virgulă mobilă simplă precizie:

a)  $25_{10} = (11001)_2 = 1,1001 \times 2^4$

unde:

mantisa = 1,1001

fracția = 1001

exponentul = 4

Semnul = 0

Caracteristica = exponentul + 127 = 131

| 31 | 30.....23 | 22.....0     |
|----|-----------|--------------|
| 0  | 10000011  | 100100.....0 |

$$b) \frac{31}{32} = \frac{2^4 + 2^3 + 2^2 + 2^1 + 2^0}{2^5} = 2^{-1} + 2^{-2} + 2^{-3} + 2^{-4} + 2^{-5} = 0,1111\frac{1}{2} = 1,1111\frac{1}{2} \times 2^{-1}$$

unde:

$$\text{mantisa} = 1,1111$$

$$\text{fracția} = 1111$$

$$\text{exponentul} = -1$$

$$\text{Semnul} = 0$$

$$\text{Caracteristica} = \text{exponentul} + 127 = 126$$

| 31 | 30.....23 | 22.....0    |
|----|-----------|-------------|
| 0  | 01111110  | 11110.....0 |

$$c) -\frac{1}{8} = -\frac{2^6}{2^3} = -2^{-3} = -0,001_2 = -1,0_2 \times 2^{-3}$$

unde:

$$\text{mantisa} = -1,0$$

$$\text{fracția} = 0$$

$$\text{exponentul} = -3$$

$$\text{Semnul} = 1$$

$$\text{Caracteristica} = \text{exponentul} + 127 = 124$$

| 31 | 30.....23 | 22.....0    |
|----|-----------|-------------|
| 1  | 01111100  | 00000.....0 |

Dacă se urmărește acum adunarea a două din cele trei numere exprimate mai sus:  $25 - 1/8$  rezultă se obține:

$$25 - 1/8 = 1,1001 \times 2^4 - 1,0 \times 2^{-3} = 1,1001 \times 2^4 - 0,0000001 \times 2^4 = 1,1000111 \times 2^4 = 11000,111_2 = 24,875$$

Reprezentarea în virgulă mobilă a rezultatului este:

| 31 | 30.....23 | 22.....0       |
|----|-----------|----------------|
| 0  | 10000011  | 10001110.....0 |

### 2.1.4. REPREZENTAREA INFORMAȚIILOR ALFANUMERICE – STANDARDUL ASCII

Informațiile alfanumerice sunt cele care se prezintă sub formă de text și eventual conțin o grafică simplă bazată pe forme grafice predefinite de dimensiunea unui caracter. Cel mai utilizat sistem pentru reprezentarea informațiilor alfanumerice este standardul **ASCII** (American Standard Coding for Information Interchange). Acest standard utilizează 7 biți pentru reprezentarea codurilor alfanumerice (8 biți în varianta extinsă). Sunt codificate următoarele tipuri de date:

- litere mari și mici
- cifre zecimale
- semne de punctuație
- coduri de editare și formatare a textului
- coduri de control al transferului de date

Tabelul 2.5 conține câteva exemple de coduri ASCII:

| <b>Litere</b>              |     | <b>Cifre</b>                             |     |
|----------------------------|-----|------------------------------------------|-----|
| A                          | 41h | 0                                        | 30h |
| B                          | 42h | 1                                        | 31h |
| C                          | 43h | 2                                        | 32h |
| ....                       |     | ...                                      |     |
| a                          | 61h |                                          | 39h |
| b                          | 62h | <b>Coduri de formatare</b>               |     |
| c                          | 63h | spațiu                                   | 20h |
| ....                       |     | CR- retur                                | 0Dh |
| <b>Semne de punctuație</b> |     | LF – linie nouă                          | 0Ah |
| .                          | 2Eh |                                          |     |
| ,                          | 2Ch | <b>Coduri de control al transferului</b> |     |
| <b>Operații aritmetice</b> |     | XON- pornire transmisie                  | 11h |
| +                          | 2Bh | XOFF- oprire transmisie                  | 13h |
| -                          | 2Dh |                                          |     |

**Tabelul 2.5.** Reprezentarea unui număr restrâns de caractere din codul ASCII

Standardul "unicode" extinde codificarea ASCII prin adăugarea unui octet suplimentar. Astfel anumite litere speciale (litere grecești, litere arabe, litere cu semne speciale, etc.) sau semne grafice sunt reprezentate pe 16 biți.

### 2.1.5. REPREZENTAREA INFORMAȚIILOR MULTIMEDIA

Se spune că o imagine valorează cât 1000 de cuvinte. Adevărul este că pentru reprezentarea unor informații multimedia spațiul necesar pentru memorare este semnificativ mai mare decât pentru alte tipuri de informație. De exemplu pentru memorarea unei imagini spațiul de memorie variază (funcție de rezoluție) între câteva sute de kocteți și câțiva megaokteți (vezi tabelul 2.6).

| Tip de informație | Detalii                                        | Cantitatea de informație |
|-------------------|------------------------------------------------|--------------------------|
| logică            | 1 semnal bipozititional                        | 1 bit                    |
| numerică          | 1 întreg                                       | 16-32 biți               |
| text              | 1 pagină                                       | ~1 KOctet                |
| audio             | 10 sec., Fmax=20KHz                            | 400 KOcteți              |
| video             | 10 sec.<br>Fcadre=50Hz÷100Hz<br>Rez.=1000*1000 | 1,5 GOcteți              |

Tabelul 2.6. Cantitatea de informație (spațiu necesar pentru stocare)

**Informațiile multimedia** (imagini și/sau sunete) sunt reprezentate prin eșantioane ale semnalului de intrare. Frecvența de eșantionare trebuie să fie în strictă corelație cu frecvența maximă a semnalului de intrare. Conform teoremei lui Shannon *frecvența de eșantionare trebuie să fie de cel puțin două ori mai mare decât maximul frecvenței semnalului de intrare* [Nic04]. În caz contrar reprezentarea nu este fidelă cu realitatea; apar frecvențe inexistente în semnalul inițial (fenomenul de "aliasing"). În general, se utilizează o frecvență a semnalului de eșantionare cam de 10 ori frecvența semnalului de intrare, minim de 5 ori din motive de cost (pentru costuri reduse) și se poate ajunge chiar și la 100 ori.

Semnalul audio este eșantionat în timp cu o frecvență cuprinsă între 8kHz și 50kHz [Seb, Gor05], funcție de calitatea reprezentării. Frecvența de 8kHz este acceptabilă pentru con vorbiri telefonice (unde lățimea de bandă este limitată la 4 kHz), iar frecvențe de 40-50kHz sunt necesare pentru semnale audio de înaltă fidelitate (urechea umană detectează semnale de maxim 16-20kHz). Pentru un eșantion se alocă de obicei 8 biți asigurându-se astfel o plajă de valori pentru variația de amplitudine de 256 de valori,

suficientă pentru majoritatea aplicațiilor uzuale. În aceste condiții pentru memorarea unui semnal sonor de 10 secunde este nevoie de 80-500Kocteți. Pentru reducerea spațiului de memorare se folosesc diferite tehnici de compresie, prin care acest spațiu se poate reduce până la aproximativ o zecime din valoarea inițială. Majoritatea schemelor de compresie sunt cu pierdere de informație, adică nu garantează refacerea fidelă a semnalului sonor în urma decompactării. Dar pentru acest tip de informație acest fapt nu este un impediment, mai mult chiar, algoritmii de compactare au și un efect de filtrare a semnalului audio.

În cazul informațiilor video se utilizează tot un proces de eșantionare în timp a semnalului video de intrare. În acest mod **informația video este împărțită pe puncte (pixeli), linii și cadre**. O imagine are o anumită rezoluție dimensională și cromatică. Rezoluția dimensională se definește pe două direcții:

- orizontală – număr de pixeli pe o linie și
- verticală – număr de linii pe un cadru

Rezoluția cromatică este determinată de numărul de biți alocati pentru reprezentarea unui pixel. La imaginile alb/negru numărul de biți alocati variază de la 1bit/pixel la 8 biți/pixel (imagini cu nuanțe de gri). O rezoluție mai mare nu este necesară deoarece ochiul uman nu percepă mai multe nuanțe de gri. Pentru imaginile color se alocă separat biți pentru cele 3 culori de bază (roșu, verde și albastru) sau pentru tripletul culoare / luminanță / intensitate.

Pentru imagini în mișcare (film) se achiziționează cadre (imagini statice) cu o frecvență de eșantionare cuprinsă între 10Hz (film de slabă calitate, transmisibilă pe o legătură Internet de mică viteză) și 50-70Hz (film de calitate TV sau chiar mai bună) [Seb, Gor05].

În aceste condiții memorarea unei informații video de 10 secunde la o rezoluție și calitate acceptabilă necesită un spațiu de memorie de:  $(3 \text{ octeți/pixel}) * (1000 \text{ pixeli/linie}) * (700 \text{ linii/cadru}) * (50 \text{ cadre/sec.}) * 10 \text{ secunde} = 1.050.000.000 \text{ octeți} = 1\text{Goctet}$ . Este de remarcat faptul că **calculatoare personale actualele nu dispun de o memorie internă care să memoreze o astfel de informație** (un film de 100 de minute necesită  $\approx 600$  Gocteți). De aceea și în cazul informațiilor video se impune utilizarea unor metode eficiente de compactare, care să reducă spațiul necesar de memorare. Majoritatea metodelor de compactare sunt cu pierdere de informație; pentru un factor de compactare mai mare se face un compromis în ceea ce privește calitatea imaginii.

## 2.2. CODIFICAREA INFORMAȚIEI

Se numește **cod**, un set de *simboluri elementare* împreună cu o serie de reguli potrivit cărora se formează aceste simboluri [Măr96]. **Codificarea** reprezintă procesul de stabilire a unui cod. Dacă se notează prin  $X = \{x_1, x_2, \dots, x_n\}$  mulțimea datelor în forma accesibilă utilizatorului, iar cu  $Y = \{y_1, y_2, \dots, y_m\}$  mulțimea simbolurilor interpretate de sistemul de calcul, atunci codificarea reprezintă asocierea fiecărui element  $x_i \in X$  unei secvențe de simboluri  $y \in Y$ ; în acest caz, codul este o funcție bijectivă  $f : X \rightarrow Y$ . Funcția inversă  $f^{-1} : Y \rightarrow X$  reprezintă procesul de decodificare a secvențelor de simboluri utilizate de sistemul de calcul într-o formă înțeleasă de utilizator.

Obiectivele unui sistem de codificare sunt:

1. reprezentarea informațiilor într-o formă cât mai simplă
2. facilitarea implementării operațiilor aritmetice și logice
3. detecția și corecția erorilor (paritate, CRC, suma de control)
4. utilizarea unui spațiu minim de memorare (*compactarea informației*)
5. protecția împotriva accesului neautorizat (*securitate*)

### 2.2.1. CODURI ZECIMALE

Pentru anumite aplicații este important ca datele numerice să se păstreze în formă zecimală. În acest fel pot fi evitate conversiile repetitive din zecimal în binar și invers. O posibilitate este utilizarea a 4 biți pentru a reprezenta cele 10 cifre zecimale (0, 1, ... 9). Reprezentarea poartă numele de codul BCD – Binary Coded Decimal. Acest cod este asemănător cu reprezentarea hexazecimală cu diferența că se utilizează numai primele 10 combinații de biți:

$0_{10} \rightarrow 0000_2$ ,  $1_{10} \rightarrow 0001_2$ ,  $2_{10} \rightarrow 0010_2$ , .....  $9_{10} \rightarrow 1001_2$  ; celelalte combinații sunt nepermise (ex. 1010, ... 1111)

Procesoarele Intel au instrucțiuni în limbaj de asamblare care suportă operații aritmetice în reprezentarea BCD. Codurile cifrelor zecimale se păstrează fie individual pe câte un octet (forma despachetată), fie câte 2 cifre pe un octet (forma împachetată).

## 2.2.2. CODURI PENTRU DETECTAREA ȘI CORECTAREA ERORILOR

Există mai multe modalități de **detectare a erorilor** în cadrul transmisiei, bazate în general pe atașarea unor cifre binare de control la emisia mesajului prezentat sub formă binară; recepția va controla modul de respectare a corectitudinii mesajului. Cele mai utilizate procedee sunt [Mar96]:

- **Codurile de control a parității:** la emisia unei succesiuni de cifre binare  $a_1, a_2, \dots, a_n$  se atașează o cifră binară de control  $a_{n+1}$  aleasă astfel încât numărul total de cifre binare de 1 să fie *par* sau *impar*, în funcție de convenția de paritate stabilită. Are o eficiență scăzută întrucât detectează numai erorile care au un număr impar de biți modificați ( $1, 3, \dots$ ).
- Detectia bazată pe **distanță Hamming** ( $d$  – numărul minim de biți prin care diferă două coduri valide).
- **Codurile polinomial ciclice (CRC)** – este metoda cea mai folosită pentru detectarea erorilor grupate. Înaintea transmiterii, informației i se adaugă biți de control, iar pe baza acestora, la dacă la recepționarea mesajului se detectează erori, atunci acesta trebuie retransmis. O informație pe  $n$  biți poate fi considerată ca lista coeficienților binari ai unui polinom cu  $n$  termeni, deci de grad  $n-1$ .

*Exemplu:*  $110001 \rightarrow x^5 + x^4 + 1$

Pentru a calcula biții de control se va efectua un anumit număr de operații cu aceste polinoame cu coeficienți binari. Operațiile se vor efectua *modulo 2*, adunarea și scăderea nu va ține seama de cifra de transport, deci toate operațiile de adunare și scădere sunt identice cu operația XOR. Pentru generarea și verificarea bițiilor de control atât sursa cât și destinația mesajului utilizează un polinom generator.

Există și coduri care după detectarea erorilor oferă posibilitatea **corectării** unei singure cifre binare detectată incorectă. Dintre cele mai frecvent utilizate se pot menționa:

- **Codurile de paritate încrucișată.** În acest caz succesiunea de cifre binare este divizată în secvențe binare de aceeași lungime. La emisie, fiecarei linii și coloane li se atașează o cifră de control conform parității stabilite. La recepție, prin controlul parității pe fiecare linie și coloană, se detectează eventualele erori având posibilitatea de a corecta o eroare apărută la intersecția liniei și coloanei detectate ca nerespectând paritatea.

- **Codul Hamming 4+3** (atașează la emisie pentru fiecare 4 biți de date și 3 biți de control) asigură detecția poziției bitului eronat și implicit permite corectarea acestuia (prin complementarea poziției eronate). Structura codului Hamming este:

|                      |                      |                      |                      |                      |                      |                      |
|----------------------|----------------------|----------------------|----------------------|----------------------|----------------------|----------------------|
| <b>c<sub>1</sub></b> | <b>c<sub>2</sub></b> | <b>a<sub>3</sub></b> | <b>c<sub>4</sub></b> | <b>a<sub>5</sub></b> | <b>a<sub>6</sub></b> | <b>a<sub>7</sub></b> |
|----------------------|----------------------|----------------------|----------------------|----------------------|----------------------|----------------------|

unde,

**a<sub>3</sub>, a<sub>5</sub> ÷ a<sub>7</sub>** este mesajul (datele) de transmis

**c<sub>1</sub>, c<sub>2</sub>, c<sub>4</sub>** reprezintă cifrele de control, care se determină astfel:

$$c_1 = a_3 + a_5 + a_7$$

$$c_2 = a_3 + a_6 + a_7$$

$$c_4 = a_5 + a_6 + a_7$$

Se observă că transmisia prin codul Hamming mărește secvența binară ce se transmite cu 75%, dar oferă un control mult mai riguros. La receptia secvențelor binare, la fiecare grup de 7 cifre se procedează astfel:

- Se calculează sumele:

$$S_0 = c_1 + a_3 + a_5 + a_7 = 2 \times c_1$$

$$S_1 = c_2 + a_3 + a_6 + a_7 = 2 \times c_2$$

$$S_2 = c_4 + a_5 + a_6 + a_7 = 2 \times c_4$$

- Se ponderează fiecare sumă cu 2<sup>0</sup>, 2<sup>1</sup>, 2<sup>2</sup>:

$$n_0 = 2^0 \times S_0$$

$$n_1 = 2^1 \times S_1$$

$$n_2 = 2^2 \times S_2$$

- Se calculează n<sub>0</sub> + n<sub>1</sub> + n<sub>2</sub>; dacă această sumă este 0 atunci mesajul recepționat este corect, în caz contrar aceasta reprezintă poziția care este eronată.

## 2.3. OPERAȚII LOGICE PE BIȚI. FUNCȚII LOGICE.

### 2.3.1. FUNCȚIA ȘI LOGIC (AND)

| A | B | AND |
|---|---|-----|
| 0 | 0 | 0   |
| 0 | 1 | 0   |
| 1 | 0 | 0   |
| 1 | 1 | 1   |

### 2.3.2. FUNCȚIA SAU LOGIC (*OR*)

| A | B | OR |
|---|---|----|
| 0 | 0 | 0  |
| 0 | 1 | 1  |
| 1 | 0 | 1  |
| 1 | 1 | 1  |

### 2.3.3. FUNCȚIA NOT LOGIC

| A | NOT |
|---|-----|
| 0 | 1   |
| 1 | 0   |

### 2.3.4. FUNCȚIA SAU EXCLUSIV (*XOR*)

| A | B | XOR |
|---|---|-----|
| 0 | 0 | 0   |
| 0 | 1 | 1   |
| 1 | 0 | 1   |
| 1 | 1 | 0   |

### Regulile lui De Morgan

1. NOT (A AND B) = (NOT A) OR (NOT B)
2. NOT (A OR B) = (NOT A) AND (NOT B)

Figura 2.1 încearcă să dea o interpretare grafică (bazată pe mulțimi și pe operațiile dintre acestea – reuniune, intersecție, diferență) a primei reguli a lui De Morgan. Cercul mare reprezintă mulțimea tuturor cazurilor posibile.



Prin superpozitia celor doua figurii (a, b) rezulta  $A \cap B$  (suprafata nehasurata)



Din cele trei figuri (a, b și c) se observa ca  $\bar{A} \cap B = \bar{A} \cup \bar{B}$

Figura 2.1. Verificarea regulii lui De MORGAN  $\text{NOT}(A \text{ AND } B) = (\text{NOT } A) \text{ OR } (\text{NOT } B)$

## 2.4. EXERCITII ȘI PROBLEME

- Să se convertească următoarele numere din baza 10 în baza 2 și în baza 16:

0, 1, 1243, 256, 2048, 5655, 123.14, 33.125, 25675, 675.625

- Să se convertească următoarele din baza 2 în baza 10 și 16:

110100001100, 101.111011, 110011.11

Să se exprime în hexazecimal următoarele siruri de caractere:

ABCDEF, hello. Arătați cum vor fi stocate în memorie aceste siruri știind că procesorul Intel folosește convenția *little endian*.

**3.** Să se convertească următoarele numere din hexazecimal în binar:

AFE, ABC1, 12BD, E000,

**4.** Să se evalueze numărul de biți necesari pentru a reprezenta numere întregi în intervalele:

0-100, 0-1000, 300-400, -100 ÷ +100

**5.** Să se reprezinte următoarele numere în semn și mărime, complement față de 1 și complement față de 2, pe 8 biți:

0, 13, -100, -44, -1, -130

**6.** Să se precizeze domeniul maxim de valori ce se poate reprezenta pe un octet și pe 2 octeți dacă se consideră reprezentarea numerelor strict pozitive și respectiv a numerelor cu semn.

**7.** Să se reprezinte următoarele numere în virgulă flotantă simplă precizie:

1, 0.000023, 100000.000001, 13,4

Să se comenteze limitările reprezentării în virgulă flotantă: domeniul maxim de valori, valoarea minimă reprezentabilă în valoare absolută, pasul minim între două valori mari consecutive, etc.

**8.** Să se descrie în pseudocod câteva tehnici de compactare a informației (ex: codificarea secvențelor lungi de aceeași valoare, codificarea variațiilor între eșantioane consecutive, etc.)

**9.** Se vor vizualiza date din memoria și registrele calculatorului, folosind un program de depanare (SPIMSal, TD, LC2, etc.).

**10.** Se va evalua necesarul de spațiu de memorie pentru diferite tipuri de aplicații (aplicații care prelucrează informații numerice, grafică, alfanumerice sau multimedia).

**11.** Probleme de conversie dintr-o bază în alta: Scrieți un program care convertește numere întregi în și din binar, zecimal și hexazecimal. Programul poate fi scris fie în Java, C++ sau C și vor exista trei argumente în linia de comandă care apelează executabilul realizat.

- a) Un caracter care simbolizează din ce sistem de numerație se face conversia: - *h* pentru hexazecimal, *d* pentru zecimal sau *b* pentru binar.
- b) Un alt caracter care exprimă sistemul de numerație destinație: *h*, *d* sau *b*.
- c) Un sir de digiți (cifrele 0÷9 și eventual literele A÷F) reprezentând numărul supus conversiei

Programul va afișa pe ecran (ieșirea standard a sistemului) unul din următoarele mesaje:

- Dacă argumentele sunt date corect, se afișează un mesaj care conține: sistemul de numerație sursă, numărul inițial în acest sistem, sistemul de numerație destinație și numărul în sistemul de numerație final (De exemplu: 16 în decimal este 10000 în binar).
- Altfel, se afișează un mesaj de ajutor pentru utilizarea parametrilor de comandă ai programului (De exemplu: Folosiți `java hex [ h | d | b ] [ h | d | b ]`).

Considerând că programul este scris în *java* și numit *hex.java* se dau în continuare câteva secvențe de apel cu rezultatele obținute.

```
% java hex b d 1010  
1010 în binar este 10 în zecimal  
  
% java hex h d 123456  
123456 în hexazecimal este 1193046 în zecimal  
  
% java hex d h 12345678  
12345678 în zecimal este bc614e în hexazecimal  
  
% java hex a b 123  
Folosiți java hex [ h | d | b ] [ h | d | b ]  
  
% java hex h d bc614e  
bc614e în hexazecimal este 12345678 în zecimal
```

- 12.** Scrieți un algoritm eficient din punct de vedere al reprezentării în memorie pentru rezolvarea problemei  $2^n$  cu  $n$  foarte mare,  $n \geq 100$ . Determinați numărul de digiți pe care se reprezintă numărul rezultat. Ca și indicație, se poate folosi aproximarea grosieră  $2^{10} \approx 1000$ .

### **3. STRUCTURI LOGICE DIGITALE. TRANZISTORI. PORȚI LOGICE. STRUCTURI LOGICE COMBINATORIALE. UNITATEA ARITMETICO-LOGICĂ**

#### **3.1. TRANZISTORUL**

**Tranzistorul** este un dispozitiv electronic, semiconductor, inventat la laboratorul de telefonie Bell din New Jersey în decembrie 1947 de către cercetătorii în fizică John Bardeen, Walter Houser Brattain, și directorul celor doi, William Bradford Shockley [Wik]. Pentru invenția lor cei trei au fost recompensați în 1956 cu premiul Nobel. Descoperirea tranzistorului a determinat dezvoltarea electronicii, acesta fiind considerat una din cele mai mari descoperiri ale erei moderne. Tranzistorul poate fi folosit atât în domeniul analogic pentru a amplifica, stabiliza sau modula diverse semnale electrice cât și în cel digital pentru comutare.

Din punct de vedere al complexității microprocesoarelor se poate spune că numărul tranzistorilor integrați într-un cip se dublează la fiecare 18 luni. Afirmația aparține lui Gordon Moore și datează de la mijlocul anilor '60. După cum se poate observa din următorul tabel afirmația este pe deplin justificată de implementările comerciale [Katz05].

| Anul lansării pe piață | Denumire procesor | Număr de tranzistori încorporați / Tehnologia de integrare | Frecvența procesorului | Magistrala de date                |
|------------------------|-------------------|------------------------------------------------------------|------------------------|-----------------------------------|
| 1971                   | Intel 4004        | 2300 / 10µm                                                | 108KHz                 | 4-biți                            |
| 1972                   | Intel 8008        | 3500 / 10µm                                                | 200KHz                 | 8-biți                            |
| 1974                   | Intel 8080        | 6000 / 6µm                                                 | 2MHz                   | 8-biți                            |
| 1978                   | Intel 8086 / 8088 | 29000 / 3µm                                                | 4.77-10MHz             | 16-biți.<br>Implementat în primul |

|      |                                                 |                    |                | calculator personal IBM.                                           |
|------|-------------------------------------------------|--------------------|----------------|--------------------------------------------------------------------|
| 1982 | Intel 80286                                     | 134000 / 1.5µm     | 12.5-20MHz     | 16-biți                                                            |
| 1985 | Intel 80386DX                                   | 275,000 / 1µm      | 33MHz          | 32-biți                                                            |
| 1989 | Intel 80486DX                                   | 1200000 / 0.8µm    | 25-100MHz      | 32-biți. Primul procesor care încorporează o memorie de tip cache. |
| 1993 | Intel Pentium                                   | 3100000/ 0.5µm     | 60-133MHz      | 32-biți                                                            |
| 1995 | Intel Pentium Pro                               | 5500000 / 0.35µm   | 200MHz         | 32-biți                                                            |
| 1997 | Intel Pentium II                                | 7500000 / 0.35µm   | 233-333MHz     | 32-biți                                                            |
| 2000 | Intel Pentium III                               | 28000000 / 0.18µm  | 733MHz- 1.2GHz | 32-biți                                                            |
| 2001 | Intel Pentium 4 ver. Northwood                  | 42000000 / 0.18µm  | 1.6 GHz        | 32-biți (din 2000 apare versiunea Itanium pe 64 de biți)           |
| 2003 | Intel Pentium 4 ver. Northwood Hyperthread      | 55000000 / 0.13µm  | 2 – 3.4 GHz    | 32-biți                                                            |
| 2004 | Intel Pentium 4 ver. Extrem Edition Hyperthread | 178000000 / 0.09µm | 2,8 - 3,4GHz   | 32-bitii                                                           |

**Tabelul 3.1** Procesorul Intel – tendințe tehnologice

Referitor la tabelul 3.1 sunt câțiva parametri care vor fi înțeleși mai bine după parcurgerea acestui capitol.

- Dimensiunea tehnologiei de integrare reprezintă o caracteristică importantă în evaluarea și creșterea performanței arhitecturilor de calcul și implicit al memoriilor de tip cache. Exprimă dimensiunea unei porți logice (diferența în microni dintre ieșirea și intrarea unei porți logice fundamentale NAND). În unele documentații este interpretată ca fiind *distanța dintre două intrări aferente porții logice*.

Ca și corolar al tabelului 3.1 se poate afirma că și frecvența procesoarelor pare să se dubleze în același ritm cu toate că, creșterea în viteză se datorează tendințelor tehnologice doar într-o proporție de 35%, restul de 65% rezultând în urma îmbunătățirilor arhitecturale [Flo05].

Tranzistorii sunt construite din circuite (în tehnologie) **MOS (metal oxid semiconductor)** [Patt03]. Există două tipuri de tranzistori (vezi figura 3.1): de tip P (pozitiv) și de tip N (negativ). Au funcții complementare, astfel încât folosite împreună se pot realiza circuite **CMOS**. Tranzistorul are rol de întrerupător: **închide circuitul** (valoarea tensiunii din A este egală cu cea din B) sau **deschide circuitul** (valorile celor două tensiuni din A și B diferă – legătura fiind întreruptă).

Funcționarea celor două tipuri de tranzistori este descrisă în cadrul figurii 3.1.



Figura 3.1. Tranzistori de tip P și de tip N

## 3.2. PORTI LOGICE

### 3.2.1. INVERSORUL CMOS

- Dacă  $IN = 0$  (adică 0 V) atunci tranzistorul de tip P va conduce iar cel de tip N rămâne blocat. Rezultă că ieșirea  $OUT$  va avea 2.9 V (adică 1 Logic).
- Dacă  $IN = 1$  (adică 2.9 V) atunci tranzistorul de tip N va conduce iar cel de tip P rămâne blocat iar ieșirea  $OUT$  va avea 0 V (adică 0 Logic). Se poate astfel observa că  $OUT = \text{Not}(IN)$ ; ieșirea este inversă intrării.



Figura 3.2. Inversorul CMOS

### 3.2.2. POARTA NOR (*NOT OR*)

Poarta NOR este realizată din doi tranzistori de tip P legați în serie și doi tranzistori de tip N așezăți în paralel (vezi figura 3.3 – zona încadrată cu linie punctată). Astfel, pentru a avea la ieșire în punctul C 2.9V trebuie ca cei doi tranzistori de tip P să conducă (ambele circuite închise); deci  $A=0 \text{ și } B=0 \Rightarrow C=1$ .

Pentru a avea la ieșire în C 0V este suficient ca măcar unul din cei doi tranzistori de tip N să conducă (cel puțin un circuit închis); deci A=1 SAU B=1  $\Rightarrow$  C=0. Prin utilizarea unui inversor la ieșirea porții NOR, în punctul D, se obține rezultatul funcției OR aplicat celor două intrări A și B.



Figura 3.3. Porțile NOR și (OR)

### 3.2.3. POARTA NAND (*NOT AND*)

Poarta NAND este implementată din doi tranzistori de tip P așezățiîn paralel și doi tranzistori de tip N în serie (vezi figura 3.4 – zona încadrată cu linie punctată). Astfel, pentru ca la ieșirea C să fie 2.9V trebuie ca cel puțin unul din cei doi tranzistori de tip P să conducă (cel puțin un circuit închis); deci A=0 SAU B=0  $\Rightarrow$  C=1.

Pentru a avea la ieșire în C 0V trebuie ca ambii tranzistori de tip N să conducă (ambele circuite închise); deci A=1 și B=1  $\Rightarrow$  C=0. Prin folosirea inversorului la ieșirea porții NAND, în punctul D, se obține rezultatul funcției AND aplicat celor două intrări A și B.



Figura 3.4. Poartile NAND și (AND)

Întrucât pentru exprimarea funcțiilor logice de 2 operanzi (AND, OR) sunt necesari 6 tranzistori și ținând cont că la nivelul procesoarelor anilor 2004 [Katz05] erau implementați 178 milioane de astfel de circuite digitale primare, rezultă necesitatea unei convenții de reprezentare în vederea simplificării procesului de proiectare. Trebuie specificat că poartile logice (AND, OR, NAND, NOR) pot avea mai mult de două intrări.



Figura 3.5. Convenții de reprezentare a poartelor logice

Reprezentarea funcțiilor logice se poate face prin:

- Tabel de adevăr
- Expresie logică
- Circuite logice

Se spune despre setul de porți logice (AND, OR, NOT) că este **complet** întrucât cele trei porți logice sunt suficiente pentru reprezentarea oricărei funcții logice. Făcând legătura cu legile lui De Morgan:

$$A \text{ OR } B = \text{NOT} ((\text{NOT } A) \text{ AND } (\text{NOT } B))$$

$$A \text{ AND } B = \text{NOT} ((\text{NOT } A) \text{ OR } (\text{NOT } B))$$

se poate spune că sunt suficiente fie porți de tipul *NAND* fie porți de tipul *NOR*.

Funcțiile **ȘI-NU (NAND)** respectiv **SAU-NU (NOR)** sunt suficiente pentru reprezentarea oricărei funcții logice (se mai numește **completitudinea funcțiilor logice ȘI-NU și respectiv SAU-NU**) [Pat03].

### **3.3. STRUCTURI LOGICE DIGITALE**

Se cunosc două tipuri de structuri logice digitale:

1. **Structuri de decizie** – pot realiza o decizie dar nu rețin ce fel de decizie a fost (0 sau 1). Se mai numesc *structuri logice combinaționale* deoarece ieșirile acestora sunt strict dependente de combinația valorilor de intrare. Nu depind de istoria informației întrucât aceste structuri nu stochează nici un fel de informație. Se cunosc trei astfel de structuri:

- **Decodificatorul**
- **Multiplexorul**
- **Sumatorul**

2. **Structuri de memorare** – permit stocarea informației. Capacitatea acestora se măsoară în biți sau multiplii ai acestora.

#### **3.3.1. STRUCTURI LOGICE (CIRCUITE) COMBINAȚIONALE**

Circuitele logice combinaționale (CLC) fac parte din familia sistemelor automate cu număr finit de stări, fiind un caz particular, acela al

automatelor fără memorie. Lipsa memoriei implică independența circuitului de variabila timp și deci lipsa unor stări interne. Depinde exclusiv de variabilele aplicate la intrare.

#### Parametrii:

- .. **Adâncimea** unui circuit este dată de numărul de circuite aflate pe cea mai lungă ramură care compune circuitul. Ea corespunde „*timpului de execuție*” în cazul cel mai defavorabil.
- Dimensiunea** unui circuit reprezintă numărul de elemente combinaționale conținute în circuit.

O întrebare firească ce se poate pune este următoarea: “*Cine determină viteza sau frecvența maximă a unui sistem digital?*” Răspunsul la această întrebare este: *latența* (sau întârzierea) circuitului. Există câțiva factori care contribuie la această latență [Pop86]. Unul dintre aceștia este timpul de propagare printr-o poartă logică (vezi figura 3.6), un altul îl reprezintă factorul de încărcare al *bufferelor* (nivelului) de ieșire (lungimea anumitor fire de legătură care reprezintă aceeași intrare pentru mai multe porți logice) și chiar circuitul însuși caracterizat de adâncime și dimensiune. În realitate, când semnalul de la intrarea unei porți se schimbă (din 0 în 1 sau din 1 în 0) semnalul de ieșire nu se va schimba instantaneu (vezi figura 3.6).



Figura 3.6. Întârzierea semnalului printr-o poartă logică

Timpul de propagare printr-o poartă logică reprezintă diferența în timp dintre momentele în care este modificat semnalul pe intrarea porții logice și respectiv momentul în care este sesizată modificarea semnalului la ieșirea porții logice. Se disting două tipuri de întârzieri prin poarta logică  $T_{PHL}$  (timp de propagare din nivel logic High în nivel logic Low) și respectiv  $T_{PLH}$  (vezi figura anterioară). Valoarea timpului de întârziere variază în funcție de poarta logică folosită precum și în funcție de familia de circuite logice folosite. În general, cu cât prețul per cip este mai mare cu atât acesta va fi mai rapid. La nivelul anului 2004, timpul de întârziere printr-o poartă logică era cuprins în intervalul 1.5-4ns.

### 3.3.1.1. DECODIFICATORUL



**Figura 3.7.** Decodificatorul - reprezentare cu porți logice

În general au  $n$  intrări și  $2^n$  ieșiri. Decodificatorul furnizează la o singură ieșire 1 iar la restul 0. Ieșirea „ $i$ ” va avea valoarea logică 1 dacă *numărul reprezentat în binar pe intrare* este chiar 1. Funcția decodificatorului este de interpretare a unui *pattern* de biți. Utilitatea sa se regăsește în faza de *decodificare* a instrucțiunilor (vezi modelul *von Neumann*) când câmpul *opcode* – parte componentă a oricărei instrucțiuni – va specifica ce operație trebuie efectuată (adunare / scădere / înmulțire / împărțire / acces la memorie / ramificație a programului). Decodificatorul este utilizat și pentru identificarea regiștrilor sursă / destinație sau a modurilor de adresare în cazul instrucțiunilor cu referire la memorie tot pe baza *pattern-urilor* de biți din corpul instrucțiunilor. De asemenea, este folosit la selecția adreselor de memorie.

### 3.3.1.2. MULTIPLEXORUL

Are rolul de a selecta o intrare și de a o conecta la ieșire. Semnalul de selecție (codificarea binară a acestuia) determină care dintre intrări va fi conectată la ieșire.



**Figura 3.8.** Multiplexor 4:1 - reprezentare cu porți logice

În general, un MUX constă din  $2^n$  intrări,  $n$  linii de selecție și o singură ieșire. Multiplexorul este utilizat în proiectarea procesoarelor pipeline în cel puțin trei ipostaze:

- **La selecția adresei următoarei instrucțiuni** dintre  $PC+4$  (o procesare secvențială, instrucțiunea fiind codificată pe 4 octeți – cazul procesorului MIPS R3000 [Flo03]) și  $PO+adresa\_relativă$  (identificarea unei ramificații în program) în funcție de bitul rezultat (se face / nu se face).
- **La selecția operanzilor unei instrucțiuni:** pot fi instrucțiuni cu 2 registri sursă, pot fi instrucțiuni aritmetico-logice cu un registru sursă și o valoarea imediată, poate fi un calcul de adresă dintre un registru index și un deplasament (mod de adresare indexat), poate fi calculul adresei destinație în cazul unei ramificații de program (registru + valoare imediată). Pentru detalii vezi subcapitolul 6.2.
- **Scrierea rezultatului instrucțiunilor în setul de registri generali ai procesorului**, în faza *store results* de procesare (vezi modelul *von Neumann*) poate fi făcută prin instrucțiuni *aritmetico-logice* sau instrucțiuni de tip *load*. Selecția se va face tot intermediul unui multiplexor 2:1 comandat cu un bit din opcod-ul instrucțiunii.

### 3.3.1.3. SUMATORUL

Efectuează operații aritmetice (adunare sau scădere) cu două numere binare având un număr egal de biți. Orice sumator pe mai mulți biți este construit din sumatoare elementare pe un bit.

Sumatoarele elementare pe un bit pot fi:

- *semisumatoare* (sumator pentru bitul zero), acest sumator elementar se caracterizează prin faptul că nu ține seama de transportul de la bitul cu semnificație imediat inferioară (vezi figura 3.9).
- *sumatoare complete pe un bit* care țin seama de transportul de la bitul cu semnificație imediat inferioară.

Se cunosc trei circuite combinaționale de însumare. Primul este **sumatorul cu transport propagat**, care poate să adune două numere de câte  $n$  biți în timp  $\Theta(n)$  și utilizând un circuit de dimensiune  $\Theta(n)$  [Cor90]. Al doilea este **sumatorul cu transport anticipat**, de dimensiune  $\Theta(n)$  care adună în timp  $\Theta(\log_2 n)$ . Al treilea este un **circuit cu transport salvat**, care, în timp  $\Theta(1)$  (constant), poate reduce suma a trei numere de câte  $n$  biți la suma unui număr de  $n$  biți și a unuia de  $n+1$  biți. Circuitul are dimensiunea  $\Theta(n)$ .

### Semisumatorul (sumatorul pentru bitul zero) [Patt03, Clc04]

- intrările celor două numere pe un bit sunt reprezentate prin  $X_0$  și  $Y_0$ .
- ieșirile sunt:  $S_0$  - (suma celor două numere) și - (*Carry* - **transportul către bitul 1**).

Funcționarea semisumatorului

| $X_0$ | $Y_0$ | $C_1$ | $S_0$ |
|-------|-------|-------|-------|
| 0     | 0     | 0     | 0     |
| 0     | 1     | 0     | 1     |
| 1     | 0     | 0     | 1     |
| 1     | 1     | 1     | 0     |



Figura 3.9. Semisumator pe un bit

### Sumatorul complet pe un bit

Sumatorul complet pe un bit ține cont de transportul de la bitul de semnificație imediat inferioară. Are intrările:  $X_n$ ,  $Y_n$ ,  $C_n$  și ieșirile:  $S_n$ ,  $C_{n+1}$ . Funcționarea sa se bazează pe tabelul de mai jos. Din tabel se deduc relațiile (3.1) și (3.2) care descriu dependența ieșirilor de intrări:

$$S_n = \overline{X_n} \cdot \overline{Y_n} \cdot C_n + \overline{X_n} \cdot Y_n \cdot \overline{C_n} + X_n \cdot \overline{Y_n} \cdot \overline{C_n} + X_n \cdot Y_n \cdot C_n = C_n \cdot (\overline{X_n} \cdot \overline{Y_n} + X_n \cdot Y_n) + \overline{C_n} \cdot (\overline{X_n} \cdot Y_n + X_n \cdot \overline{Y_n}) = \\ = C_n \cdot \overline{X_n} \oplus Y_n + \overline{C_n} \cdot X_n \oplus Y_n = C_n \oplus X_n \oplus Y_n \quad (3.1)$$

$$C_{n+1} = \overline{X_n} \cdot Y_n \cdot C_n + X_n \cdot \overline{Y_n} \cdot C_n + X_n \cdot Y_n \cdot \overline{C_n} + X_n \cdot Y_n \cdot C_n = X_n \cdot Y_n \cdot (C_n + \overline{C_n}) + C_n \cdot (\overline{X_n} \cdot Y_n + X_n \cdot \overline{Y_n}) = \\ = X_n \cdot Y_n + C_n \cdot X_n \oplus Y_n \quad (3.2)$$

Funcționarea sumatorului complet

| $X_n$ | $Y_n$ | $C_n$ | $C_{n+1}$ | $S_n$ |
|-------|-------|-------|-----------|-------|
| 0     | 0     | 0     | 0         | 0     |
| 0     | 0     | 1     | 0         | 1     |
| 0     | 1     | 0     | 0         | 1     |
| 0     | 1     | 1     | 1         | 0     |
| 1     | 0     | 0     | 0         | 1     |
| 1     | 0     | 1     | 1         | 0     |
| 1     | 1     | 0     | 1         | 0     |
| 1     | 1     | 1     | 1         | 1     |



Figura 3.10. Sumator complet pe un bit – varianta (1)

Din relația (3.2) se deduce următoarea schema din figura 3.11, mai rapidă (scade numărul de nivele cu 1 – o poartă):



Figura 3.11. Sumator complet pe un bit – varianta (2)

$$C_{n+1} = \overline{X_n} \cdot Y_n \cdot C_n + X_n \cdot \overline{Y_n} \cdot C_n + X_n \cdot Y_n \cdot \overline{C_n} + X_n \cdot Y_n \cdot C_n = \overline{X_n} \cdot Y_n \cdot C_n + X_n \cdot \overline{Y_n} \cdot C_n + X_n \cdot Y_n \cdot \overline{C_n} + X_n \cdot Y_n \cdot C_n + \\ + X_n \cdot Y_n \cdot C_n + X_n \cdot Y_n \cdot C_n = Y_n \cdot C_n \cdot (X_n + \overline{X_n}) + X_n \cdot C_n \cdot (Y_n + \overline{Y_n}) + X_n \cdot Y_n \cdot (C_n + \overline{C_n}) = Y_n \cdot C_n + X_n \cdot C_n + X_n \cdot Y_n \quad (3.3)$$

Pentru deducerea relației (3.3) am folosit faptul că  $X + X = X$ , pentru  $\forall X \in \{0, 1\}$ .

### Sumator cu transport succesiv (propagat) 74LS83 (4 biți) [Clc04]

Schema acestui sumator pe patru biți cuprinde patru sumatoare complete pe un bit interconectate ca în figura 3.12:



**Figura 3.12.** Sumator cu transport succesiv pe 4 biți (circuitul 74LS83)

$C_0$  se pune la masă dacă circuitul este folosit pentru însumarea a două numere cu 4 biți, deoarece nu există transport de la un bit cu semnificație mai mică. Când se extinde numărul de biți folosind două sau mai multe circuite conectate se face concordanță cu schema din figura 3.13:



**Figura 3.13.** Extinderea capacitatea de adunare

Considerând  $t$  întârzierea pe o poartă logică elementară (sau pe un nivel logic), observând schema din figura 3.11, rezultă că  $C_1$  se obține cu o

întârziere de  $2 \cdot t$ . Întârzierea cu  $C_{n+1}$  (transportul obținut la ieșirea ultimului sumator – de rang  $n$ ) este  $2 \cdot t \cdot (n+1)$ , ceea ce este inacceptabil pentru sumatoare cu număr mare de ranguri. Timpii de calcul pentru biții de sumă ( $S_0 \div S_n$ ) sunt:

$$t_{S1} = 2 \cdot t$$

$$t_{S2} = t + t_{C1} = t + 2 \cdot t = 3 \cdot t$$

...

$$t_{Sr} = t + t_{Cn-1} = t + 2 \cdot (n-1) \cdot t = (2 \cdot n - 1) \cdot t$$

Îmbunătățirile au dublu scop:

- simplificarea structurii sumatorului
- reducerea timpului de însumare.

### Sumator cu întârziere minimă

Sumatorul cu transport succesiv are o structură simplă dar prezintă marele dezavantaj că orice operație de însumare necesită un timp foarte mare pentru execuție datorită propagării transportului. Imediat ce progresele tehnologice au permis (apariția circuitelor integrate pe scară medie, largă și foarte largă – MSI, LSI, VLSI) s-a renunțat la această structură integrându-se în circuite specializate, scheme mult mai performante. Sumatorul cu întârziere minimă are la bază ideea că orice funcție de comutație (logică) se poate realiza sub o formă disjunctivă (disjuncție de conjuncții). Relația (3.3), particularizată pentru diverse ranguri de sumare, devine:

$$C_1 = X_0 \cdot Y_0 + C_0 \cdot (X_0 + Y_0)$$

$$C_2 = X_1 \cdot Y_1 + C_1 \cdot (X_1 + Y_1) = X_1 \cdot Y_1 + (X_1 + Y_1) \cdot (X_0 \cdot Y_0 + C_0 \cdot (X_0 + Y_0))$$

...

$$C_{n+1} = f(X_{0..n}, Y_{0..n}, C_0) \quad (3.4)$$

Pe baza relației (3.4) se poate implementa sumatorul cu întârziere minimă. La acest sumator  $C_{n+1}$  se determină cu o întârziere de  $2 \cdot t$  deoarece depinde doar de  $X_{0..n}, Y_{0..n}$  și  $C_0$ . Dezavantajul constă în numărul mare de porți necesare pentru implementare. Compromisul constă aici în implementarea unor scheme mixte care conțin sumatoare cu întârziere minimă pe grupe de biți și cu transport propagat între aceste grupe.

### **Sumator cu transport anticipat**

Întrucât sumatorul cu transport succesiv este lent, iar sumatorul cu întârziere minimă este imposibil de realizat, se caută o soluție intermediară. Aceasta grupează relațiile obținute la sumatorul cu întârziere minimă, astfel încât să se obțină dimensiuni rezonabile. Ideea de bază este aceea de a caracteriza comportarea unui rang al sumatorului din punctul de vedere al generării / propagării unui transport [Pop86].

La acest tip de sumator se va micșora timpul de execuție al sumării dar va crește și dimensiunea circuitului. Pentru implementare se va pleca de la ecuațiile ce descriu sumatorul complet (3.1) și (3.3).

$$S_n = C_n \oplus X_n \oplus Y_n \quad (3.1)$$

$$C_{n+1} = Y_n \cdot C_n + X_n \cdot C_n + X_n \cdot Y_n = X_n \cdot Y_n + C_n \cdot (X_n + Y_n) \quad (3.3)$$

Se consideră notația:

$$C_{n+1} = G + P \cdot C_n$$

unde:

$G = X_n \cdot Y_n$  este termen de generare deoarece pentru  $X_n = Y_n = 1$  transportul se generează la nivelul sumatorului complet;

$P = X_n + Y_n$  reprezintă termenul de propagare deoarece o valoare de 1 aplicată numai pe una din intrările sumatorului va permite ca ieșirea  $C_{n+1}$  să ia valoarea intrării  $C_n$ , care astfel se propagă numai prin acest nivel binar.

Cu aceste notații, se va scrie expresia logică a transportului asociat fiecărui ordin binar al unui sumator după cum urmează:

$$C_1 = X_0 \cdot Y_0 + C_0 \cdot (X_0 + Y_0) = G_0 + P_0 \cdot C_0$$

$$C_2 = G_1 + P_1 \cdot C_1 = G_1 + P_1 \cdot G_0 + P_1 \cdot P_0 \cdot C_0$$

$$C_3 = G_2 + P_2 \cdot C_2 = G_2 + P_2 \cdot G_1 + P_2 \cdot P_1 \cdot G_0 + P_2 \cdot P_1 \cdot P_0 \cdot C_0$$

...

$$C_i = G_{i-1} + P_{i-1} \cdot G_{i-2} + P_{i-1} \cdot P_{i-2} \cdot G_{i-3} + \dots + P_{i-1} \dots P_1 \cdot G_0 + P_{i-1} \dots P_0 \cdot C_0 \quad (3.5)$$

...

Propagarea transportului s-a transformat într-un calcul anticipat, în sensul că  $C_i$  se poate calcula în paralel pentru  $i=1, 2, \dots, n$  fără a se mai aștepta calculul mărimilor pentru indicii anterioare  $i-1, \dots, 1$ .

### 3.3.2. PROIECTAREA UNEI UNITĂȚI DE CALCUL ARITMETICO-LOGIC

Unitatea aritmetico-logică (ALU) reprezintă componenta microprocesorului care tratează (execută) toate operațiile aritmetice și logice. ALU este un circuit logic combinațional care efectuează operații aritmetice și logice asupra unei perechi de operanzi pe  $n$  biți.

Ca și exercițiu se va prezenta în continuare modul de funcționare a unei unități ALU simplificate pe 4 biți ( $A[3:0]$  și  $B[3:0]$  – vezi schema bloc din figura următoare).



**Figura 3.14.** Schema bloc a unei unități aritmetico-logice pe 4 biți

Operațiile ALU sunt controlate prin intermediul intrărilor de *selecție-funcție* ( $M$ ,  $S_1$  și  $S_0$ ). Intrarea de selecție  $M$  va determina modul de operare – aritmetic ( $M=1$ ) sau logic ( $M=0$ ) iar  $S_1$  și  $S_0$  va stabili operația propriu-zisă (adunare / scădere / OR / AND ...). În general o unitate aritmetico-logică trebuie să realizeze următoarele operații (vezi tabelul 3.2).

| <b>M = 0 Logic</b> |    |    |                     |                   |  |
|--------------------|----|----|---------------------|-------------------|--|
| S1                 | S0 | C0 | Funcția             | Operația (pe bit) |  |
| 0                  | 0  | X  | $A_i B_i$           | AND               |  |
| 0                  | 1  | X  | $A_i + B_i$         | OR                |  |
| 1                  | 0  | X  | $A_i \oplus B_i$    | XOR               |  |
| 1                  | 1  | X  | $(A_i \oplus B_i)'$ | XNOR              |  |

| <b>M = 1 Aritmetic</b> |    |    |           |                                       |
|------------------------|----|----|-----------|---------------------------------------|
| S1                     | S0 | C0 | Funcția   | Operația                              |
| 0                      | 0  | 0  | A         | Transfer A                            |
| 0                      | 0  | 1  | A + 1     | Incrementează A cu 1                  |
| 0                      | 1  | 0  | A + B     | Adună A cu B                          |
| 0                      | 1  | 1  | A + B + 1 | Incrementează suma dintre A și B cu 1 |
| 1                      | 0  | 0  | A + B'    | A + complementul față de 1 al lui B   |
| 1                      | 0  | 1  | A - B     | Scade B din A (i.e. B' + A + 1)       |
| 1                      | 1  | 0  | A' + B    | B + complementul față de 1 al lui A   |
| 1                      | 1  | 1  | B - A     | Scade A din B (sau A' + B + 1)        |

Tabelul 3.2. Operațiile executate de ALU

Primul pas în proiectarea unei unități ALU pe 4 biți îl reprezintă proiectarea unui ALU pe un bit (pentru simplitate va fi notat ALU-1). O primă metodă constă în realizarea tabelei de adevăr pentru ALU-1. Întrucât există 6 intrări ( $M$ ,  $S_1$ ,  $S_0$ ,  $C_0$ ,  $A_i$  și  $B_i$ ) și două ieșiri ( $F_i$  și  $C_{i+1}$ ) aplicarea metodei (*cu creionul pe hârtie*) este dificilă din punct de vedere al timpului consumat. O soluție alternativă constă în separarea în două module (unitate aritmetică) și (unitate logică) și proiectarea individuală a fiecărui modul. Schema bloc a ALU-1 conține pe lângă cele două module și un multiplexor 2:1 (vezi figura 3.15).



Figura 3.15. Schema bloc a unității aritmetico-logice pe 1 bit (ALU-1)

Unitatea logică poate fi realizată folosind un decodificator 2:4 și porți logice AND, OR, XOR și NOT (vezi figura 3.16).



**Figura 3.16.** Unitatea logică pe 1 bit

Proiectarea unității aritmetice din figura 3.15 se bazează în principiu pe sumatorul complet pe 1 bit (vezi figura 3.10). Unitatea aritmetică trebuie să realizeze în principiu un sir de operații simple: adunare între doi operanzi, incrementarea unui operand, adunarea a doi operanzi și a unui 1, adunarea la un număr complementul față de 1 a altuia, diferența dintre două numere (vezi tabelul 3.2). Schema bloc a unității de adunare din cadrul ALU-1 este prezentată în figura 3.17. Practic trebuie implementată doar logica de selecție (blocurile A – logic și B – logic).



**Figura 3.17.** Unitatea aritmetică pe 1 bit

În tabelul 3.2 intrarea  $C_0$  ( $C_i$  – în figura 3.17) este doar în aparență de selecție. În realitate, în funcție de valoarea lui se va adăuga sau nu 1. Fiecare semnal  $C_{i+1}$  va avea rol de transport de intrare pentru  $A_{i+1}$  și  $B_{i+1}$  (rangul următor în procesul de adunare).



**Figura 3.18.** Logica de selecție din cadrul unității aritmetice

### Operația de deplasare (shift)

Reprezintă operația de translatăre cu una sau mai multe poziții binare la stânga sau dreapta. De exemplu, numărul fără semn, reprezentat pe 8 biți, 10010111, prin deplasare la dreapta devine 01001011 (se taie un bit din dreapta și se adaugă un zero pe prima poziție). Dacă se ține cont de formula

generală de reprezentare a unui număr întreg oarecare pe  $n+1$  digiti în baza  $b$ ,  $N_b = x_n \cdot b^n + \dots + x_2 \cdot b^2 + x_1 \cdot b^1 + x_0$ , cu  $x_n \neq 0$  a cărui valoare numerică este:

$N_b = x_n \cdot b^n + \dots + x_2 \cdot b^2 + x_1 \cdot b^1 + x_0$  atunci este foarte simplu de observat că o deplasare cu o poziție la stânga sau dreapta este echivalentă cu o înmulțire respectiv o împărțire cu baza (în cazul acesta  $b=2$ ). Astfel, valoarea binară 10010111 reprezintă în zecimal numărul 151 iar 01001011 este 75 (partea întreagă a împărțirii 151 / 2).



**Figura 3.19.** Circuit de deplasare (la stânga și dreapta)

În figura 3.19 este prezentat un circuit de deplasare pe 4 biți. Semnalul  $C$  va activa la un moment dat fie deplasarea la dreapta ( $C=1$ ) fie la stânga ( $C=0$ ). Dacă deplasarea este la stânga ieșirea circuitului ignoră bitul cel mai din stânga ( $D_0$ ) și introduce un zero în coada nouului număr ( $S_3$ ). Dacă deplasarea este la dreapta ieșirea circuitului ignoră bitul cel mai din dreapta ( $D_3$ ) și introduce un zero pe prima poziție a nouului număr ( $S_0$ ). Portile logice SAU deși primesc două semnale de intrare ( $D_0$  sau  $D_2$ , respectiv  $D_1$  sau  $D_3$ ) permit ca la un moment dat doar unul din cele să furnizeze valoarea în  $S_1$  respectiv  $S_2$ . Acest lucru se întâmplă deoarece semnalul  $C$  comandă intrarea  $D_0$  iar **Not**  $C$  comandă intrarea  $D_2$ .

În acest moment, bazându-ne pe circuitele logice combinaționale anterior prezentate se poate trece la implementarea operațiilor aritmetice de înmulțire respectiv împărțire (mai complexe decât cele de adunare și scădere).

### **3.4. EXERCIȚII ȘI PROBLEME**

1. Probleme de utilizare a numerelor dintr-o anumita bază (2, 8, 10, 16) pentru – adunarea / scăderea / înmulțirea / împărțirea / număr de biți de 1 / maximul dintre 3 numere – acestora. Se vor folosi funcțiile (clasele) utilizate în rezolvarea seminarului aferent capitolului 2.
2. Referitor la următoarea diagramă logică ce semnifică valoarea 1 la ieșirea  $X$ ? Un răspuns corect nu necesită mai mult de 10 cuvinte.



3. Pornind de la cunoștințele de proiectare a unui sumator complet, se dorește implementarea unui multiplicator (circuit de înmulțire) cu două intrări (fiecare intrare pe 2 biți). Intrările sunt notate  $A[1:0]$  și  $B[1:0]$  iar  $Y$  fiind rezultatul produs în urma înmulțirii valorilor codificate de  $A$  și  $B$ . Notația standard pentru aceasta este:  $Y = A[1:0] \times B[1:0]$ . Se cere:

- a. Care este valoarea maximă care poate fi reprezentată pe 2 biți pentru intrarea A ( $A[1:0]$ ) ?
- b. Care este valoarea maximă care poate fi reprezentată pe 2 biți pentru intrarea B ( $B[1:0]$ ) ?
- c. Care este valoarea maximă care poate fi luată de ieșirea Y ?
- d. Care este numărul minim de biți necesar pentru a putea reprezenta valoarea maximă a ieșirii Y ?
- e. Realizați tabela de adevăr pentru circuitul de înmulțire descris mai sus. Vor fi patru intrări binare (2 biți pentru intrarea A –  $A[1], A[0]$ , și alți 2 pentru B –  $B[1]$  și  $B[0]$ ).
- f. Implementați folosind porți logice AND, OR și NOT cel de-al treilea bit al ieșirii Y ( $Y[2]$ ) rezultat din tabela de adevăr de la punctul anterior.
4. Se știe că poarta logică NAND (ȘI NU) este completă (orice funcție logică poate fi implementată folosind doar porți NAND). Folosind doar porți logice NAND construiți circuite logice combinaționale care să implementeze următoarele funcții. De un real folos ar fi utilizarea regulilor lui DeMorgan.
- (a) NOT  
 (b) AND  
 (c) OR  
 (d) NOR
5. Un comparator pe un bit este un circuit (vezi figura de mai jos) având două intrări ( fiecare pe 1 bit) A și B și trei ieșiri G (mai mare strict), E (Egal) și L (mai mic strict).



G este 1 dacă  $A > B$   
 0 altfel

E este 1 dacă  $A = B$   
 0 altfel

L este 1 dacă  $A < B$   
 0 altfel

- a) Desenați tabela de adevăr pentru comparatorul pe un bit:

| A | B | G | E | L |
|---|---|---|---|---|
| 0 | 0 |   |   |   |
| 0 | 1 |   |   |   |
| 1 | 0 |   |   |   |
| 1 | 1 |   |   |   |

Using,



- b) Implementați G, E și L folosind porțile logice AND, OR și NOT.
- c) Folosind comparatoare pe 1 bit, construiți un verificator (comparator pe 4 biți), care să genereze la ieșire semnalul EQUAL=1 dacă și numai dacă  $A[3:0]=B[3:0]$  cele două intrări A și B (pe 4 biți fiecare) coincid.



**6.**

- a) Un multiplexor **4:1** (jos, stânga) selectează între 4 intrări folosind două linii de selecție ( $S_0, S_1$ ). Mai precis, ieșirea multiplexorului va fi egală cu A dacă selecția ( $S_1S_0$ ) este egală cu 00 ( $S_1$  fiind cel mai semnificativ bit). B se va găsi la ieșire pentru selecția ( $S_1S_0 = 01$ ), C pentru selecția ( $S_1S_0 = 10$ ) iar D va fi la ieșirea multiplexorului atunci când ambii biți de selecție vor fi 1. Construiți circuitul de multiplexare 4:1 a cărei funcționare tocmai a fost descrisă folosind multiplexoare **2:1** (jos, dreapta). Intrările în multiplexoarele folosite vor fi etichetate A, B, C și D, liniile de selecție vor fi notate cu  $S_0$  și  $S_1$ , iar ieșirea circuitului Y.



- b) Câte multiplexoare **2:1** sunt necesare pentru construirea unui multiplexor  $2^k:1$  ( $k>0$ ).

7. În această problemă se cere să se determine pentru toate intrările posibile ale lui A și B dacă celelalte tranzistoare (etichetate de la 1 la 6) conduc sau nu. Convenim că dacă tranzistoarele (1-6) conduc (circuit închis) atunci au valoarea 1 logic, altfel 0 logic (nu conduc – circuit deschis). De asemenea, indicați valoarea logică a lui Z.

| A | B | 1 | 2 | 3 | 4 | 5 | 6 | Z |
|---|---|---|---|---|---|---|---|---|
| 0 | 0 |   |   |   |   |   |   |   |
| 0 | 1 |   |   |   |   |   |   |   |
| 1 | 0 |   |   |   |   |   |   |   |
| 1 | 1 |   |   |   |   |   |   |   |



b) Scrieți expresia logică care descrie ieșirea Z în funcție de intrările A și B.

8. În această problemă se va construi un circuit combinațional pentru a determina când apare depășire (overflow) la adunarea a două numere în complement față de 2.

a) Se presupune că numerele **a** și **b**, folosite ca intrări, sunt pe 4 biți:  $a = a_3a_2a_1a_0$  și  $b = b_3b_2b_1b_0$ .

i. Presupunând primul caz în care  $a \geq 0$  și  $b \geq 0$  se pune întrebarea „Se obține depășire la adunarea celor două numere (a și b) ?” Scrieți expresia logică corespondentă acestui caz (în termenii biților lui **a** și

respectiv  $b$ ) care este adevărată doar pentru aceste valori ale lui  $a$  și  $b$  (pozitive).

ii. Cerință identică cu cea de la punctul anterior cu deosebirea că  $a \geq 0$  și  $b < 0$ .

iii. Cerință identică cu cea de la punctul i. cu deosebirea că  $a < 0$  și  $b \geq 0$ .

iv. Presupunând în acest caz că  $a < 0$  și  $b < 0$  se pune întrebarea „Se obține depășire la adunarea celor două numere ( $a$  și  $b$ ) ?” Scrieți expresia logică corespondentă acestui caz (în termenii biților lui  $a$  și respectiv  $b$ ) care este adevărată doar pentru aceste valori ale lui  $a$  și  $b$  (negative).

b) Se presupune la acest punct că dispunem de un sumator funcțional pe 4 biți având ca intrări pe  $a$  ( $a = a_3a_2a_1a_0$ ) și  $b$  ( $b = b_3b_2b_1b_0$ ). Ieșirea sumatorului, tot pe 4 biți este  $s$ , ( $s = s_3s_2s_1s_0$ ) și un bit de transport final  $c_3$ . Scrieți expresia logică care este adevărată când suma celor două numere  $a$  și  $b$  generează depășire (în funcție de biții lui  $a$ ,  $b$  și  $s$ , și respectiv bitul de carry –  $c_3$ ), indiferent de semnul celor două numere. (Indicație: se vor folosi informațiile de la punctul (a)). Îmbogățiți circuitul sumator cu porți logice în vederea implementării *semnalului de depășire* (numit **overflow**).

Acesta va lua valoarea 1 la generarea depășirii de către sumă.



9. a) Câte linii de selecție și câte linii de ieșire furnizează multiplexoarele următoare ? **Notă:** Numărul liniilor de intrare este specificat în tabelul de mai jos.

| Număr linii de intrare | Număr linii de selecție | Număr linii de ieșire |
|------------------------|-------------------------|-----------------------|
| 32                     |                         |                       |
| 16                     |                         |                       |
| 5                      |                         |                       |

- b) Câte linii de ieșire furnizează decodificatoarele următoare ? **Notă:** Numărul liniilor de intrare este specificat în tabelul de mai jos.

| Număr linii de intrare | Număr linii de ieșire | Număr linii de ieșire active la un moment dat |
|------------------------|-----------------------|-----------------------------------------------|
| 16                     |                       |                                               |
| 5                      |                       |                                               |
| 3                      |                       |                                               |

10. Care este expresia logică (booleană) a următorului circuit combinațional ?



11. Se reamintește că un sumator se construiește din componente individuale (sumator complet pe un bit) care produc un bit de sumă și unul de transport (*carry*) în funcție de intrările binare A, B și bitul *Carry* sosit de la nivelul anterior. Presupunând că dispunem de un **decodificator 3 la 8** și două **porti OR cu 6 intrări** (vezi figura de mai jos), se pune întrebarea dacă pot fi conectate astfel încât să obținem un sumator complet pe un bit. Dacă DA, realizați acest lucru. (Indicație: dacă o intrare în poarta OR nu este necesară, atunci aceasta poate fi înlocuită cu 0, neafectând rezultatul final).



12. Răspundeți la următoarele întrebări:

- a) Care ar fi relația descrisă printr-o expresie logică între tranzistoarele de tip P și N ?
- b) Prin ce se caracterizează circuitele logice combinaționale ? Dar cele secvențiale ?
- c) Cum funcționează (descrieți pe scurt) decodificatoarele, sumatoarele și multiplexoarele ?

## 4. ELEMENTE PRIMARE DE MEMORARE. REGIȘTRII. MEMORII. AUTOMATE CU NUMĂR FINIT DE STĂRI

### 4.1. STRUCTURI LOGICE SECVENTIALE

Se definește circuit de memorie orice componentă semiconductoare care implementează funcția de memorare. Un circuit secvențial este un CLC care are memorie și îl permite să memoreze „istoria” lui (vezi figura 4.1). Ieșirea este o funcție de intrări și starea curentă. Funcția este calculată de către circuitul logic combinațional. Starea este reținută în *elementul de memorare*. Starea următoare se determină, de asemenea, în funcție de intrări și starea curentă.



Figura 4.1. Circuit logic secvențial

Sunt de 2 feluri de circuite logice secvențiale: **sincrone** (CLSS) și **asincrone** (CLSA).

- CLSS – sunt caracterizate de faptul că există o trecere discretă a timpului. Transferul de informație se produce numai pe durata tactului.
- În cazul CLSA nu există impulsuri de tact și momentele succesive de timp sunt date de caracteristicile circuitului. Memoria joacă rolul unei linii de întârziere.

#### 4.1.1. BISTABILUL R-S

Reprezintă un element simplu de memorare care poate reține un bit de informație, circuitele bistabile putând avea la ieșire două stări stabile (0 logic și 1 logic) un timp nedefinit și doar o comandă externă putând declanșa modificarea stării logice a ieșirii. Există mai multe variante de implementare, în figura 4.2 fiind prezentată una dintre acestea. Este realizat din două porți de tip *NAND*. Ieșirea fiecărei porți se conectează la intrările celelalte. În mod normal (cel mai mult timp) celelalte două intrări (*S* și *R*) sunt în starea 1 logic. După cum se va vedea în continuare, există pentru intervale scurte de timp, situații când fie *S* fie *R* pot fi în 0 logic, dar nu simultan.



**Figura 4.2.** Bistabil R-S: reține două stări stabile a) (a=1) și b) (a=0)

În cazul a) din figura 4.2, ieșirea **a** poate fi setată pe 1 prin setarea temporară a lui *S* pe 0 și menținerea (îndelungată) a intrării *R* pe 1. Odată ce ieșirea **a** este 1, practic intrarea *A* în poarta *NAND* din josul figurii este 1, *R* de asemenea este 1, rezultând la ieșirea **b** valoarea 0, care înseamnă de fapt 0 la intrarea *B* în poarta de sus. Astfel, la ieșirea **a** se va găsi în continuare 1 necondiționat de valoarea lui *S*. După revenirea lui *S* în 1 la ieșirea **a** rămâne tot 1. Se spune astfel că bistabilul R-S stochează valoarea 1.

Invers, în cazul b) ieșirea **a** poate fi setată pe 0 prin păstrarea intrării *S* la valoarea 1 și setarea temporară a intrării *R* pe 0. Analog cu cazul a), la ieșirea **b** și implicit la intrarea *B* se va afla valoarea 1 logic. Ținând cont de faptul că *S* este permanent în 1 atunci la ieșirea **a** se va afla 0, care propagată pe intrarea *A* a porții de jos va face inutilă prezența lui *R* în 0, rezultatul în **b** fiind 1. Astfel, după revenirea lui *R* în 1 la ieșirea **a** a bistabilului va fi tot 0. Se spune că bistabilul R-S stochează valoarea 0.

În tabelul 4.1 este sintetizată funcționarea bistabilului R-S în funcție de configurația stării curente (notată  $Q$ ) și cea viitoare (notată  $Q^+$ ).

| $Q$ | $Q^+$ | $S$ | $R$ |
|-----|-------|-----|-----|
| 0   | 0     | 1   | *   |
| 0   | 1     | 0   | 1   |
| 1   | 0     | 1   | 0   |
| 1   | 1     | *   | 1   |

**Tabelul 4.1.** Configurația intrărilor R și S pentru tranziția stărilor din Q în  $Q^+$

În cazul tabelului anterior trebuie făcute două precizări:

- Prima se referă la faptul că starea  $Q$  reprezintă valoarea ieșirii  $a$  a bistabilului R-S la un moment  $t_0$  iar starea  $Q^+$  constituie valoarea ieșirii  $a$  la momentul  $t_0 + \Delta t$ .
- A doua se referă la valoarea  $*$  care trebuie înțeleasă astfel: inițial valoarea lui R sau S (în funcție de coloana pe care apare) este 0, urmând ca ulterior la momente de  $t_0 + 2 \cdot \Delta t$ , R sau S să revină în 1.

Bistabilul R-S are *autonomie limitată*: el depinde de starea lui anterioară și de intrări. Ieșirile se schimbă numai pentru anumite valori ale intrărilor. Realizează funcția de memorare pentru că variația unor intrări în anumite cazuri nu are efect nici asupra ieșirilor și nici asupra stărilor. Există două tipuri de bistabili R-S: varianta asincronă (vezi figura 4.2) și varianta sincronă (vezi figura 4.3).



**Figura 4.3.** Bistabil R-S sincron (intrările  $R_a$  și  $S_a$  sunt intrările aferente bistabilului R-S asincron, iar  $T$  este semnalul de ceas)

Bistabilul R-S prezintă și unele dezavantaje:

- Apar stări interzise ( $R=0$  și  $S=0$ )

- În cazul bistabilului R-S sincron apar limitări datorate impulsului de tact.
- Are două intrări de comandă pentru a comanda o singură ieșire (care este tot una cu starea)

#### 4.1.2. BISTABILUL DE TIP D (DELAY).

Reprezintă o extensie a bistabilului de tip R-S și este un bistabil cu rol de întârziere. Există două intrări: una de date – **D** și una de validare a procesului de memorare – **WE** (write enable). Dacă WE este egal cu 1 atunci ieșirea bistabilului (fie aceasta Q) este setată la valoarea D (practic semnalul de ieșire este identic cu cel de intrare cu mențiunea că este întârziat cu un interval de timp egal cu timpul de propagare prin două porți logice fundamentale SI-NU – vezi figura 4.5). Ieșirea rămâne la valoarea setată până la o nouă setare a semnalului WE pe 1 (când la ieșire va fi noua valoare a lui D).

Bistabilul de tip D (vezi figura 4.4) nu are variantă de funcționare *fără modificare de stare* ci, la fiecare impuls de tact primit (activare a semnalului WE<sup>3</sup>), valoarea preluată de bistabil pe intrarea D este cea care determină următoarea stare la ieșire. Pentru a păstra valoarea la ieșire nemodificată, cât timp nu se primește impuls de tact, este necesar să menținem intrarea D egală cu valoarea curentă de pe ieșire. Această funcționare este asigurată de conexiunile de reacție, care leagă fiecare ieșire Q la intrarea D a aceluiași bistabil.



**Figura 4.4.** Bistabil de tip D

<sup>3</sup> Semnalul WE devine 1 logic.

Ecuația logică de stare a bistabilului de tip D este:  $Q(t_{n+1}) = D(t_n)$ , unde  $t_{n+1} - t_n$  este maxim o perioadă de tact procesor ( $T_{CLK}$ ). Ieșirea Q reprezintă intrarea D întârziată cu maxim un tact.



Figura 4.5. Bistabil de tip D – cronogramă

#### 4.1.3. REGIȘTRII.

Un **regisztru** este un ansamblu de bistabili și, eventual, porți logice care realizează schimbările de stare ale bistabililor. Grupul de bistabili care formează regisztrul pot fi încărcați simultan, sub acțiunea unui impuls de tact unic. Un **regisztru de  $n$  biți** are  $n$  bistabili și poate memora și / sau deplasa orice informație reprezentabilă pe  $n$  biți. Porțile logice au rolul de a controla când și cum o informație nouă este transferată în regisztru.

Componentele unui sistem digital sunt complet definite de regisztrii pe care îi conțin și de operațiile care se execută asupra datelor lor. Operațiile execute asupra datelor memorate în regisztrii se numesc **microoperații**. Exemple: deplasare, numărare, încărcare, ștergere. Pentru execuțarea fiecareia dintre aceste microoperații există structuri bine determinate ale regisztrilor respectivi. În continuare se vor descrie structurile unora dintre acești regisztri.

#### Încărcarea regisztrilor

Funcția unui regisztr cu încărcare paralelă este de a prelua valorile logice puse pe intrările de date, simultan pentru toate pozițiile binare la

primirea acelaiași impuls de ceas, și de a stoca temporar configurația binară respectivă în scopul unui acces ușor la ea în vederea prelucrării. Registrul paralel (de stocare / tampon) [Fil96] – vezi figura 4.6, este format din  $n$  bistabili de tip D acționați sincron de un tact comun.



**Figura 4.6.** Schema generală a unui registru paralel

În momentul aplicării tactului, cuvântul binar de  $n$  biți present la intrările  $I_0, I_1, \dots, I_{n-1}$  este înscris în cele  $n$  celule de memorie și poate fi citit la ieșirile  $Q_0, Q_1, \dots, Q_{n-1}$ .

### Registrul de deplasare

Registrul de deplasare serie este format din  $n$  bistabili de tip D conectați în cascadă (ieșirea dintr-un bistabil este intrare în următorul) [Fil96]. În plus, funcționarea este sincronizată prin faptul că toate intrările de ceas sunt legate la aceeași sursă. Astfel, toți bistabilii vor primi la același moment impulsul de tact care determină deplasarea informației. Un registru capabil să deplaseze, adică să translateze cu o poziție informația memorată de bistabilii săi se numește **registru de deplasare**. În funcție de construcția registrului, operația de mutare (*shift*) se poate face spre stânga, spre dreapta sau în ambele direcții.



**Figura 4.7.** Schema generală a unui registru serie

Intrarea  $D_{IN}$  conține informația care se va memora în primul bistabil, iar ieșirea  $D_{OUT}$  va conține vechiul conținut al ultimului bistabil al registrului de deplasare analizat. Se observă că informația  $D_{IN}$  ajunge la ieșirea  $D_{OUT}$  după  $n$  impulsuri de tact.

### Regiștrii combinați (cu funcții multiple)

Cele două tipuri de registre tratate anterior sunt utilizate în aplicații în care transferul datelor se face fie numai paralel fie numai serie. Registrele combinate permit trecerea de la transferul paralel la cel serie și invers. În figura 4.8 se prezintă un registru combinat pe 4 biți [Fil96].



**Figura 4.8.** Schema generală a unui registru paralel-serie sau serie-paralel

- ✓ Dacă semnalul S/P (comportament de registru serie / paralel) este 0, sunt deschise portile 2 și datele de intrare  $I_0$ ,  $I_1$ ,  $I_2$  și  $I_3$  au acces la intrările celor 4 bistabile. Încărcarea paralel are loc în momentul aplicării impulsului de ceas (CLK).
- ✓ Dacă  $S/P=1$ , registrul realizează o deplasare a datelor de la stânga la dreapta, cu câte un bit pentru fiecare impuls de ceas.

Registrul funcționează atât ca și **convertor paralel-serie**, datele fiind introduse paralel la intrările  $I_0$ ,  $I_1$ ,  $I_2$  și  $I_3$ , fiind extrase serie la ieșirea SO (*serial output*), cât și ca un **convertor serie-paralel**, datele se introduc de o manieră serială la intrarea SI (*serial input*) și sunt extrase paralel la ieșirile  $Q_0$ ,  $Q_1$ ,  $Q_2$  și  $Q_3$ .

Referitor la regiștrii utilizați de către calculatorul LC-3 se disting:

- ✓ 8 regiștri de uz general  $R_0 \div R_7$ , IR (instruction register), PC (program counter), MAR (registru de adresă al memoriei) – toate pe 16 biți și,
- ✓ regiștri booleani pe 1 bit: N – semn negativ, P – semn pozitiv, Z – pentru identificarea numerelor nule.

Dintre regiștri pe 16 biți, registrul PC trebuie să îndeplinească funcțiile de încărcare paralelă și cea de numărător, regiștrii de uz general trebuie să fie capabili de deplasări, încărcare paralelă, iar pentru regiștrii IR, MAR și MDR este necesară doar încărcarea paralelă.

Trebuie menționat că se poate opera nu numai asupra regiștrilor (ca și entități atomice) ci și asupra câmpurilor din interiorul unui registru (de exemplu: IR[3:0]).

#### 4.1.4. MEMORIA

Reprezintă o zonă de date de capacitate mai mare decât regiștrii procesorului dar mai lentă decât aceștia. Se cunosc următoarele tipuri de memorii:

- **ROM (read only memory)** – memorii fixe, nevolatile, în care informația se păstrează și după întreruperea alimentării. Circuitele ROM sunt circuite pur combinaționale, celula de memorie fiind un tranzistor programat sau nu, amplasat la intersecția unei linii cu a unei coloane, din matricea de memorie (vezi figura 4.10). În ele se înscrie softul de bază al unui sistem de calcul: *sistemul de operare*, BIOS (rutina de inițializare a sistemului de calcul imediat după alimentarea cu energie – teste de memorie, verificare periferice). Memoriile ROM pot fi doar citite nu scrise (scrierea se face o singură dată în momentul fabricării).
- **PROM (programmable ROM)** – poate fi programat de producător sau utilizator la prima folosire a dispozitivului.
- **UVEPROM (Ultraviolet Erasable PROM)** – sunt identice cu memoriile PROM cu deosebirea că oferă posibilitatea de ștergere și reprogramare prin expunerea la raze ultraviolete. Necesită un echipament special pentru programare.
- **EEPROM (Electrical Erasable PROM)** – sunt identice cu memoriile UVEPROM cu deosebirea că ștergerea se face prin aplicarea unor semnale electrice speciale de tensiune ridicată (30V).
- **FLASH ROM** – este o memorie specială de tip EEPROM care poate fi ștearsă sau programată în timpul funcționării în circuit (aplicații cu

microcontrollore în care se încarcă un cod obiect gata de execuție). Odată programat conținutul rămâne nemodificat chiar și după eventuale anomalii datorate căderii tensiunii de alimentare.

- **RAM (random access memory)** – este o memorie care poate fi scrisă sau citită (atât timp cât este alimentată cu energie). Informația se pierde după oprirea alimentării. Accesul la memorie se permite numai în anumite momente de timp validate de un semnal de tip acces la memorie (*memory request*). Există două tipuri majore de memorii RAM:
  - **SRAM (Static RAM)** – mai rapide, mai fiabile dar mai scumpe per unitate de octet memorat. Uzual sunt folosite la implementarea memoriilor *cache*. De asemenea, consumă mai multă energie.
  - **DRAM (Dynamic RAM)** – lentă și necesită regenerare (celula de memorie o reprezintă un condensator care se descarcă în timp); ieftină per unitate de octet memorat. Memoria principală este de tip DRAM. Din punct de vedere al evoluției în timp a memoriilor DRAM se cunosc următoarele etape:
    - EDO (*Extended Data Out RAM*) – cu 10% până la 20% mai rapidă decât primele memoriile DRAM.
    - SDRAM (*Synchronous DRAM*) – mai rapide cu aproape 25% decât memoriile EDO RAM.
    - DDR sau SDRAM II (*Double Data Rate SDRAM*) – de două ori mai rapide decât memoriile SDRAM.
    - RDRAM (*Rambus DRAM*) – dezvoltate de către firma Rambus Inc., sunt de aproape zece ori mai rapide decât memoriile DRAM.
    - SLDRAM (*Synclink DRAM*) – este principalul competitor din punct de vedere tehnologic al memoriilor RDRAM.

Creșterea decalajului dintre viteza procesoarelor și timpul de acces la memorie a impus introducerea unui sistem ierarhic de memorie (vezi figura 4.9), pentru a nu face simțită la nivelul performanței globale a sistemului încetineaala cu care se accesează memoria. Practic, cu cât capacitatea memoriei crește, cu atât scade timpul de acces la memorie și se ieftineste prețul per unitate de octet memorat. Memoria **cache** este o memorie situată din punct de vedere logic între CPU (unitatea centrală de procesare) și memoria principală, mai mică, mai rapidă și mai scumpă (per byte) decât aceasta și gestionată – în general prin hardware – astfel încât să existe o cât mai mare probabilitate statistică de găsire a datei accesate de către CPU, în cache. Așadar, cache-ul este adresat de către CPU în paralel cu memoria principală (MP): dacă data dorită a fi accesată se găsește în cache, accesul la MP se abortează, dacă nu, se accesează MP cu penalizările de timp impuse

de latență mai mare a acesteia, relativ ridicată în comparație cu frecvența de tact a CPU. Oricum, data accesată din MP se va introduce și în cache.



**Figura 4.9.** Ierarhizarea memoriei într-un sistem de calcul

Memoria este caracterizată de un număr mare de locații de dimensiune fixă fiecare. Cu  $n$  biți de adresă pot fi adresate  $2^n$  locații de memorie. Astfel, cu 24 de biți de adresă pot fi accesate  $2^{24}$  locații, adică 16 Megalocații – 16777216 locații. Dacă fiecare locație reține 1 octet atunci spațiul de memorie acoperit este de 16 MBytes iar dacă locația conține un cuvânt de 4 octeți rezultă că spațiul de memorie adresabil este de  $16 \cdot 4 = 64$  MBytes.

Calculatoarele sunt adresabile (pot extrage cuvinte de dimensiuni variabile) în mod normal pe cuvânt sau pe octet. Există însă procesoare cu instrucțiuni care solicită încărcarea / scrierea din memorie a unui semicuvânt (2 octeți) sau a unui dublu cuvânt (8 octeți) (vezi **lh** – *load high* sau **ld** – *load double* la procesorul MIPS). În general un cuvânt este scris sau citit la un moment dat. În cazul în care se dorește accesul în scriere sau citire la un singur octet trebuie cunoscută convenția de reprezentare de pe mașina respectivă (*big* sau *little endian*).

În figura 4.10 este descris modul de implementare a unei memorii cu 4 locații, fiecare conținând un bit. Bitul de informație este reținut în bistabili de tip D. De regulă, fiecare locație conține  $w$  biți (în figura 4.10 –  $w=1$ ). Dacă  $w=8$  atunci memoria este adresabilă pe octet. Pentru adresarea celor  $n$  locații de memorie sunt necesari  $\lceil \log_2 n \rceil$  biți de adresă dacă se consideră  $n$  o putere a lui 2, altfel  $\lceil \log_2 n \rceil + 1$ . Circuitul decodificator va selecta doar o locație de memorie din cele  $n$ , la un moment dat.



**Figura 4.10.** Schema generală a unei memorii pe un bit (soluția nescalabilă)

În realitate semnalul de ieșire nu poate fi obținut dintr-o poartă SAU cu  $2^n$  intrări. Soluția de scalabilitate a ieșirii compusă din cele  $2^n$  intrări presupune folosirea de porți SAU cu 2 intrări ca în figura 4.11. Se impune astfel observația conform căreia *timpul de citire al locației 0 este mai lung decât timpul de citire al ultimei locații ( $2^n - 1$ )* – informația de la locația 0 are de parcurs mult mai multe porți SAU decât oricare alta.



**Figura 4.11.** Schema generală a unei memorii pe un bit (soluția scalabilă)

În figura 4.12 este prezentată o memorie tot cu 4 locații, fiecare locație având de data aceasta un număr de 3 biți ( $D_2 \div D_0$ ). Numărul de biți de adresă este  $\lceil \log_2 4 \rceil$ , adică 2 – ( $A_1 \div A_0$ ). Validarea preluării datelor – scrierii sau citirii se face cu semnalul de validare WE. Se remarcă aceeași observație de nescalabilitate a portilor SAU aflate la ieșirile de date  $D_{<2>}^>$ ,  $D_{<1>}^>$ ,  $D_{<0>}^>$ .

USI



**Figura 4.12.** Schema generală a unei memorii pe 3 biți

În figura 4.13 este ilustrat modul de implementare a unei memorii de 8Kocteți folosind circuite de 2K intrări adresabile 4 biți. Semnalul CS (chip select) dacă este setat pe 1 este validată adresarea, citirea și scrierea unui cip. Este necesară gruparea pe fiecare linie a două circuite pentru a realiza o memorie adresabilă pe octet (crearea unui banc de 2Kocteți). Circuitele primare având 2K intrări rezultă necesitatea a 11 biți de adresă ( $A_{10} \div A_0$ ), ceilalți doi biți ( $A_{12} \div A_{11}$ ) din totalul de 13 biți necesari pentru adresarea unui spațiu de 8K intrări sunt folosiți pentru selecția bancului de două circuite primare.



**Figura 4.13.** Implementarea unei memorii de 8Kocteți folosind circuite de 2K intrări adresabile 4 biți

**Aplicație 1:** Descrieți funcționarea circuitului secvențial din figura următoare cunoscând că la momentul inițial ieșirile  $Q_3Q_2Q_1Q_0$  sunt 0000.



**Figura 4.14.** Schema unui numărător pe patru biți

Pentru rezolvare se va realiza tabelul de valori al ieșirilor  $Q_3Q_2Q_1Q_0$ .

| Valoarea ieșirilor $Q_3Q_2Q_1Q_0$ la momentul $t$ |       |       |       | Valoarea ieșirilor $Q_3Q_2Q_1Q_0$ la momentul următor $t'$ |       |       |       |
|---------------------------------------------------|-------|-------|-------|------------------------------------------------------------|-------|-------|-------|
| $Q_3$                                             | $Q_2$ | $Q_1$ | $Q_0$ | $Q_3$                                                      | $Q_2$ | $Q_1$ | $Q_0$ |
| 0                                                 | 0     | 0     | 0     | 0                                                          | 0     | 0     | 1     |
| 0                                                 | 0     | 0     | 1     | 0                                                          | 0     | 1     | 0     |
| 0                                                 | 0     | 1     | 0     | 0                                                          | 0     | 1     | 1     |
| 0                                                 | 0     | 1     | 1     | 0                                                          | 1     | 0     | 0     |
| 0                                                 | 1     | 0     | 0     | 0                                                          | 1     | 0     | 1     |
| 0                                                 | 1     | 0     | 1     | 0                                                          | 1     | 1     | 0     |
| 0                                                 | 1     | 1     | 0     | 0                                                          | 1     | 1     | 1     |
| 0                                                 | 1     | 1     | 1     | 1                                                          | 0     | 0     | 0     |
| 1                                                 | 0     | 0     | 0     | 1                                                          | 0     | 0     | 1     |
| 1                                                 | 0     | 0     | 1     | 1                                                          | 0     | 1     | 0     |
| 1                                                 | 0     | 1     | 0     | 1                                                          | 0     | 1     | 1     |
| 1                                                 | 0     | 1     | 1     | 1                                                          | 1     | 0     | 0     |
| 1                                                 | 1     | 0     | 0     | 1                                                          | 1     | 0     | 1     |
| 1                                                 | 1     | 0     | 1     | 1                                                          | 1     | 1     | 0     |
| 1                                                 | 1     | 1     | 0     | 1                                                          | 1     | 1     | 1     |
| 1                                                 | 1     | 1     | 1     | 0                                                          | 0     | 0     | 0     |

**Tabelul 4.2.** Comportamentul automatului sevențial în funcție de intrări

După cum se poate observa datorită inversorului de la intrarea lui  $Q_0$ , acesta va schimba starea cu fiecare impuls de tact. De asemenea,  $Q_1$  va schimba starea abia după două impulsuri de tact (când  $Q_0$  a schimbat din 0 în 1 și apoi înapoi din 1 în 0). Porțile AND au rolul de a facilita tranzitarea dintr-o stare în alta a lui  $Q_2$  abia după 4 perioade de tact și respectiv a lui  $Q_3$  abia după 8 perioade de tact. Raționamentul poate continua și să se ajunge la tabelul de adevăr de mai sus, care de fapt descrie funcționarea unui **circuit numărător saturat** pe 4 biți.

În general, un numărător este un dispozitiv care memorează de câte ori un eveniment particular sau proces a avut loc atunci când s-a activat semnalul de tact. În practică sunt folosite atât numărătoare bazate pe incrementare cât și numărătoare bazate pe decrementare. Anticipând puțin, unitatea de control a fiecărei arhitecturi de procesare dispune de un registru numit *Program Counter* (numărător de program) care reține adresa următoarei instrucțiuni din program. În funcție de adresabilitatea memoriei și de numărul de octeți pe care e reprezentată fiecare instrucțiune, acest

numărător va fi incrementat după aducerea din memorie a câte unei instrucțiuni cu o anumită valoare (1, 2, 4, 8), dar de fiecare dată aceeași.

## 4.2. AUTOMATE SECVENTIALE ȘI PROGRAMABILE

Automatul cu număr finit de stări presupune o desfășurare automată a unui număr finit de secvențe. În informatică, automatele finite sunt folosite pe larg în modelarea comportamentului aplicațiilor, ingineria software, compilatoare, în studiul computației și limbajelor și în proiectarea sistemelor digitale hardware (automatele cu număr finit de stări se folosesc în structurile hardware de predicție aferente ramificațiilor condiționate din program, mecanisme de confidență în vederea unei evacuări / inserări selective în structuri de predicție a salturilor indirekte de tip Target Cache, dar și în reducerea decalajului dintre viteza procesoarelor și timpul de acces la memorie prin concepte de tip *selective victim cache*).

Un **automat finit** (AF) sau o **mașină cu stări finite** este un model de comportament compus din *stări*, *tranzitii* și *acțiuni* [Wik]. O stare stochează informații despre trecut, adică reflectă schimbările intrării de la inițializarea sistemului până în momentul de față. O tranzitie indică o schimbare de stare și este descrisă de o condiție care este nevoie să fie îndeplinită pentru a declanșa tranzitia. O acțiune este o descriere a unei activități ce urmează a fi executată la un anumit moment. Există câteva tipuri de acțiuni:

- ☞ Acțiune *de intrare* executată la intrarea într-o stare.
- ☞ Acțiune *de ieșire* executată la ieșirea dintr-o stare.
- ☞ Acțiune *de intrare de date* executată în funcție de starea prezentă și de datele de intrare.
- ☞ Acțiune *de tranzitie* executată în momentul unei tranzitii.

Logica automatelor finite stabilește că ieșirea și starea următoare a unui automat finit este o funcție de intrare și de starea curentă. Logica unui AF este prezentată în figura 4.15 [Wik].



Figura 4.15. Logica automatelor finite

Automatul finit poate fi reprezentat printr-o *diagramă de stări* (sau *diagramă de stări și tranziții*) ca în figurile 4.16 și 4.17 [Wik]. În plus, se folosesc și tabele de tranziție. Cea mai comună reprezentare este data mai jos: prin combinația stării curente (B) și a condiției (Y) se determină starea următoare (C). Informații complete privind acțiunile pot fi adăugate doar ca note de subsol. În limbaj natural funcționarea automatului următor s-ar descrie astfel: *Din starea B dacă se îndeplinește condiția Y se trece în starea C.*

| Starea curentă / Condiția | Starea A | Starea B        | Starea C |
|---------------------------|----------|-----------------|----------|
| Condiția X                | ...      | ...             | ...      |
| <b>Condiția Y</b>         | ...      | <b>Starea C</b> | ...      |
| Condiția Z                | ...      | ...             | ...      |

Tabelul 4.3. Tabel de tranziție într-un automat cu număr finit de stări – caz general

Figura 4.16 descrie funcționarea unui automat simplu de închidere / deschidere a unei uși (de supermarket, de autobuz, etc.). Practic automatul se poate afla în două stări posibile (DESCHIS sau ÎNCHIS). În fiecare din cele două stări se ajunge datorită unei *Condiții de tranziție* (declanșată practic de „scurgerea” unui interval de timp sau de apăsarea unui buton, sau de un senzor de mișcare, etc.) iar la intrarea în fiecare stare are loc o *acțiune de intrare*.



**Figura 4.16.** Diagrama de stări și tranziții – automat simplu de închidere / deschidere a unei uși

Pentru o și mai bună exemplificare, și pentru crearea unei legături cu cursul care urmează acestuia introductiv, și anume cel de *Organizarea și proiectarea microarhitecturilor*, se prezintă funcționarea unui automat finit pe doi biți (de tip numărător saturat, folosit de cele mai multe structuri de predicție implementate în cadrul procesoarelor actuale) [Flo05].



**Figura 4.17.** Diagrama de stări și tranziții – automat finit pe doi biți (de tip numărător saturat)

Tabela de tranziție arată astfel:

| Stare curentă | Stare următoare                                      |                                                   | Predicție (Acțiune de ieșire:<br>predictibil=1 / nepredictibil=0) |
|---------------|------------------------------------------------------|---------------------------------------------------|-------------------------------------------------------------------|
|               | Pentru intrare = 0<br>(predicție <b>incorrectă</b> ) | Pentru intrare = 1<br>(predicție <b>corectă</b> ) |                                                                   |
| 0             | 0                                                    | 1                                                 | 0                                                                 |
| 1             | 0                                                    | 2                                                 | 0                                                                 |
| 2             | 1                                                    | 3                                                 | 1                                                                 |
| 3             | 2                                                    | 3                                                 | 1                                                                 |

**Tabelul 4.4.** Tranzițiile automatului de predicție pe 2 biți

Cei doi biți pot codifica până la patru stări (cazul nostru 0÷3). Funcționarea automatului este de tip numărător saturat întrucât pentru o intrare 1, starea este incrementată doar dacă este mai mică strict decât starea maximă altfel rămâne la valoarea maximă (saturație). Pentru o intrare 0, starea este decrementată doar dacă este mai mare strict decât starea minimă altfel rămâne la valoarea minimă (saturație). Într-o implementare software care modeleză funcționarea automatului finit (de predicție) acesta poate fi descris printr-un sir de caractere cu un format mai special, ce prezintă atât numărul de stări, tranzițiile între stări cât și predicția aferentă fiecărei stări. De exemplu, automatul anterior s-ar descrie prin sirul de caractere: „01021323:12”. Prima parte a sirului până la caracterul “:” reprezintă tranzițiile pentru starea ‘0’ cu intrare 0, apoi cu intrare 1, apoi tranzițiile din ‘1’ pentru aceleși intrări, etc. Numărul 12 din a doua parte este “văzut” în binar “invers” sub forma “0011” și reprezintă ieșirile asociate fiecărei stări în parte (stării ‘0’ îi este asociat cel mai puțin semnificativ bit, în acest caz bitul ‘0’, următorul bit lui ‘1’, bitul ‘0’ etc).

Rolul acestui automat este următorul: starea automatului va determina acțiunea de ieșire (predicția ramificației în program, adică urmarea ramurii cu *if* sau a celei cu *else*). Dacă acesta e 1 logic, atunci se prezice că saltul se va face, iar dacă e 0 logic, se prezice că saltul nu se va face. Evident că nu se poate ști în avans dacă predicția este corectă. Oricum, procesorul va considera că predicția este corectă și va declanșa aducerea instrucțiunii următoare de pe ramura prezisă. Dacă predicția se dovedește a fi fost falsă se va iniția procesarea celeilalte ramuri de program. Totodată, automatul va tranzita într-o nouă stare conform figurii 4.17 sau a tabelului 4.4.

Într-un circuit digital, o **implementare hardware a unui AF** necesită un **registrator** pentru a stoca variabilele de stare, un bloc de **logică combinațională** care determină tranziția de stare, și un alt **bloc de logică combinațională** care determină ieșirea automatului finit [Wik]. **Optimizarea** unui automat finit înseamnă găsirea automatului finit cu numărul minim de stări care operează cu aceeași funcționalitate. Această problemă se poate rezolva folosind un **algoritm de colorare** [Wik, Cor90].

Automatele finite pot fi clasificate în: *Acceptoare* și *Transductoare*. Automatele *acceptoare* generează o ieșire binară, fie *da*, fie *nu*, reprezentând răspunsul la întrebarea "*Intrarea este acceptată sau nu de mașină?*". Mașina, utilizată în cazul gramaticilor din limbajele formale, poate fi descrisă și ca definiție pentru un limbaj, în cazul de față limbajul definit ar conține toate cuvintele acceptate de mașină și nici unul din cele neacceptate. Toate stările automatului se clasifică în stări acceptante (finale) sau neacceptante. Dacă la momentul terminării procesării întregului sir de intrare automatul este într-o stare finală, atunci intrarea este acceptată, altfel nu. Ca o regulă, intrarea este compusă din simboluri (caractere); nu se folosesc acțiunile. *Transductoarele* generează ieșire pe baza unei intrări date și/sau a unei stări, folosind acțiuni. Ele sunt folosite în controlul aplicațiilor. Aici se disting două tipuri [Wik]:

- Mașina *Moore* – Automatul folosește doar acțiuni de intrare, și deci ieșirea depinde doar de stare. Avantajul modelului Moore este dat de simplificarea comportamentului.
- Mașina *Mealy* – Automatul folosește doar acțiuni de intrare de date, adică ieșirea depinde de intrare și de starea curentă. Utilizarea unui AF Mealy conduce adesea la o reducere a numărului de stări.

În practică se folosesc deseori modele hibride. O altă distincție care se face între automatele finite este cea între *automatele finite, deterministe* (AFD) și cele *nedeterministe* (AFN). În cazul automatelor deterministe, din fiecare stare se poate efectua exact o singură tranziție pentru fiecare intrare posibilă. În cazul automatelor nedeterministe, pentru o anumită stare și o anumită intrare, pot fi mai multe tranziții posibile, sau chiar nici una. Această distincție este relevantă în practică, dar nu și în teorie, deoarece există un algoritm care poate transforma orice AFN într-un AFD echivalent, deși această transformare mărește, de obicei, complexitatea automatului.

## Modelul matematic

În funcție de tip, există mai multe definiții. Un automat finit **acceptor** este un cvintuplu  $\langle \Sigma, S, s_0, \delta, F \rangle$ , unde:

- $\Sigma$  este alfabetul de intrare (o mulțime finită și nevidă de simboluri).

- $S$  este o mulțime finită și nevidă de stări.
- $s_0$  este starea inițială, element al lui  $S$ . Într-un automat finit nedeterminist,  $s_0$  este o mulțime de stări inițiale.
- $\delta$  este funcția de tranziție a stării:  $\delta: S \times \Sigma \rightarrow S$ .
- $F$  este mulțimea stărilor finale, o submulțime (posibil vidă) a lui  $S$ .

Un automat finit **transductor** este un sextuplu  $\langle \Sigma, \Gamma, S, s_0, \delta, \omega \rangle$ , unde:

- $\Sigma, S$  și  $s_0$  își păstrează semnificațiile din definiția automatului finit acceptor.
- $\Gamma$  este alfabetul de ieșire (o mulțime finită și nevidă de simboluri).
- $\delta$  este funcția de tranziție a stării:  $\delta: S \times \Sigma \rightarrow S \times \Gamma$ .
- $\omega$  este funcția de ieșire.

Dacă funcția de ieșire este o funcție de stare și de alfabetul de intrare ( $\omega: S \times \Sigma \rightarrow \Gamma$ ), atunci această definiție corespunde **modelului Mealy**. Dacă funcția de ieșire depinde doar de stare ( $\omega: S \rightarrow \Gamma$ ), atunci această definiție corespunde **modelului Moore**.

**Aplicație 2:** Circuitul de mai jos implementează un automat cu număr finit de stări (fie acesta  $M$ ). Registrul pe un bit etichetat  $S$  memorează starea curentă,  $I$  este intrarea și  $O$  este ieșirea.



(a) Câte stări are automatul  $M$ ? Desenați diagrama stărilor și a tranzițiilor pentru automatul  $M$ .

(b) Circuitul de mai jos este un automat cu număr finit de stări programabil. Componentele circuitului, sunt etichetate astfel: (A) o memorie cu patru locații fiecare conținând un bit ( $2^2 \times 1$ -bit), (Z) o memorie cu două locații a către un bit fiecare ( $2^1 \times 1$ -bit). (S) un registru pe un bit.



Ce trebuie să conțină locațiile de memorie A și Z astfel încât acest circuit să reprezinte o implementare hardware a automatului M?

| Adresa (A <sub>1</sub> A <sub>0</sub> ) | Conținutul locației A |
|-----------------------------------------|-----------------------|
| 00                                      |                       |
| 01                                      |                       |
| 10                                      |                       |
| 11                                      |                       |
| Adresa (Z <sub>0</sub> )                | Conținutul locației Z |
| 0                                       | 1                     |
| 1                                       | 0                     |

Răspuns:

a) Întrucât S este reprezentat pe un bit rezultă că M are două stări. Diagrama stărilor și a tranzițiilor pentru automatul M arată astfel:



Considerăm o stare a automatului ( $S=0$ ) și alta ( $S=1$ ). Din schemă se observă că  $O = \text{not } S$ . De asemenea, pentru orice intrare egală cu 0 ( $I=0$ ) automatul trece din starea curentă în celaltă (din  $S=0$  în  $S=1$  sau invers). Pentru orice intrare egală cu 1 ( $I=1$ ) automatul își păstrează starea.

b)

| Adresa ( $A_1 A_0$ ) | Conținutul locației |
|----------------------|---------------------|
| 00                   | 1                   |
| 01                   | 0                   |
| 10                   | 0                   |
| 11                   |                     |

Se observă că  $A_1$  este  $I$  (intrarea în automat) iar  $A_0$  este  $S$  (starea curentă). Tinem cont de considerațiile anterioare (intrare 1 păstrează starea constantă, intrare 0 schimbă starea).

| Adresa ( $Z_0$ ) | Conținutul locației |
|------------------|---------------------|
| 0                | 1                   |
| 1                | 0                   |

Se observă că  $O$  (ieșirea) este dat de conținutul locației, și este negația stării  $S$ .

În finalul acestui curs, anticipând puțin ce va fi prezentat în cursurile următoare, este ilustrată diagrama fluxului de date din cadrul calculatorului LC-3. Aceasta conține toate structurile logice digitale, combinaționale și secvențiale, care combinează îndeplinește funcția de procesare a informațiilor,

funcție *cheie* a oricărui model de calcul de tip von Neumann. Deși pare demnă de intimidat, schema este prezentată aici pentru a se observa că, în acest moment, se dispune de cunoștințe suficiente pentru înțelegerea funcționalității unui calculator.



**Figura 4.18.** Fluxul datelor la calculatorul LC-3

### 4.3. EXERCIȚII ȘI PROBLEME

1. Să se implementeze folosind circuite primare de memorie de capacitate **8Klocații x 1 octet** o memorie de **64Kcuvinte**, fiecare **cuvânt** având **32 biți**. Care sunt liniile de adresă dacă memoria este adresată pe cuvânt ? Dar dacă este adresată pe octet ?



2. În diagrama logică de mai jos A și B sunt doi regiștri pe 16 biți conectați la un sumator care realizează operații de adunare pe 16 biți. Se presupune că registrul A are valoarea inițială 0 și registrul B are valoarea X. Ce valoare va conține registrul A dacă semnalul **WriteEnableA** este activat de 5 ori ? Dar dacă **WriteEnableA** este activat de N ori ?



3. În diagrama logică de mai jos se presupune că Y conține inițial valoarea 0 în timp ce X conține un număr oarecare în complement față de 2. Într-

o singură propoziție descrieți ce valoare va reține Y după ce semnalul **WriteEn** este ridicat în ‘1’ logic și coborât în ‘0’ logic de 16 ori.



- 4. Automate sevențiale și programabile:** Se consideră diagrama de funcționare a următorului circuit.



Componentele circuitului, sunt etichetate astfel: (A) un registru pe 4 biți reprezentând un număr întreg fără semn (initializat cu valoarea 0); (B) un numărător pe 4 biți; (C) un registru pe 8 biți care memorează un întreg în complement față de 2 (initial setat pe 127); (D) un multiplexor pe 8 biți 2-la-1; (E) un circuit al cărui ieșire este *true* (1) atunci când intrarea (un întreg în complement față de 2 pe 8 biți) este pozitiv; (F) un sumator pe 8 biți; (G) o memorie cu 16 locații fiecare conținând cuvinte de 8 biți ( $2^4 \times 8$ -bit). Se presupune că această memorie are următorul conținut:

| Adresa | Conținut | Adresa | Conținut |
|--------|----------|--------|----------|
| 0      | 31       | 8      | 27       |
| 1      | 47       | 9      | 95       |
| 2      | 5        | 10     | 88       |
| 3      | 16       | 11     | 67       |
| 4      | 112      | 12     | 63       |
| 5      | 3        | 13     | 54       |
| 6      | 59       | 14     | 80       |
| 7      | 8        | 15     | 110      |

(a) Determinați valorile stocate în regiștrul A și C la sfârșitul fiecărui ciclu de tact pentru 8 ciclii desfășurați. Completăți următorul tabel cu informațiile lipsă.

| Ciclu de tact | Regiștrul A | Regiștrul C |
|---------------|-------------|-------------|
| 0             | 0           | 127         |
| 1             |             |             |
| 2             |             |             |
| 3             |             |             |
| 4             |             |             |
| 5             |             |             |
| 6             |             |             |
| 7             |             |             |
| 8             |             |             |

(b) Într-o singură propoziție, ce realizează circuitul ?

## **5. MODELUL ARHITECTURAL VON NEUMANN. COMPONENTE DE BAZĂ. PRINCIPIILE PROCESĂRII INSTRUCȚIUNILOR**

### **5.1. COMPOENETELE DE BAZĂ ALE MODELULUI ARHITECTURAL VON NEUMANN**

În anii '40, matematicianul **John von Neumann** [Wik] analizează starea de fapt a calculatoarelor și scrie în **1945** un raport intitulat „*First Draft of a Report on the EDVAC*” (Prima schiță a unui raport despre **EDVAC – Electronic Discrete Variable Automatic Computer**), în care sugerează o arhitectură revolutionară care să transpună în realitate (implementează fizic) mașina universală de calcul Turing. În această arhitectură, programul nu mai este reprezentat de felul în care sunt cuplate unitățile funcționale, ci este stocat în memorie, fiind descris folosind un limbaj numit cod-mașină. În cod-mașină, operațiile de executat sunt codificate sub forma unor numere numite *instrucțiuni*. El a recomandat sistemul binar pentru memorarea datelor și a propus instrucțiuni de control a acestora. Programul de executat este descris printr-un sir de instrucțiuni, care se execută consecutiv. Von Neumann a introdus ideea grupării instrucțiunilor în subrute care să fie apelate repetat. Subrutele des folosite nu trebuiau reprogramate pentru fiecare nou program ci puteau fi păstrate în *biblioteci* și citite din memorie atunci când erau necesare. Pe lângă unitățile funcționale care execută operații aritmetice, calculatorul mai are o unitate de control, care *citește secvențial instrucțiunile programului și care trimite semnale între unitățile funcționale pentru a executa aceste instrucțiuni*. *Rezultatele intermediare sunt stocate în memorie*. Această arhitectură se numește „**von Neumann**”. Marea majoritate a calculatoarelor din ziua de azi sunt bazate pe această arhitectură; noțiunea de limbaj-mașină, și cea înrudită, de limbaj de programare, folosite pentru descrierea programelor, sunt concepte foarte naturale pentru toți cei care manipulează calculatoarele. Von Neumann propune **calculatorul** să fie văzut ca sistem de procesare a informației (bazat pe procesor – CPU), adică un **mecanism care direcționează dar și realizează procesarea informației**.

(interacționează cu instrucțiuni și date preluate de la intrare și produce rezultate la ieșire).

Cunoștințele anterior dobândite (o bogată colecție de circuite logice combinaționale și secvențiale) vor permite implementarea și funcționarea logică-fizică a modelului arhitectural von Neumann. Figura 5.1 ilustrează structura de bază a calculatorului (arhitecturii de procesare) propusă de von Neumann pentru execuția programelor.

Se disting cinci componente principale:

- ◆ **Memoria**: reține atât instrucțiuni cât și date.
- ◆ **Unitatea de procesare**: execută instrucțiunile din programe.
- ◆ **Unitatea de control**: parcurge secvențial și interpretează instrucțiunile, controlând fluxul de execuție al programelor.
- ◆ **Unitatea de intrare date (Input)**: permite introducerea datelor din exterior în memoria calculatorului.
- ◆ **Unitatea de ieșire (Output)**: produce rezultatul generat de program pentru utilizator.



**Figura 5.1.** Modelul arhitectural von Neumann

Memoria are două caracteristici importante: **capacitatea** (este de dorit a fi cât mai mare) și **timpul de acces** (este de dorit a fi cât mai mic), parametrii cu tendințe antagoniste. Practic, cu cât capacitatea memoriei crește, cu atât scade timpul de acces la memorie și se ieftinește prețul per unitate de octet memorat. Creșterea decalajului dintre viteza procesoarelor și timpul de acces la memorie impune introducerea unui sistem ierarhic de memorie, pentru a nu face simțită la nivelul performanței globale a sistemului încetineala cu care se accesează memoria [Vin00].

Fiecare locație de **memorie** este caracterizată de *adresă* și *conținut*. **Adresa** reprezintă o secvență binară (*pattern* de biți) care identifică **în mod**

**unic** o locație de memorie. **Conținutul** reprezintă valoarea (*patternul* de biți) stocat la respectiva adresă. Numărul total de locații de memorie disponibile formează *spațiul de adrese*. Calculatoarele LC-2 și LC-3 dispun de un spațiu de adrese de  $2^{16}$  locații (magistrala de adrese este pe 16 biți). Uzual, calculatoarele actuale sunt dotate cu o memorie principală (centrală) de tip RAM de capacitate 1 GByte ( $2^{32}$  adrese, la fiecare adresă existând un cuvânt de 8 biți). **Adresabilitatea** constituie numărul de octeți de date (cuvânt de memorie – *word*) disponibili la o anumită adresă și utilizati de către unitatea de procesare. În mod frecvent, o instrucțiune trebuie să scrie sau să citească un întreg cuvânt (word) la fiecare acces în memorie. Accesarea memoriei se realizează prin intermediul celor doi regiștri MAR și MDR. MAR (registrul de adresă al memoriei) este încărcat cu valoarea adresei de la care sau la care se va citi sau scrie din / în memorie. Valoarea din MAR va fi depusă pe decodificatorul de adrese al memoriei. Pentru instrucțiunile care citesc date din memorie (de tip *load*) conținutul memoriei se încarcă în MDR (registrul de date al memoriei). Pentru instrucțiunile de scriere în memorie (de tip *store*), în MDR se înscrie valoarea ce va fi stocată în memorie la activarea semnalului *WriteEnable*.

Pentru o mai bună înțelegere a noțiunilor de adresă de memorie și respectiv conținutul memoriei, se consideră următorul exemplu: *fie o memorie de tipul* ( $2^3 \times 3$ -biți) *a cărei locații sunt numerotate de la adresa*  $000_2$  *la*  $111_2$ . *În această memorie la adresa*  $110_2$  *se află cuvântul*  $000_2$  *iar la adresa*  $000_2$  *se află cuvântul de date*  $001_2$ . Se reamintește că, adresele sunt unice (nu pot exista două locații distincte caracterizate de aceeași adresă). Însă, conținuturile a două sau mai multe locații pot coincide.

| Adresa  | Conținut |
|---------|----------|
| $000_2$ | $001_2$  |
| $001_2$ |          |
| $010_2$ |          |
| $011_2$ |          |
| $100_2$ |          |
| $101_2$ |          |
| $110_2$ | $000_2$  |
| $111_2$ |          |

**Unitatea de procesare** reprezintă motorul de execuție al programului. Este compusă din mai multe unități, fiecare îndeplinind o anumită funcție complexă (de la adunări, scăderi la înmulțiri, împărțiri, extrageri de rădăcină pătrată, etc). O unitate de procesare minimală conține o **unitate aritmetică** –

**logică** (ALU) și un **set de regiștri de uz general**. Numărul de biți ai datei cu care operează unitatea de procesare se numește dimensiunea cuvântului de date (*word size*) al mașinii (arhitecturii). ALU realizează operațiile aritmetico-logice de bază (adunare / scădere / AND / NOT) în general pe întregul cuvânt de date (word) dar uneori și pe subdiviziuni ale acestuia (octet, bit). Procesorul MIPS are cuvântul de date pe 32 de biți dar instrucțiunile acestuia pot opera și pe octet (byte), semicuvânt (*halfword*). Cuvântul de date la LC-2 este pe 16 biți, la Intel Pentium IV pe 32 de biți, la Intel Itanium, PowerPC și Alpha Compaq pe 64 de biți. Procesoarele din sistemele dedicate (telefoane celulare, mașini de spălat, frigidere, copiatoare, imprimante, etc) necesită cuvinte de date pe doar 8 biți. Valorile cu care operează unitatea aritmetico-logică sunt stocate în zone de memorie de capacitate foarte redusă și caracterizate de viteza de operare (citire/scriere/deplasare/rotire) foarte ridicată – regiștrii procesorului. LC-2 deține 8 regiștri ( $R_0 \dots R_7$ ) fiecare pe 16 biți, arhitectura Alpha ISA deține 32 de regiștri fiecare pe 64 de biți, procesoarele MIPS R2000, R3000 dețin 32 de regiștri pe 32 de biți fiecare (MIPS R16000 are 64 regiștri care pot lucra cu date atât pe 64 cât și pe 32 de biți).

**Unitatea de control** coordonează toate acțiunile necesare pentru execuția instrucțiunilor: **extragă** (*instruction fetch*) din memorie (sau din cache-ul de instrucțiuni) instrucțiunea, o decodifică (*decode*), preia operanții corespunzători din regiștri sau memorie (*operand fetch*) și o execută (*execute*). Folosește doi regiștri de interfață cu memoria: *PC* (*program counter*) – în alte arhitecturi poartă denumirea de *instruction pointer*, reține adresa următoarei instrucțiuni care va fi adusă din memorie și *IR* (*instruction register*) păstrează instrucțiunea curentă care se execută.

**Unităile de intrare / ieșire** sunt cunoscute sub numele generic de dispozitive **periferice** nu din cauză că sunt mai puțin importante pentru procesor ci datorită poziției acestor dispozitive față de CPU. În cazul calculatorului (simulatorului) LC-3 (LC-2) dispozitivul de intrare îl reprezintă tastatura cu regiștri de interfață (KBDR – de date și KB8R – de stare) iar dispozitivul de ieșire este monitorul cu regiștri de interfață (CRTDR – de date și CRTSR – de stare). Evident că există o varietate de dispozitive de intrare (mouse, scanere digitale, stick-uri USB, dischete, etc) și de ieșire (imprimante, ecrane cu cristale lichide, harddisk).

## 5.2. PRINCIPIILE PROCESĂRII INSTRUCȚIUNILOR

Ideea centrală a modelului de procesare propus de *von Neumann* evidențiază faptul că atât instrucțiunile cât și datele sunt memorate ca și secvențe de biți, în memoria calculatorului, programul fiind executat succesiv (*pas-cu-pas*) câte o instrucțiune la un moment dat în funcție de direcția indicată de unitatea de control.



**Figura 5.2.** Calculatorul LC-3 văzut ca un model de procesare *von Neumann*  
[Pal07]

După cum se poate observa în figura 5.2, nucleul central („*inima*”) al unității de control îl reprezintă un automat cu număr finit de stări care stabilește starea și ieșirea automatului și a circuitelor logice conform cu fiecare tip de instrucțiune (selecția regiștrilor sursă/destinație, tipul operației: cu registru sursă sau cu valoare imediată, tipul instrucțiunii: de salt necondiționat sau apel de subrutină, etc). Procesul este controlat de către ceasul sistemului. Automatul cu număr finit de stări efectuează câte o tranziție („*ciclu mașină*”) la fiecare impuls de tact (perioada de tact este egală cu inversul frecvenței procesorului  $T_{CLK} = \frac{1}{f_{CLK}}$ ).

### 5.2.1. CICLUL INSTRUCȚIUNII

Văzută din exterior instrucțiunea reprezintă unitatea atomică (fundamentală) a unui program. Cu toate acestea instrucțiunea este divizată pe câmpuri de către unitatea de control și interpretată permîțându-se apoi execuția ei. În cadrul procesoarelor RISC (MIPS, Alpha, PowerPC) formatul instrucțiunilor este de lungime fixă (uzual 32 de biți). Fiecare instrucțiune este caracterizată de două câmpuri de bază:

- **Codul operației (opcode):** specifică operația ce se va executa.
- **Operanții:** sursa respectiv destinația instrucțiunii.

Setul de instrucțiuni al calculatorului, formatul acestora, setul de regiștri, tipurile de date utilizate și modurile de adresare (mecanismul prin care calculatorul / procesorul localizează operanții) constituie arhitectura setului de instrucțiuni (ISA).

Succesiunea de etape prin care trece instrucțiunea de la aducerea ei din memorie până la încheierea execuției sale se numește **ciclul instrucțiunii**. Von Neumann a propus șase etape (faze de procesare ale instrucțiunii):

- ♦ **Fetch:** aduce instrucțiunea din memorie de la adresa dată de registrul PC și o depune în registrul instrucțiunii (IR). Chiar și această etapă poate fi divizată în subetape:
  - (1) Conținutul registrului PC se depune în MAR ( $MAR \leftarrow (PC)$ ).
  - (2) Automat PC-ul este incrementat pentru a pointa spre adresa următoarei instrucțiuni ( $PC \leftarrow (PC) + I$ ).
  - (3) Se citește instrucțiunea din memorie odată cu accesarea semnalului READ ( $MDR \leftarrow Mem[MAR]$ ).
  - (4) Instrucțiunea se depune din registrul de date al memoriei în IR ( $IR \leftarrow (MDR)$ ).

Dacă subetapele (1), (2) și (4) necesită un singur ciclu de tact (operații foarte rapide de transfer sau adunare), subetapa (3) poate dura mai mult în funcție de decalajul în timp dintre timpul de acces la memorie și viteza procesorului.

- **Decode:** este identificată operația ce va avea loc și sunt stabiliți operanții (registrii sursă și cel destinație). Opcode-ul este depus pe intrarea unui decodificator care va decide secvența de evenimente solicitate de instrucțunea în cauză.
- **Evaluate address:** în cazul instrucțiunilor cu operand în memorie este calculată adresa acestuia (cunoscută sub numele de adresă efectivă – *effective address*).
- **Fetch operands:** sunt determinați operanții sursă pentru execuția instrucțiunilor – fie din setul de registrii generali ai procesorului fie din memorie. Registrii sursă vor deveni operanți de intrare pentru unitatea aritmetică-logică sau pentru memorie. Pentru operandul stocat în memorie este folosită adresa efectivă (EA), calculată la pasul anterior (evaluate address).
- **Execute:** se execută operația codificată în instrucție. De exemplu, pentru instrucțiunile aritmetico-logice se adună/scade etc., cei doi operanți (registrator cu registrator sau registrator cu valoare imediată). Dacă instrucțunea este de ramificație (modifică fluxul de control al programului) atunci registrator PC este actualizat cu o nouă valoare – adresa destinație a instrucției de salt. Pentru instrucțiunile de transfer cu memoria (*load / store*) în această fază nu se face nimic.
- **Store results:** scrie rezultatul instrucției în destinația corespunzătoare (în registrator sau în memorie). Adresa efectivă anterior calculată va indica de unde se aduce rezultatul sau unde se scrie în memorie.

O observație care rezultă se referă la faptul că nu toate instrucțiunile necesită toate cele 6 faze de procesare. Pentru instrucțiunile care folosesc doar registrii (formatul R-tip la instrucțiunile procesoarelor RISC) faza *Evaluate Address* poate fi sărită (*skip*). Pentru instrucțiunile cu referire la memorie (formatul I-tip la instrucțiunile procesoarelor RISC cu mod de adresare indirect registrator și nu indexat) poate fi evitată faza *Execute*. De asemenea, nu toate fazele de procesare necesită același număr de perioade de tact.



Figura 5.3 Ciclul instrucțiunii în concepția lui von Neumann

După cum se poate observa în figura 5.3 unitatea de control repetă ciclul instrucțiunii pentru toate instrucțiunile din program, ghidată de valoarea registrului PC. Întrucât valoarea acestuia este incrementată pe durata fazei *fetch* sau este actualizată de instrucțiunile de ramificație și control pe durata fazei *execute* rezultă că în fiecare moment se cunoaște adresa următoarei instrucțiuni. La fel ca și în cazul structurilor de date cu legături (liste, arbori), cunoscând adresa primei instrucțiuni se poate trece la execuția întregului program.

Deși nu toate tipurile de instrucțiuni necesită toate cele șase faze de procesare și, în ciuda tehnicii avansate de execuție din cadrul procesoarelor *pipeline*<sup>4</sup> *superscalare* care presupun până la 20 și chiar 31 de nivele pipeline de procesare (vezi Intel Pentium 4 versiunile Northwood și Prescott), fazele de procesare propuse de von Neumann (v.N) au rămas

<sup>4</sup> Tehnica de procesare *pipeline* reprezintă o tehnică de procesare paralelă a informației prin care un proces secvențial este divizat în subprocese, fiecare subproces fiind executat într-un segment special dedicat și care operează în paralel cu celelalte segmente. Fiecare segment execută o procesare parțială a informației. Rezultatul obținut în segmentul *i* este transmis în tactul următor spre procesare segmentului (*i*+1). Rezultatul final este obținut numai după ce informația a parcurs toate segmentele, la ieșirea ultimului segment. Denumirea de pipeline provine de la analogia cu o bandă industrială de asamblare. Este caracteristic acestor tehnici faptul că diversele procese se pot afla în diferite faze de prelucrare în cadrul diverselor segmente, simultan.

actuale și în ziua de azi. Din punct de vedere al performanței sistemelor de calcul, evoluția de la modelul de procesare propus de von Neumann la cele actuale constă în următorul fapt: modelul inițial (v.N) presupunea că instrucțiunile sunt executate secvențial, una câte una; doar după ce o instrucțiune aflată în curs de execuție a efectuat faza *store result* o alta poate efectua faza *fetch*. Procesoarele moderne presupun un paralelism atât temporal de tip pipeline (mai multe faze de procesare aferente unor instrucțiuni diferite executate în același timp) cât și unul spațial de tip *superscalar* (mai multe unități de execuție aferente aceleiași faze de procesare).

### **5.2.2. TIPURI DE INSTRUCȚIUNI**

Calculatorul (simulatorul) LC-3 deține un set de 16 instrucțiuni, astfel încât câmpul *opcode* este codificat pe 4 biți. De asemenea, zona temporară de stocare din cadrul unității de procesare (reșterii procesorului) constă din 8 locații (R0-R7). Codificarea operanzilor (sursă, destinație) în corpul instrucției se face pe 3 biți per operand. Se disting trei mari categorii de instrucțiuni [Patt03]:

- *Operational* (instrucțiuni de procesare a datelor – aritmetico-logice)

|     |    |     |    |      |    |   |   |   |   |      |   |   |   |   |   |
|-----|----|-----|----|------|----|---|---|---|---|------|---|---|---|---|---|
| 15  | 14 | 13  | 12 | 11   | 10 | 9 | 8 | 7 | 6 | 5    | 4 | 3 | 2 | 1 | 0 |
| ADD |    | Dst |    | Src1 |    | 0 | 0 | 0 |   | Src2 |   |   |   |   |   |

|    |    |    |    |    |    |   |   |   |   |   |   |   |   |   |   |
|----|----|----|----|----|----|---|---|---|---|---|---|---|---|---|---|
| 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
| 0  | 0  | 0  | 1  | 1  | 1  | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 1 | 0 |

**Figura 5.4.** Exemplu de instrucțiune de adunare la calculatorul LC-3

Semantica instrucției din figura 5.4 este următoarea: ADD R6, R2, R6 sau “Adună conținutul registrului R2 la conținutul registrului R6 și stochează rezultatul în registrul R6.”

- *Instrucțiuni de transfer date (transfer de date între memorie și registrii procesorului)*

Pentru exemplificare se consideră instrucțiunea LDR (încarcă o dată de la o locație de memorie într-un registru al procesorului). Adresa de memorie se determină printr-o adunare dintre un registru de bază și un deplasament (*offset*). Este întâlnită în cazul instrucțiunilor din programele de nivel înalt care prelucrează structuri de date omogene (vectori, matrici).

| 15  | 14 | 13 | 12 | 11  | 10 | 9    | 8 | 7      | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
|-----|----|----|----|-----|----|------|---|--------|---|---|---|---|---|---|---|
| LDR |    |    |    | Dst |    | Base |   | Offset |   |   |   |   |   |   |   |
| 0   | 1  | 1  | 0  | 0   | 1  | 0    | 0 | 1      | 1 | 0 | 0 | 0 | 1 | 1 | 0 |

**Figura 5.5.** Exemplu de instrucțiune de aducere din memorie la calculatorul LC-3

Semantica instrucțiunii din figura 5.5 este următoarea: LDR R2, 6(R3) sau “Adună valoarea 6 la conținutul registrului R3 pentru a forma adresa de memorie. Încarcă data din memorie de la adresa calculată în registrul R2.”

- De *Control* (Instrucțiuni de ramificație sau modificare a fluxului de execuție al programului). În cadrul acestei categorii se încadrează instrucțiunile de salt condiționat, necondiționat, indirekte, de apel de subroutines.

Teorema lui Böhm-Jacopini afirma că orice program (de nivel înalt) poate fi descris folosind structuri secvențiale, alternative și repetitive. Astfel, dacă nu apare în cadrul programului nici o structură alternativă (*if/else*, *switch/case*) sau repetitivă (*repeat*, *while*, *for*) în faza FETCH unitatea de control aduce câte o instrucțiune de la adresa dată de PC și îi incrementează apoi valoarea acestuia. Instrucțiunile de ramificație din programele asamblare poartă numele de *jump-uri* (*salturi*) sau *branch-uri*. Jump-urile sunt necondiționate (modifică întotdeauna PC-ul) iar branch-urile sunt condiționate (modifică PC-ul doar dacă o condiție logică este îndeplinită, spre exemplu dacă conținutul unui registru este egal cu 0). Pentru aceste instrucțiuni pe durata fazei EXECUTE este actualizat PC-ul cu adresa destinație a saltului.

Pentru exemplificare se consideră instrucțiunea JMPR (încarcă PC-ul cu valoarea obținută prin adăugarea unui offset la conținutul unui registru al procesorului. Valoarea care se încarcă în PC reprezintă adresa instrucțiunii de la care se continuă procesarea).

| 15   | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7    | 6 | 5      | 4 | 3 | 2 | 1 | 0 |  |  |
|------|----|----|----|----|----|---|---|------|---|--------|---|---|---|---|---|--|--|
| JMPR |    |    |    | 0  |    | 0 |   | Base |   | Offset |   |   |   |   |   |  |  |
| 1    | 1  | 0  | 0  | 0  | 0  | 0 | 0 | 1    | 1 | 0      | 0 | 0 | 1 | 1 | 0 |  |  |

**Figura 5.6.** Exemplu de instrucțiune de salt necondiționat la calculatorul LC-3

Semantica instrucțiunii din figura 5.6 este următoarea: JMPR R3, #6 sau “Adună valoarea 6 la conținutul registrului R3 și încarcă rezultatul obținut în registrul PC.”

### 5.2.3. CEASUL PROCESORULUI

Motorul întregii activități de procesare a instrucțiunilor îl reprezintă semnalul de ceas. Ceasul sistemului este semnalul care „ține unitatea de control în mișcare”. La fiecare impuls de tact (ceas) unitatea de control tranzitează la următorul ciclu mașină (următoarea instrucțiune sau următoarea fază din instrucțiunea curentă) – vezi figura 5.7.



**Figura 5.7.** Ciclul instrucțiunii văzut ca un automat cu număr finit de stări

Circuitul generator de semnal de tact este bazat pe un cristal de cuarț oscilator, care generează secvențe regulate de nivele logice „0” și „1”. Perioada de tact se determină între două fronturi ascendente ale semnalului de ceas (vezi figura 5.8b).

### Oprirea sistemului de calcul

Programele utilizator se încheie prin transferarea controlului sistemului de operare (cea mai importantă aplicație software care rulează pe un sistem de calcul și care are printre funcțiile sale pe cea de gestionare a procesorului și a celorlalte resurse hardware). În continuare, sistemul de operare „intră într-o buclă de aşteptare” până când este lansată o nouă

aplicație utilizator. În tot acest timp, unitatea de control este activă și parurge ciclul instrucțiunii aferent instrucțiunilor componente programelor utilizator sau a celor aparținând sistemului de operare. Oprirea sistemului de calcul presupune oprirea unității de control, deci anularea semnalului de tact care reprezintă „pulsul” sistemului. Acest lucru se realizează printr-o operație de *SI logic* cu un generator de semnal „0”- logic (vezi figura 5.8a). Generatorul de semnal „0” este un bistabil de tip R-S pe a cărui intrări R și S se setează valorile 0 și 1 (R=0 și S=1).



Figura 5.8. Oprirea sistemului de calcul

### 5.3. EXERCIȚII ȘI PROBLEME

- Pentru această problemă, se consideră o memorie cu 8 locații, având cuvântul de date pe 3 biți ( $2^3 \times 3$  biți), așa cum se poate observa mai jos. Conținutul memoriei este următorul:

|     |     |
|-----|-----|
| 101 | 000 |
| 001 | 001 |
| 011 | 010 |
| 111 | 011 |
| 110 | 100 |
| 010 | 101 |
| 000 | 110 |
| 100 | 111 |

a) Știind că fiecare bit de memorie este reținut folosind un bistabil de tip D, câți astfel de bistabili sunt necesari pentru implementarea memoriei respective?

b) Presupunând că se începe citirea din memorie la locația **000** și că fiecare valoare citită din memorie de la adresa curentă reprezintă adresa următoarei locații de unde se va citi, indicați sirul primelor 8 valori citite din memorie.

2. Se consideră următorul format de instrucțiune pe 32 de biți, alcătuit din *OPCODE*, câmp pentru codificarea registrului destinație (*DR*), câmp pentru codificarea registrului sursă (*SR*) și un câmp pentru valoarea imediată (*IMM*).

|        |    |    |     |
|--------|----|----|-----|
| OPCODE | DR | SR | IMM |
|--------|----|----|-----|

Dacă sunt implementate 60 de coduri de operație (opcodes) și 16 registrii, care este cel mai mare număr pozitiv care poate fi reprezentat în câmpul IMM? (Se presupune că IMM este un număr în complement față de 2).

3. Se consideră o arhitectură de procesare care urmează modelul propus de Von Neumann (în care se specifică faptul că fiecare instrucțiune trebuie să-și încheie execuția (*store result*) înainte de aducerea altrei instrucțiuni din memorie (*fetch instruction*)). Presupunând că, în medie o instrucțiune necesită 1.2 ciclii de tact pentru fază FETCH, 1 ciclu pentru decodificare (DECODE), 1 ciclu pentru evaluarea adresei operanților (EVALUATE ADDRESS), 1.8 ciclii de tact pentru aducerea operanților (FETCH OPERANDS), 2 ciclii de tact pentru fază EXECUTE și 1 ciclu pentru scrierea rezultatului în setul de registri ai procesorului (STORE RESULT). Câte instrucțiuni sunt executate într-o secundă de un procesor care rulează la o frecvență de 2.5 GHz ?

4. Se cunoaște că frecvența unui calculator (procesor) este invers proporțională cu perioada sa de tact. Altfel spus,  $Frecvență = 1 / \text{Perioada\_de\_tact}$ . De exemplu, un procesor la 1 GHz are perioada de tact de 1 ns ( $10^{-9}$  s). Considerăm trei tipuri mari de instrucțiuni:

cu acces la memorie (load/store), aritmetico-logice (Add/And/Or, etc) și altele (grupa instrucțiunilor de ramificație). O instrucțiune poate necesita mai mulți ciclii pentru execuție. Astfel, instrucțiunile cu referire la memorie durează 12 ciclii de tact, cele aritmetico-logice 9 ciclii de tact, în timp ce cele de ramificație necesită 10 ciclii de tact. Frecvența medie de apariție pe tipuri de instrucțiuni este ilustrată în următorul tabel:

| Tipul Instrucțiunii                 | Frecvența de apariție [%] |
|-------------------------------------|---------------------------|
| Instrucțiuni cu referire la memorie | 40%                       |
| Instrucțiuni aritmetico-logice      | 40%                       |
| Alte instrucțiuni                   | 20%                       |

Determinați cât timp (s) durează execuția unui program având 650.000 de instrucțiuni pe un calculator ce rulează la o frecvență de 3.2 GHz.

5. Următorul tabel reprezintă o mică memorie. Pentru următoarele întrebări se va face referire la acest tabel.

| Adresa | Data  |
|--------|-------|
| 0000   | x1E43 |
| 0001   | xF025 |
| 0010   | x6F01 |
| 0011   | x0000 |
| 0100   | x0065 |
| 0101   | x0006 |
| 0110   | xFED3 |
| 0111   | x06D9 |

- Care este valoarea binară conținută în locația 3? Dar în locația 6?
- Valoarea binară conținută în fiecare locație de memorie poate fi interpretată în mai multe moduri: număr întreg în complement față de 2, număr flotant simplă sau dublă precizie, etc.
  - Interpretați locația 0 și locația 1 ca întregi cu semn în complement față de 2.
  - Considerând locația 4 ca fiind un cod ASCII, despre ce caracter este vorba ?

- b3) Interpretați locația 6 ca un număr flotant în două ipostaze: – 1 bit de *semn*, 7 biți de *exponent* și 8 biți de *fracție*, respectiv – 1 bit de *semn*, 5 biți de *exponent* și 10 biți de *fracție*.
- b4) Interpretați locația 5 ca un întreg fără semn.
- c) În modelul de procesare Von Neumann conținutul unei locații de memorie poate fi și o instrucțiune. Dacă acest lucru se întâmplă la locația 0, identificați instrucțiunea.
- d) O valoare binară poate fi interpretată și ca o adresă de memorie. Presupunând acest lucru la locația 5, ce adresă de memorie se indică prin conținutul acestei locații. Ce valoare binară conține respectiva locație?
6. Se consideră că simulatorul LC-3 urmează să efectueze faza **FETCH** aferentă instrucțiunii de la adresa specificată de registrul PC. Cunoscând configurația inițială a componentelor modelului von Neumann (unitatea de procesare – setul de regiștri generali, unitatea de control – registrul PC și unitatea de memorare – regiștri MAR și MDR și respectiv conținutul locațiilor de memorie) se cere să se determine conținutul fiecăreia dintre resursele indicate în figură după executarea de două ori a *ciclului instrucțiunii*. **Indicație:** Instrucțiunea de la adresa 0x3010 este una de adunare (ADD) iar cea de la adresa 0x3011 este ȘI Logic (AND).



## **6. LC-3 – ARHITECTURA SETULUI DE INSTRUCȚIUNI. CALEA FLUXULUI DE DATE. ORGANIZAREA MEMORIEI LA LC-3 [Patt03]**

### **6.1. LC-3 – ARHITECTURA SETULUI DE INSTRUCȚIUNI**

**Arhitectura Setului de Instrucții (ISA)** – reprezintă interfața dintre software (programele de aplicație / sistem de operare) și hardware-ul care îl execută. ISA specifică modul de organizare a memoriei (*spațiul de adresare*: zonă de date statice și dinamice, de cod, de stivă, zonă rezervată nucleului sistemului de operare, *adresabilitatea* – număr de biți stocați la fiecare locație), setul de regiștri, setul de instrucții, formatul instrucționii, tipurile de date utilizate și modurile de adresare (mecanismul prin care calculatorul / procesorul localizează operanții). Translatarea unui program de nivel înalt (fie acesta *C*, *Fortran*) în ISA-ul aferent calculatorului care va executa respectivul program (uzual IA-32) se realizează prin intermediul compilatorului.

Capitolul de față realizează trecerea de la partea hardware spre cea software a unui sistem de calcul. Astfel, este descrisă arhitectura setului de instrucții aferentă procesorului virtual (simulatorului) LC-3 (*Little Computer* versiunea 3) [Patt03] și vor fi analizate detaliat organizarea memoriei și calea fluxului de date respectiv control la LC-3.

Într-o altă definiție, ISA ar reprezenta totalitatea componentelor și operațiilor (*hardware* ale) unui calculator vizibile la nivelul programatorului (*software*). ISA pune la dispoziția proiectantului (hardware) de sisteme de calcul toate informațiile necesare pentru a putea construi un calculator conform modelului propus de *von Neumann*. Aceste informații sunt suficiente și pentru cineva care vrea să scrie un program în limbajul mașină al respectivului procesor sau să înțeleagă dacă un program scris în limbaj de nivel înalt a fost translatat corect în codul mașină al procesorului în cauză.

### **6.1.1. LC-3 ISA: ORGANIZAREA MEMORIEI ȘI SETUL DE REGIȘTRII GENERALI**

**Spațiul de memorie** aferent unui sistem de calcul este organizat în aşa fel încât să rețină **instrucțiunile** programelor utilizator, instrucțiunile programelor supervisor (aferente sistemului de operare) dar și **datele** prelucrate prin intermediul respectivelor programe.

După cum s-a mai precizat în capitolul anterior, arhitectura von Neumann a unui sistem de calcul pune la dispoziție doi regiștri de interfață procesor – memorie:

- Registrul de adresă al memoriei (MAR) care selectează prin intermediu unui decodificator de adresă locația de memorie care va fi scrisă sau citită.
- Registrul de date al memoriei (MDR) care reține data citită sau care se va scrie din / în memorie.

LC-3 reprezintă un procesor virtual pe 16 biți (fiecare instrucțiune este codificată pe 16 biți). De asemenea, memoria este adresată printr-un cuvânt<sup>5</sup> de 16 biți (busul de date fiind de 16 biți). În consecință, spațiul de memorie adresabil la LC-3 este de  $2^{16}$  locații = 65536 (64k) locații. Adresabilitatea la LC-3 este tot de 16 biți, de unde rezultă faptul că, LC-3 dispune de o memorie totală de  $64k \times 2^0 = 128ko$ . Spre deosebire de alte procesoare, LC-3 nu este adresabilă pe octet. Spațiul de memorie al LC-3 (pentru detalii a se vedea și figura 10.4 din capitolul 10) conține o zonă de cod utilizator (începând cu adresa 0x3000), zona de date globale, zona rezervată sistemului de operare (care include și instrucțiunile rutinelor de serviciu), zona de stivă (aferentă apelurilor de funcții din programele utilizator – variabile locale, parametrii, etc.).

Întrucât și din punct de vedere logic dar și fizic memoria diferă de (este situată în afara) unitatea de procesare, operațiile cu memoria consumă de cele mai multe ori mai mult decât un ciclu de tact procesor ( $>1T_{CPU}$ ). Aceste operații presupun întâi calculul adresei și apoi citirea sau scrierea datei, realizabile prin instrucțiuni *load – LDR* sau *store – STR*.

**Setul de regiștrii generali** alături de unitatea aritmetică-logică compun unitatea de procesare a oricărui sistem de calcul. Regiștrii procesorului constituie o resursă de memorare temporară de viteză foarte mare (accesul – scrierea și citirea – se face la viteza procesorului) dar de

<sup>5</sup> Cu toate că, la toate procesoarele octetul este format din 8 biți, numărul de biți care compun un cuvânt de date nu este identic la toate arhitecturile. Astfel, la LC-3 cuvântul (*word*) este pe 16 biți iar la procesorul MIPS R3000 este pe 32 de biți, informația stocată pe 16 biți numindu-se semi-cuvânt (*halfword*).

capacitate redusă. Pot fi accesăți pe timpul fazei de procesare *Fetch Operand* aferentă instrucțiunilor de tip Add, Load sau Store. LC-3 [Patt03] dispune de 8 regiștri generali  $R_0 \div R_7$ , fiecare pe 16 biți și trei regiștri booleeni de condiție ( $N$  – negativ,  $Z$  – zero,  $P$  – pozitiv) fiecare pe 1 bit, setați sau resetați de către instrucțiunile care au un registru destinație (aritmetico-logice și de citire din memorie). În fiecare moment, cel mult un registru de condiție este setat, bazat pe ultima instrucțiune care alterează un registru general. Un alt registru foarte important, indirect adresabil de către programator este PC (*Program Counter*), care reține adresa următoarei instrucțiuni. Prin instrucțiunile de salt și apel de / revenire din subrutină valoarea PC-ului poate fi alterată.

### 6.1.2. LC-3 ISA: FORMATUL INSTRUCȚIUNII ȘI SETUL DE INSTRUCȚIUNI

Se reamintește că unitatea de control a procesorului LC-3 [Patt03] dispune de 2 regiștri: PC și IR (registrator care reține instrucțiunea aflată în curs de procesare). Instrucțiunile procesorului LC-3 sunt codificate pe un singur cuvânt<sup>6</sup> de 16 biți și sunt compuse din două părți principale:

- ❖ **Opcode** (sau codul operației, reținut de cei mai semnificativi 4 biți ai registrului instrucțiunii – **IR[15:11]**). Rezultă practic  $2^4=16$  operații (instrucțiuni) distințe – un set foarte simplu. În general trebuie ales un compromis între un set de instrucțiuni complex, dar de cele mai multe ori redundant, caracterizat de un cost ridicat și un set optimizat de instrucțiuni la un cost mai mic (vezi clasificarea procesoarelor RISC – CISC [Vin03] care face obiectul cursului de *Organizarea și proiectarea microarhitecturilor*). Acest compromis se stabilește de cele mai multe ori pe baza simulării pe programe de test reprezentative (*benchmark-uri*).
- ❖ Cei mai puțini semnificativi 12 biți ai registrului instrucțiunii (**IR[11:0]**) specifică **operanții** (asupra cărora se aplică operația) conform **modului de adresare** aferent instrucțiunii:
  - **Regiștri**: câte 3 biți pentru fiecare operand – sursă și / sau destinație.
  - **Câmp generator de adresă (offset)** – pe 6, 9 sau 11 biți.
  - **Valoare imediată** – pe 5 biți.

<sup>6</sup> Există procesoare (de exemplu INTEL) cu instrucțiuni de lungime variabilă – pe unul sau mai multe cuvinte.

Singurul **tip de dată nativ** (implementat la) **LC-3** este tipul **întreg complement față de 2** pe 16 biți. Celelalte procesoare (de exemplu MIPS, INTEL) implementează și tipurile: întreg pe 8 biți cu și fără semn (*short / byte, byte / unsigned byte*), întreg pe 16 biți cu și fără semn (*int / unsigned int, halfword / unsigned halfword*), întreg pe 32 biți cu și fără semn (*long / unsigned long, word / unsigned word*), simplă precizie virgulă mobilă – pe 32 de biți (*float*) respectiv dublă precizie virgulă mobilă – pe 64 de biți (*double*).

**Modurile de adresare** specifică modul de localizare al operanzilor instrucțiunii. Prin convenție, **adresa efectivă (EA)** reprezintă locația de memorie a operandului. LC-3 [Patt03] suportă 5 moduri de adresare:

- **Imediat** (dacă operandul este localizat direct în instrucțiune).
- **Registru** (operanzii sursă sunt doi registri generali).
- **Memorie** (cu:
  - **Adresare directă** (sau relativă la PC): EA este codificată în corpul instrucțiunii și se obține printr-o însumare a PC cu câmpul generator de adresă pe 9 biți).
  - **Adresare indirectă**: În corpul instrucțiunii este codificat un pointer<sup>7</sup> spre EA: valoarea PC + câmp generator de adresă pe 9 biți formează adresa la care găsim adresa operandului (și nu operandul ca în cazul adresării directe).
  - **Adresare indexată** (sau relativă la o adresă de bază) – folosită în cazul instrucțiunilor de prelucrare ale tablourilor (structurile matriceale). EA se obține însumând adresa de bază stocată într-un registru general și un câmp generator de adresă pe 6 biți. Diferența dintre adresarea directă și cea indexată constă în faptul că, în cazul primeia, adresarea se face într-o zonă (NEAR) – apropiată PC-ului instrucțiunii de transfer date (+/- 256 instrucțiuni) iar în cazul celei de-a doua adresări, spațiul accesat poate fi (FAR) îndepărtat față de instrucțiunea de transfer (practic aproape oriunde în zona de cod utilizator).

Pe scurt, setul de instrucțiuni aferent LC-3 ISA cuprinde:

- ❖ **Instrucțiuni operaționale**, care manipulează direct date. Din această categorie fac parte cele aritmetico-logice (ADD, AND și NOT).
- ❖ **Instrucțiuni de transfer date**:
  - a) între memorie și registrii procesorului
    - citire din memorie (LD, LDI și LDR)

<sup>7</sup> Termenul de *pointer* a fost preluat în limba română și poate fi folosit cu sensul de referință, indicator de adresă, localizator. Pentru detalii studiați capitolul 12.

- scriere în memorie (ST, STI și STR)
  - încărcarea unei adrese de bază într-un registru destinație (LEA). Spre deosebire de cele 6 instrucțiuni anterioare, LEA nu accesează memoria.
- b) între memorie / regiștri și *porturi* (regiștri de interfață ai dispozitivelor periferice – regiștri de stare sau de date ai tastaturii sau ai monitorului – vezi pentru detalii capitolul 8 *Întreruperi software*).

**Instrucțiuni de control** (salt condiționat / necondiționat, direct / indirect și respectiv apel / revenire de / din subrutină, întreruperi software): BR, JMP / RET, JSR / JSRR, TRAP, RTI. Efectul tuturor acestor instrucțiuni este de a modifica cursul programului (fluxul de execuție). Practic, indirect se modifică PC-ul (adresa următoarei instrucțiuni de executat din program).

#### 6.1.2.1. LC-3 ISA: INSTRUCȚIUNI OPERAȚIONALE

LC-3 implementează doar trei instrucțiuni aritmetico-logice: ADD, AND și NOT. Operanții destinație ai acestora sunt regiștrii generali ai procesorului dar semnul acestuia va seta și unul din cei trei regiștri booleani (N, Z sau P) resetându-i pe ceilalți doi. Aceste instrucțiuni nu referă zone de memorie. La LC-3 ISA nu există posibilitatea adunării conținutului unei locații de memorie cu o valoare imediată și stocării rezultatului înapoi în memorie prin intermediul unei singure instrucțiuni ca la IA-32 ISA. Acest lucru poate fi realizat printr-o secvență de trei instrucțiuni: una de citire din memorie, una de adunare și una de scriere înapoi în memorie.

Instrucțiunile ADD și AND pot opera și în modul imediat de adresare. Pentru fiecare din instrucțiunile setului LC-3 ISA sunt ilustrate grafic codificarea și succesiunea de operații efectuate (vezi figurile 6.1 ÷ 6.14) pentru execuția cu succes a instrucțiunilor.

LC-3 nu implementează (încă! – poate la versiunile viitoare) instrucțiunile aritmetice mari consumatoare de timp – înmulțirea și împărțirea, ci doar instrucțiunea de adunare (deoarece se operează cu numere întregi în Complement față de 2 nu este necesară implementarea scăderii, aceasta fiind de fapt o adunare cu inversul operandului). Întrucât s-a arătat în capitolul 3 (vezi și [Patt03]) „completitudinea porților SI-NU” –adică prin intermediul acestor porți pot fi implementate oricare operații logice – LC-3 ISA oferă doar instrucțiunile NOT și AND, celelalte instrucțiuni (OR, XOR) existente la alte arhitecturi (MIPS, INTEL) putând

fi realizate prin combinații ale instrucțiunilor NOT și AND (vezi spre rezolvare problemele 9 și 10 de la sfărșitul acestui capitol).

În continuare, prin **Reg** identificăm setul de regiștri generali ai procesorului, câmpul **Dst** substituie codul (iar  $\text{Reg}[\text{Dst}]$  numele) registrului destinație iar câmpul **Src** substituie codul (iar  $\text{Reg}[\text{Src}]$  numele) registrului sursă. De asemenea, **BaseR**, folosit în cazul instrucțiunilor de transfer cu mod de adresare indexat codifică registrul de bază (adresa de început de pagină sau zona de memorie utilizator supusă atenției – începutul unui tablou unidimensional), de la care se va face un acces relativ în acea pagină.

### Instrucțiunea NOT

**NOT Reg[Dst], Reg[Src]**

NOT reprezintă un operator unar (are un singur operand sursă). După cum se poate vedea și din figura 6.1, registrul destinație este dat de câmpul IR[11:9] iar registrul sursă de câmpul IR[8:6], restul bitilor fiind 1 (IR[5:0]).

Semantica instrucțiunii ( $\text{Reg}[\text{Dst}] \leftarrow \text{NOT } \text{Reg}[\text{Src}]$ ) presupune inversarea fiecărui bit al registrului sursă (transformarea în complement față de 1) și copierea pe poziția corespunzătoare în registrul destinație. Registrul sursă rămâne nemodificat în urma execuției instrucțiunii. De menționat că sursa și destinația pot referi același regisztr.

**Exemplu:**

NOT R2, R6

| 15  | 14 | 13 | 12 | 11 | 10  | 9   | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
|-----|----|----|----|----|-----|-----|---|---|---|---|---|---|---|---|---|
| NOT | 1  | 0  | 0  | 1  | Dst | Src | 1 | 1 | 1 | 1 | 1 | 1 |   |   |   |

**Setul de regiștri generali**



**Figura 6.1.** Codificarea instrucțiunii NOT și succesiunea de operații efectuate în cazul acesteia

La începutul fazei de *decodificare* câmpul IR[8:6] va ataca setul de registri generali de unde, pe timpul fazei *fetch operand*, registrul sursă *Src* va ataca o intrare a unității aritmetico-logice (ALU). Prin intermediul opcode-ului (IR[15:12]) se atacă simultan automatul cu stări finite (vezi figura 6.17 iar pentru detalii subcapitolul 4.2) – care va genera comanda (semnalul) NOT pentru unitatea ALU. Declanșarea acestuia (NOT) se realizează în faza de *execuție* urmată apoi de scrierea rezultatului în setul de registri generali (pe timpul fazei *scriere rezultat*).

### Instrucțiunile ADD/AND

**ADD Reg[Dst], Reg[Src1], Reg[Src2]** sau     **ADD Reg[Dst], Reg[Src1], Imm5**  
și

**AND Reg[Dst], Reg[Src1], Reg[Src2]** sau     **AND Reg[Dst], Reg[Src1], Imm5**

Instrucțiunile ADD/AND au modul de operare similar. Sunt operații binare (au doi operanzi sursă – fie doi registrii, fie un registru și o valoare imediată). Registrul destinație este identificat prin câmpul IR[11:9] iar unul dintre registrii sursă prin câmpul IR[8:6]. Dacă modul de adresare este imediat atunci bitul IR[5] = 1 iar câmpul IR[4:0] specifică valoarea imediată, pe 5 biți, căreia i se va extinde semnul pe 16 biți obținându-se un număr întreg în complement față de 2. Se reamintește că, operațiile aritmetico-logice se efectuează cu operanzi de dimensiuni egale în număr de biți. Semantica celor două instrucțiuni este următoarea:

$\text{Reg}[\text{Dst}] \Leftarrow^8 \text{Reg}[\text{Src1}] + \text{SEXT}(\text{Imm5})$  – în cazul adunării și respectiv

$\text{Reg}[\text{Dst}] \Leftarrow \text{Reg}[\text{Src1}] \text{ AND } \text{SEXT}(\text{Imm5})$  – în cazul operației de *ȘI logic*

De exemplu, inițializarea unui registru cu 0 rezultă în mod natural printr-o instrucțiune care face AND cu valoarea 0. De exemplu, în cazul instrucțiunii AND R2, R2, #0, deși valoarea 0 este pe 5 biți reprezentată în registrul instrucțiunii, prin extensia semnului (care este tot 0) rezultă 0 pe 16 biți. Simbolul "#" (a se citi *diez*) semnifică faptul că valoarea ce îi urmează va fi în sistemul zecimal de numerație. O altă posibilitate ar fi fost precedarea valorii de sirul „0x” care sugerează o valoare în sistemul hexazecimal de numerație.

<sup>8</sup> Simbolul  $\Leftarrow$  are rolul de atribuire a valorii expresiei din dreapta sa variabilei din stânga sa.



**Figura 6.2.** Codificarea instrucțiunilor ADD/AND cu mod de *adresare imediat* și succesiunea de operații efectuate în cazul acestora

Dacă modul de adresare este regisru atunci bitul IR[5] = 0, biții IR[4:3] sunt și ei 0 iar câmpul IR[2:0] specifică cel de-al doilea regisru sursă. Semantica celor două instrucțiuni este următoarea:

Reg[Dst]  $\leq$  Reg[Src1] + Reg[Src2] – în cazul adunării și respectiv

Reg[Dst]  $\leq$  Reg[Src1] AND Reg[Src2] – în cazul operației de *ȘI logic*



**Figura 6.3.** Codificarea instrucțiunilor ADD/AND cu mod de *adresare prin regisru* și succesiunea de operații efectuate în cazul acestora

**Exemple:**

ADD R1, R4, R5  
AND R2, R3, R6

Figura 6.4 descrie modul de lucru al instrucțiunii: ADD R1, R4, # -2 (decrementare cu 2). Astfel, pe o intrare a unității ALU se va regăsi valoarea din R4 iar pe cealaltă valoarea (-2) reprezentată în complement față de 2. Prin intermediul opcode-ului automatul cu stări finite generează comanda (semașul) ADD, efectuându-se apoi adunarea și rezultând valoarea finală ( $6 - 2 = 4$ ) în R1 (registratorul destinație).

De menționat că, LC-3 este implementat ca un procesor cu set optimizat de instrucțiuni (nu implementează instrucțiuni pentru scădere, pentru incrementare / decrementare sau pentru transferul valorilor dintr-un registru într-altul). Totuși, setul redus de regiștri generali nu permite cablarea unui registrator ( $R_0$ ) la masă, cum fac alte procesoare RISC [Flo03].



**Figura 6.4** Exemplu de adunare cu mod de adresare imediat

### **6.1.2.2. INSTRUCȚIUNI CU REFERIRE LA MEMORIE (DE TRANSFER DATE)**

Întrucât LC-3 pune la dispoziție trei moduri de adresare pentru localizarea datelor în memorie rezultă trei opcode-uri distincte pentru încărcarea datelor din memorie într-un registru: LD (*load direct*), LDI (*load indirect*) și LDR (*load indexat*) și respectiv, trei instrucțiuni distincte pentru scrierea datelor din regiștrii procesorului în memorie: ST (*store direct*), STI (*store indirect*) și STR (*store indexat*).

În linii mari, formatul celor 7 instrucțiuni de transfer date (LD, LDI, LDR, LEA, ST, STI și STR) este ilustrat în tabelul 6.1.

|                                 |    |    |    |             |    |   |   |                                                |   |   |   |   |   |   |   |
|---------------------------------|----|----|----|-------------|----|---|---|------------------------------------------------|---|---|---|---|---|---|---|
| 15                              | 14 | 13 | 12 | 11          | 10 | 9 | 8 | 7                                              | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
| Cod operație<br><i>(opcode)</i> |    |    |    | Dst sau Src |    |   |   | Câmp generator de adresă<br><i>(pgoffset9)</i> |   |   |   |   |   |   |   |

**Tabelul 6.1.** Formatul general al instrucțiunilor de transfer date (*Load / Store*)

Problema principală în cazul instrucțiunilor cu referire la memorie o reprezintă modul de adresare, care intenționează specificarea adresei direct în instrucțiune. Dar cum spațiul de adresare este de  $2^{16}$  locații și instrucțiunile sunt pe 16 biți, mai mult, 4 biți stabilesc codul operației iar alți trei biți registrul sursă / destinație, rezultă că doar maxim 9 biți din instrucțiune pot fi utilizați la calculul adresei. Drept soluție, se poate considera memoria LC-3 ca și o colecție de pagini, fiecare de câte  $2^9$  (512) cuvinte. Adresa de bază poate fi dată de PC (adresare directă, relativă la PC) sau indexată (relativă la un alt registru), iar cei 9 biți (sau 6 la adresarea indexată) constituie deplasamentul (*offset-ul*) în respectiva pagină.

#### **Instrucțiunile LD și ST**

**LD Reg[Dst], Label**      și      **ST Reg[Src], Label**

unde *Label* reprezintă adresa efectivă (EA) fie sub formă numerică fie simbolică. EA se determină însumând la PC-ul instrucțiunii LD câmpul generator de adresă din registrul instrucțiunii (*pgoffset9* – din tabelul 6.1) căruia i se extinde semnul de la 9 la 16 biți. Astfel,

$$EA \leq (PC) + SEXT(IR[8:0])$$

Evident că și procedeul invers este valabil, adică, dându-se valoarea lui *Label* și a PC-ului instrucțiunii LD se poate determina conținutul câmpului IR[8:0].

Semantica celor două instrucțiuni este următoarea:

LD Reg[Dst], *Label*

$\text{Reg}[\text{Dst}] \leqslant \text{Mem}[(\text{PC}) + \text{SEXT}(\text{IR}[8:0])]$

ST Reg[Src], *Label*

$\text{Reg}[\text{Src}] \Rightarrow \text{Mem}[(\text{PC}) + \text{SEXT}(\text{IR}[8:0])]$

În cele două mnemonici asamblare LD Reg[Dst], *Label* și ST Reg[Src], *Label* adresa specificată prin eticheta *Label* trebuie să aibă valoarea în intervalul [PC-256; PC+255]. În plus, în cazul instrucțiunilor cu referire la memorie care modifică valoarea unui registru destinație (LD, LDI, LDR și LEA) codurile de condiție (N, Z și P) sunt setate corespunzător.



**Figura 6.5.** Codificarea instrucțiunii Load cu mod de adresare directă și succesiunea de operații efectuate în cazul acestora

În figura 6.5 sunt prezentate codificarea instrucțiunii LD și succesiunea operațiilor ce concură la execuția acesteia. Astfel, pe timpul fazei de *decodificare*, PC-ul instrucțiunii LD și câmpul generator de adresă IR[8:0] căruia î se extinde semnul pe 16 biți atacă unitatea ALU (etapa 1 din figura 6.5). Pe timpul fazei de *evaluare adresă* se însumează cele două informații rezultatul depunându-se în registrul MAR (etapa 2 din figura 6.5). În faza de *fetch operand* se accesează memoria cu adresa tocmai stocată în MAR iar conținutul locației de memorie se depune în registrul MDR. În final, pe parcursul fazei *Scrie rezultat*, valoarea din MDR este depusă în setul de regiștri generali la locația specificată de câmpul Dst (IR[11:9]) (etapa 3).

### Exemplu:

Se consideră la adresa PC = 0x4019 instrucțiunea **LD R2, 0x1AF**, iar în memorie la locația 0x3FC8 se află valoarea 0x5. Figura 6.6 ilustrează modul de lucru al instrucțiunii LD cu stocarea rezultatului final în registrul destinație R2.



**Figura 6.6.** Exemplu de instrucțiune Load cu mod de adresare direct

Pentru operația de scriere în memorie (instrucțiunea **Store** cu mod de adresare direct) diferența în ce privește codificarea este următoarea:

**0011 Src pgoffset9**

În urma execuției instrucțiunilor de scriere în memorie (ST, STI și STR) codurile de condiție rămân nemodificate. În ce privește modul de operare a instrucțiunii Store cu mod de *adresare direct*, succesiunea de operații efectuate este aceeași cu cea din figura 6.5 cu deosebirea că operația 3 se face în sens invers (dinspre setul de regiștri generali, de la un regisztr sursă de această dată, spre o locație de memorie, prin intermediul aceluiași regiszr MDR (regiszr de date a memoriei)).

### Instrucțiunile LDI și STI

**LDI Reg[Dst], Label** și **STI Reg[Src], Label**

O altă modalitate de a obține o adresă completă (pe 16 biți) prin intermediul unei instrucțiuni o reprezintă citirea adresei dintr-o locație de

memorie urmată apoi de citirea sau scrierea de la / la respectiva adresă. Instrucțiunile care implementează acest mecanism se numesc cu acces indirect la memorie (*load indirect* sau *store indirect*). În primul rând adresa este obținută din PC-ul instrucțiunii LDI și câmpul generator de adresă (IR[8:0]) căruia î se extinde semnul pe 16 biți (la fel ca la adresarea directă) iar apoi, în al doilea rând, conținutul locației de la adresa calculată este folosit ca și adresă pentru *load* și *store*. Ca și avantaj trebuie spus că această instrucțiune nu necesită un registru de bază pentru adresare. Însă, dezavantajul major îl constituie accesul suplimentar la memorie (două accese pentru obținerea operandului). Instrucțiunile de la nivel *high* (*HLL*) care generează la nivel *low* (asamblare / cod mașină) instrucțiuni cu referire la memorie în mod de adresare indirect sunt cele care operează asupra pointerilor (transmiterea parametrilor unei funcții prin pointer, pointer la pointer).



**Figura 6.7.** Codificarea instrucțiunii Load cu mod de *adresare indirectă* și succesiunea de operații efectuate în cazul acestora

În mnemonica asamblare aferentă celor două instrucțiuni *Label* reprezintă adresa adresei („*pointer address*”) fie sub formă numerică fie simbolică. Se determină însimând la PC-ul instrucțiunii LDI câmpul generator de adresă din registrul instrucțiunii (pgoffset9 – din figura 6.7) căruia î se extinde semnul de la 9 la 16 biți. Astfel,

$$\text{pointer address} \leq (PC) + \text{SEXT}(IR[8:0])$$

$$\text{EA (adresa efectivă)} \leq \text{Mem [pointer address]}$$

$$\text{Reg}\{\text{Dst}\} \leq \text{Mem [Mem [pointer address]]}$$

Evident că și procedeul invers este valabil, adică, dându-se valoarea lui Label și a PC-ului instrucțiunii LDI se poate determina conținutul câmpului IR[8:0].

Modul de operare al instrucțiunii LDI este următorul: pe timpul fazei de *decodificare* se atacă sumatorul (unitatea ALU) cu PC-ul instrucțiunii LDI și câmpul generator de adresă IR[8:0] căruia î se extinde semnul pe 16 biți (etapa 1 din figura 6.7). În faza de *evaluare adresă* se obține adresa adresei operandului, care se depune în registrul MAR (etapa 2 din figura 6.7). Pe parcursul fazei *fetch operand* se atacă memoria cu MAR și conținutul locației de memorie se depune în registrul MDR, care ulterior trece în MAR (etapa 3 din figura 6.7). În acest moment în MAR se află adresa operandului. În faza de *execuție* se accesează memoria din nou cu adresa tocmai stocată în MAR (etapa 4 din figura 6.7) și se obține operandul care se depune în registrul MDR (etapa 5 din figura 6.7). În final, pe parcursul fazei *Scrie rezultat*, conținutul lui MDR este depus în setul de registri generali la locația specificată de câmpul Dst (IR[11:9]) (etapa 5).

#### Exemplu:

Se consideră la adresa PC = 0x4A1C instrucțiunea **LDI R3, 0x1CC**, iar în memorie la locația 0x49E8 se află valoarea 0x2110. De asemenea, la locația 0x2110 se găsește valoarea 0xFFFF. Figura 6.8 ilustrează modul de lucru al instrucțiunii LDI cu stocarea rezultatului final în registrul destinație R3.



**Figura 6.8.** Exemplu de instrucțiune Load cu mod de adresare indirect

Pentru instrucțiunea de scriere în memorie în mod de adresare indirect (**STI Reg[Src], Label**) diferența în ce privește codificarea este următoarea:

**1011    Src pgoffset9**

În ce privește modul de operare a instrucțiunii Store cu mod de *adresare indirect*, succesiunea de operații efectuate este aceeași cu cea din figura 6.7 cu deosebirea că, după aflarea adresei efective unde se va scrie informația în memorie, operația 5 se va face în sens invers (dinspre setul de registri generali, de la un registru sursă de această dată, spre o locație de memorie, prin intermediul aceluiași registru MDR (registru de date a memoriei).

### Instrucțiunile LDR și STR

**LDR Reg[Dst], Reg[BaseR], index6   și   STR Reg[Src], Reg[BaseR], index6**

În modul de adresare direct pot fi adresate cuvinte aflate în aceeași pagină de memorie cu instrucțiunea curentă. Totuși, în cazul programelor mari, acest lucru nu este suficient spațiul fiind prea mic, chiar și în cazul procesorului LC-3, motiv pentru care proiectanții LC-3 au propus modul de adresare indexat (pentru a accesa zone de memorie din oricare alte pagini, diferite de cea a instrucțiunii curente). Astfel, se folosește un registru (pe 16 biți) pentru a furniza adresa de bază. După cum se poate observa, în figura 6.9, codificarea instrucțiunii LDR presupune existența în registrul IR a următoarelor câmpuri: *opcode* pe 4 biți, registrul destinație pe 3 biți, registrul de bază pe 3 biți și câmpul deplasament (*index6* – din figura 6.9) pe 6 biți (fără semn), deci o valoare întreagă în intervalul [0, 63]. Înainte de a fi adăugat la registrul de bază, în faza de decodificare, se extinde cu 0 câmpul deplasament pe 16 biți. O altă diferență față de modul de adresare direct constă în faptul că, deplasamentul la modul indexat este pe 6 biți, față de 9 biți la cel direct. Adresa efectivă (EA) a operandului din memorie se determină însumând la registrul de bază Reg[BaseR] câmpul generator de adresă din registrul instrucțiunii (*index6*) care se extinde cu 0 de la 6 la 16 biți. Astfel,

$$EA \leq Reg[BaseR] + ZEXT(IR[5:0])$$

$$Reg[Dst] \leq Mem[Reg[BaseR] + ZEXT(IR[5:0])]$$

Using  
for educational purposes



**Figura 6.9.** Codificarea instrucțiunii Load cu mod de *adresare indexat* și succesiunea de operații efectuate în cazul acestora

Ciclul instrucțiunii LDR (*load indexat*) presupune după aducerea și depunerea acesteia în registrul IR (lucru efectuat în faza *fetch instrucțiune*) *decodificarea* instrucțiunii. Pe parcursul acestei faze, cu cei trei biți IR[8:6] se identifică registrul de bază din setul de regiștri generali și se realizează extensia cu 0 pe 16 biți a câmpului deplasament IR[5:0] (etapa 1 din figura 6.9). Pe timpul fazei de *evaluare adresă* se calculează suma dintre cele două informații anterior amintite, rezultatul depunându-se în registrul MAR (etapa 2 din figura 6.9). Pe durata fazei de *fetch operand* se accesează memoria de la adresa dată de MAR iar conținutul se depune în registrul MDR (etapa 3 din figura 6.9), de unde urmează a fi copiat în registrul destinație corespunzător în faza *Scrie rezultat* (etapa 4 din figura 6.9).

#### Exemplu:

Se consideră instrucțiunea **LDR R3, R3, 0x1D**, iar în memorie la locația **0x2362** se află valoarea **0xF0F**. De asemenea, conținutul registrului **R3** înaintea execuției instrucțiunii este **0x2345**. Figura 6.10 ilustrează modul de lucru al instrucțiunii LDR cu stocarea rezultatului final în registrul destinație (același) **R3**.



**Figura 6.10.** Exemplu de instrucțiune Load cu mod de adresare indexat

Pentru instrucțiunea **STR Reg[Src], Reg[BaseR], index6** (scriere în memorie în mod de adresare indexat) diferența în ce privește codificarea este următoarea:

**0111 Src BaseR index6**

În ce privește modul de operare a instrucțiunii Store cu mod de *adresare indexat*, succesiunea de operații efectuate este aceeași cu cea din figura 6.9 cu deosebirea că, după aflarea adresei efective unde se va scrie informația în memorie, operațiile 3 și 4 se vor face în sens și ordine inversă (4 întâi și 3 după, iar sensul este dinspre setul de registri generali, de la un registru sursă, spre o locație de memorie, prin intermediul registrului MDR).

### Instrucțiunea LEA

**LEA Reg[Dst], Label**

unde *Label* reprezintă adresa efectivă (EA) fie sub formă numerică fie simbolică. EA se determină însumând la PC-ul instrucțiunii LEA câmpul

generator de adresă din registrul instrucțiunii (*pgoffset9* – din figura 6.11) căruia î se extinde semnul de la 9 la 16 biți. Astfel,

$$EA \leq (PC) + SEXT(IR[8:0])$$

Evident că și procedeul invers este valabil, adică, dându-se valoarea lui Label și a PC-ului instrucțiunii LEA se poate determina conținutul câmpului IR[8:0].

Semantica instrucțiunii este următoarea și anume *încarcă în registrul destinație valoarea adresei efective* (nu conținutul de memorie de la adresa).

$$\text{LEA Reg[Dst], Label} \quad \text{Reg[Dst]} \leq (PC) + SEXT(IR[8:0])$$

Uzual se folosește la prelucrarea tablourilor (unidimensionale) situate într-un spațiu de memorie apropiat instrucțiunii curente (+/- 256 de cuvinte) când, se încarcă într-un registru general adresa de început a tabloului, iar accesul la fiecare element al tabloului se face printr-o adresare indexată având ca registru de bază pe cel anterior setat prin instrucțiunea LEA.

Ca și în cazul adresării directe sau indirekte, adresa specificată prin eticheta *Label* trebuie să fie în intervalul [PC-256; PC+255]. De asemenea, codurile de condiție sunt setate.



**Figura 6.11.** Codificarea instrucțiunii Load cu mod de *adresare imediat* și succesiunea de operații efectuate în cazul acestora

Spre exemplificare, se consideră în memorie la adresa PC=0x4019 următoarea instrucțiune **LEA R5, -3**. Figura 6.12 ilustrează modul de lucru al instrucțiunii LEA cu stocarea rezultatului final în registrul destinație (același) R5.



**Figura 6.12.** Exemplu de instrucție Load cu mod de adresare imediat

#### 6.1.2.3. LC-3 ISA: INSTRUCȚIUNI DE CONTROL (RAMIFICAȚII ÎN PROGRAM)

Instrucțiunile de ramificație (de salt și / sau apel) au rolul de a altera cursul secvenței de instrucțiuni (fluxul de control al programului) prin modificarea registratorului PC. În funcție de condiția de salt, memorată în corpul instrucțiunii, se cunosc **salturi condiționate** (se face saltul dacă se îndeplinește condiția) sau **necondiționate** (se face tot timpul saltul – PC-ul se modifică întotdeauna). În cazul saltului condiționat dacă nu se îndeplinește condiția de salt atunci se va executa următoarea instrucție din program (PC-ul obținut în urma fazei *fetch* a instrucțiunii de salt nu este alterat). Salturile necondiționate pot fi **directe** (se cunoaște tot timpul adresa destinație a saltului – încă din momentul compilării sursei programului) sau **indirecte** (caz în care adresa de salt este dată printr-un regisztr care-și modifică în mod dinamic valoarea reținută [Flo05]). În cazul salturilor indirecte, adresa de salt se cunoaște abia în momentul execuției programului.

Pe lângă instrucțiunile de salt mai există și instrucțiuni de apel și revenire din subrute. Acestea fac parte din categoria ramificațiilor de program necondiționate dar, în care, apelurile au o proprietate importantă:

salvează adresa de revenire în programul apelant (PC-ul instrucțiunii următoare apelului).

Instrucțiunile de întrerupere software – **TRAP** – reprezintă instrucțiuni de apel către rutine de tratare aferente sistemului de operare. La încheierea fiecărei rutine se revine în programul apelant cu o instrucțiune de tip **return** (care repune în registrul PC valoarea adresei succesoare instrucțiunii TRAP).

Pe scurt, instrucțiunile de control oferite de LC-3 ISA sunt [Patt03]:

❖ **BR x Label** – salt condiționat (*poate fi totuși chiar și necondiționat*) la o adresă relativă la PC-ul instrucțiunii curente de salt (deplasamentul față de PC este pe 9 biți).

❖ **JMP / JSR Label** – instrucțiuni de salt necondiționat (sau apel de subrutină) direct la o adresă pe 11 biți relativă la PC-ul instrucțiunii de salt.

❖ **JMPR / JSRR** – instrucțiuni de salt necondiționat sau apel de subrutină indirect, la o adresă indexată obținută dintr-un registru de bază și un deplasament pe 8 biți (fără semn).

❖ **TRAP** – întreruperi software – practic apeluri directe de subrutine ale sistemului de operare.

❖ **RET / RTI** – instrucțiuni de revenire din subrutina utilizator sau cea aferentă sistemului de operare.

### **Instrucțiunea BR x Label**

unde *Label* reprezintă adresa efectivă (EA) fie sub formă numerică fie simbolică. EA se determină însumând la PC-ul instrucțiunii BR câmpul generator de adresă din registrul instrucțiunii (*pgoffset9* din figura 6.13) căruia i se extinde semnul de la 9 la 16 biți. Astfel,

$$\text{EA} \leq (\text{PC}) + \text{SEXT}(\text{IR}[8:0])$$

Evident că și procedeul invers este valabil, adică, dându-se valoarea lui *Label* și a PC-ului instrucțiunii BR se poate determina continutul câmpului IR[8:0].

Simbolul *x* reprezintă condiția care trebuie îndeplinită și poate fi *n* (negativ), *z* (egalitate cu 0), *p* (strict pozitiv), *nz* (mai mic sau egal cu 0), *np* (diferit de 0), *zp* (mai mare sau egal cu 0), *nzp* (saltul se face necondiționat pe oricare din condiții – este echivalent instrucțiunii JMP, doar că deplasamentul este de 9 biți).

Semantica instrucțiunii este următoarea: dacă cei trei biți de condiție (registrii booleani N, Z și P) sunt 0 (nu sunt setați practic), conform figurii

6.14 niciuna din cele trei porți logice  $\bar{S}I$  nu generează 1 logic (toate ieșirile sunt 0) și rezultă că saltul nu se face (echivalent unui simplu NOP – *no operation*) și se trece la următoarea instrucțiune din program succesoare branch-ului. Dacă registrul boolean corespunzător condiției este setat (de ex. condiția „n” – negativ și registrul N=1) atunci saltul se va face (se spune că este „*taken*”) la adresa specificată prin eticheta *Label*, noul PC nemaifiind ( $PC+1$ ) ci ( $PC + SEXT(IR[8:0])$ ). Ca și în cazul acceselor la memorie cu mod de adresare direct, adresa specificată prin eticheta *Label* (*target-ul* saltului) trebuie să fie în intervalul [PC-256; PC+255], unde PC reprezintă adresa instrucțiunii de salt. Dacă nu coincide însă condiția cu regiștrii booleani setați (de ex. condiția „n” – negativ și registrul N=0) atunci saltul nu se va face (se spune că este *not taken*), instrucțiunea care se va procesa fiind cea succesoare branch-ului din program (de adresă PC+1 – vezi și figura 6.13).



**Figura 6.13.** Codificarea instrucțiunii *Branch* și succesiunea de operații efectuate în cazul acesteia

Modul de lucru al instrucțiunii *Branch* (BR x Label) este următorul: pe timpul fazei *fetch instrucțiune*, practic după depunerea instrucțiunii în

registrul IR are loc și incrementarea PC-ului cu o unitate pentru a indica spre următoarea instrucțiune din program (valoarea PC+1 – unde PC reprezintă adresa branch-ului – fiind depusă pe intrarea 0 a multiplexorului MUX și care va fi selectată dacă semnalul *taken* va fi 0, însemnând, de fapt, că saltul nu se face). Pe timpul fazei de *decodificare* câmpul generator de adresă IR[8:0] căruia i se extinde semnul de la 9 la 16 biți și PC-ul saltului se depun pe intrarea sumatorului ALU (etapa 1 din figura 6.13) iar câmpul de condiție IR[11:9] atacă blocul „*logică de selecție*” – prezentat detaliat în figura 6.14 (practic 3 porți logice SI cu două intrări și o poartă logică SAU cu 3 intrări), a cărui ieșire va fi semnalul *taken* (îndeplinirea condiției însemnând *se face saltul, altfel nu se face*) din etapa 2 aferentă figurii 6.14. Pe timpul fazei *evaluare adresă* se calculează PC-ul target al branch-ului (PC + SEXT(IR[8:0])) care va ataca a doua intrare a multiplexorului (cea de 1 logic). În faza de *execuție* în funcție de îndeplinirea sau nu a condiției de salt în PC se încarcă valoarea corectă, adresa instrucțiunii de la care se va procesa în continuare (etapa 3 din figura 6.13).

Spre exemplificare, se consideră instrucțiunea de salt **BR z 0x0D9** stocată în memorie la adresa PC=0x4028. De asemenea, dintre regiștri booleeni de condiție doar registrul Z este setat. Figura 6.14 ilustrează succesiunea de operații care conduc la modificarea fluxului de control al programului și determinarea noului PC.



**Figura 6.14.** Exemplu de instrucțiune de salt condiționat (*Branch if zero*)

Tratarea instrucțiunilor de salt necondiționat, apel și revenire din subrutine utilizator și ale sistemului de operare, precum și a întreruperilor software *Trap* se va face mai pe larg în capitolul 8 al prezentei cărți.

Instrucțiunile de salt necondiționat (JMP/JSR, JMPP/JSRR la LC-3) se întâlnesc în literatura de specialitate sub numele de „*jump-uri*”. Formatul instrucțiunilor JMP și JSR respectiv JMPP / JSRR este aproape identic, un singur bit diferențierind între salt și respectiv apel (păstrarea PC-ului de revenire în registrul R7 la LC-3 [Patt03]). Asupra formatului celor patru instrucțiuni (JMP/JSR și JMPP / JSRR) se va insista în capitolul 8.

Instrucțiunile TRAP sau întreruperile software invocă de fapt o rutină a sistemului de operare identificată printr-un vector de întrerupere pe 8 biți. Cele mai uzuale sunt cele care permit citirea unui caracter de la tastatură, afișarea unui caracter pe ecranul monitorului sau încheierea programului utilizator și cedarea controlului sistemului de operare. După execuția instrucțiunilor din rutina de tratare a întreruperii software, PC-ul este setat cu adresa instrucțiunii succesoare Trap-ului. Asupra formatului instrucțiunii TRAP, semanticii acesteia, despre adresele de start aferente rutinelor de tratare ale întreruperii se va insista în capitolul 8.

### 6.1.3. LC-3 ISA: APLICAȚII REZOLVATE

Odată cu descrierea instrucțiunilor de control se cunosc toate tipurile de instrucțiuni pentru realizarea de programe<sup>9</sup>. La nivelul programelor în limbaj de asamblare implementarea buclelor de program poate fi realizată fie prin folosirea unui contor care va fi decrementat la fiecare pas oprirea făcându-se când contorul ajunge la 0 (*structură repetitivă cu număr cunoscut de pași*) [Neg97, Sto98], fie prin utilizarea unei santinele<sup>10</sup> pe post de control iar oprirea algoritmului se face dacă unul din elementele supuse atenției (citit din memorie) este chiar cel căutat, aflat pe post de sentinelă (*structură repetitivă cu număr necunoscut de pași*).

<sup>9</sup> Teorema Böhm-Jacopini [Neg97] afirmă că orice program de calcul poate fi realizat folosind structuri secvențiale, alternative și repetitive. Instrucțiunile de control (de ramificație) sunt elemente de bază ale structurilor alternative și repetitive. Instrucțiunile operaționale și de transfer se regăsesc în structurile secvențiale de program.

<sup>10</sup> Un caracter special folosit pentru a indica sfârșitul unei secvențe este numit deseori **santinelă**. Utilitatea sa este foarte mare atunci când nu se cunoaște apriori numărul de pași (iterații) pe care îi execută o anumită structură repetitivă.

**Aplicație 1:** Să se calculeze suma a 12 numere întregi. Numerele sunt stocate în memorie începând cu adresa 0x3100. Programul începe la adresa 0x3000. Pentru simplitate, se indică folosirea regiștrilor R1, R2, R3 și R4, fiecare având următorul rol: R1 – adresa zonei de date (unde sunt stocate numerele), R2 – contorul de numere (indică în fiecare moment câte numere mai sunt de însumat), R3 – suma, R4 – elementul curent citit din memorie.



**Figura 6.15.** Schema logică aferentă programului de însumare a 12 numere întregi

Secvența de cod aferentă este următoarea:

| PC     | Codificare instrucțiuni | Semnificație                                     |
|--------|-------------------------|--------------------------------------------------|
| 0x3000 | 1110 001 1 0000 0000    | $R1 \leftarrow x3100$                            |
| 0x3001 | 0101 011 011 1 00000    | $R3 \leftarrow 0$                                |
| 0x3002 | 0101 010 010 1 00000    | $R2 \leftarrow 0$                                |
| 0x3003 | 0001 010 010 1 01100    | $R2 \leftarrow 12$                               |
| 0x3004 | 0000 010 000000110      | Dacă Z=1, sare la 0x300A                         |
| 0x3005 | 0110 100 001 000000     | Încarcă următoarea valoare în R4                 |
| 0x3006 | 0001 011 011 0 00 001   | Însumează valoarea citită la suma din R3         |
| 0x3007 | 0001 001 001 1 00001    | Incrementează adresa de memorie (indicată de R1) |

|        |                      |                                                                           |
|--------|----------------------|---------------------------------------------------------------------------|
| 0x3008 | 0001 010 010 1 11111 | Decrementează contorul de numere care mai sunt de citit din memorie (R2). |
| 0x3009 | 0000 111 11111011    | Sare la testul contorului (adresa 0x3004)                                 |

**Aplicația 2:** Să se determine numărul de apariții ale unui caracter într-un „fișier”. Programul este stocat în memorie începând cu adresa 0x3000. caracterul căutat va fi citit de la tastatură. „Fișierul” se consideră încărcat de pe discul hard în memorie sub forma unor locații contigue. În fiecare locație se află codul ASCII al unui caracter din fișier. Adresa de început a fișierului este stocată în prima locație de memorie imediat după codul sursă al programului. Dacă ceea ce s-a citit de la tastatură (codul ASCII al caracterului) coincide cu unul din fișier (cu cel citit la momentul respectiv din fișier) se incrementează un contor. Sfârșitul de fișier este indicat prin codul ASCII special EOT (x04) – “end of text”. În final, programul va afișa numărul de caractere din fișier identice cu cel citit de la tastatură. Pentru buna funcționalitate a codului sursă propus trebuie ca numărul de apariții să fie strict mai mic decât 10.



**Figura 6.16.** Schema logică aferentă programului care determină numărul de apariții ale unui caracter într-un fișier

În secvența de program următoare Contorul (numărul de apariții ale caracterului căutat) este salvat în registrul R2, registrul R3 păstrează adresa de început a fișierului (adresa de bază de la care se va citi pe rând tot câte un caracter). Registrul R1 reține codul ASCII al fiecărui caracter citit din fișier.

Inițial R0 reține codul ASCII al caracterului căutat (cel citit de la tastatură) iar în final codul ASCII al cifrei care reprezintă numărul de apariții al caracterului căutat în fișier.

| PC     | Codificare instrucțiuni | Semnificație                                                                                       |
|--------|-------------------------|----------------------------------------------------------------------------------------------------|
| 0x3000 | 0101 010 010 1 00000    | $R2 \leftarrow 0$ (contor)                                                                         |
| 0x3001 | 0010 011 000010001      | $R3 \leftarrow M[x3012]$ (Ptr)                                                                     |
| 0x3002 | 1111 0000 0010 0011     | Codul caracterului citit de la tastatură se află în R0 (TRAP x23)                                  |
| 0x3003 | 0110 001 011 000000     | $R1 \leftarrow M[R3]$                                                                              |
| 0x3004 | 0001 100 001 1 11100    | $R4 \leftarrow R1 - 4$ (EOT)                                                                       |
| 0x3005 | 0000 010 000001001      | Dacă $Z=1$ , sare la adresa 0x300E                                                                 |
| 0x3006 | 1001 001 001 1 1111     | $R1 \leftarrow NOT R1$                                                                             |
| 0x3007 | 0001 001 001 1 00001    | $R1 \leftarrow R1 + 1$                                                                             |
| 0x3008 | 0001 001 001 0 00 000   | $R1 \leftarrow R1 + R0$                                                                            |
| 0x3009 | 0000 101 000000010      | Dacă $N=1$ sau $P=1$ , sare la adresa 0x300B                                                       |
| 0x300A | 0001 010 010 1 00001    | $R2 \leftarrow R2 + 1$                                                                             |
| 0x300B | 0001 011 011 1 00001    | $R3 \leftarrow R3 + 1$                                                                             |
| 0x300C | 0110 001 011 000000     | $R1 \leftarrow M[R3]$                                                                              |
| 0x300D | 0000 111 111110111      | Sare necondiționat la adresa 0x3004                                                                |
| 0x300E | 0010 000 000000101      | $R0 \leftarrow M[x3013]$                                                                           |
| 0x300F | 0001 000 000 0 00 010   | $R0 \leftarrow R0 + R2$                                                                            |
| 0x3010 | 1111 0000 0010 0001     | Afișează numărul de apariții sub formă de character al cărui cod ASCII se găsește în R0 (TRAP x21) |
| 0x3011 | 1111 0000 0010 0101     | HALT (TRAP x25) – încheie programul                                                                |

|        |                                |                                               |
|--------|--------------------------------|-----------------------------------------------|
| 0x3012 | Adresa de început a fișierului |                                               |
| 0x3013 | 0000 0000 0011 0000            | <i>Codul ASCII al caracterului '0' (0x30)</i> |

## 6.2. FLUXUL DE DATE LA LC-3 ISA

Foarte sumar, calea (fluxul) de date constă din toate structurile logice care sunt combinate pentru prelucrarea informației în nucleul unui calculator (la nivelul procesorului). Fluxul de date aferent unui sistem de calcul urmează o strategie (un curs) definită la nivelul algoritmului (*software*) și este susținută printr-o serie de componente *hardware*. Strategia fluxului de date presupune luarea fiecărui element component, determinarea modului de funcționare, identificarea intrărilor / ieșirilor, identificarea logicii de control, a cursului datelor între elementele componente, proiectarea elementelor componente.

Figura 6.17 ilustrează fluxul de date la LC-3 ISA. În figură se disting două tipuri de săgeți: „**pline**” – care indică informația care se procesează (de cele mai multe ori pe 16 biți, dar și pe 1, 2, 3, 9 sau 11 biți) și „**goale**” – care indică semnalele de control, generate în majoritatea cazurilor de automatul cu stări finite (*Finite State Machine – FSM*).

Componenta de bază a fluxului datelor la LC-3 o constituie **magistrala globală de date (bus)** reprezentată în figura 6.17 cu linia cea mai îngroșată, cu săgeți *pline* la ambele capete. Magistrala globală la LC-3 constă din 16 fire (semnale) și circuitele electronice asociate. Aceasta permite unei structuri logice să transfere până la 16 biți de informație altei structuri prin conectarea componentelor electronice corespunzătoare la magistrală. În fiecare moment de timp există o singură sursă pe magistrală astfel încât să se transfere o singură valoare. În figura 6.17 se observă că fiecare structură care generează o valoare pe *bus* o face prin intermediul unui dispozitiv **tri-state** (sub forma unui triunghi gol cu o latură tăiată) cu rolul de a controla scrierea informației pe magistrală de către o singură sursă (și nu de mai multe). Structura care dorește să scrie pe *bus* va avea activat semnalul WE (*write enable*) prin intermediul *unității de control* (mai precis automatul *FSM*). Citirea datelor de pe magistrală poate fi făcută de oricătre structuri logice. Reîștrări capturează data de pe *bus* doar dacă *unitatea de control* activează semnalul Write Enable pentru destinația corespunzătoare.



Figura 6.17. Fluxul de date la LC-3 ISA

O componentă, de asemenea, importantă a sistemului de calcul o reprezintă **memoria** care reține atât instrucțiuni cât și date. Memoria este accesată prin încărcarea în registrul MAR (registrul de adresă al memoriei) a adresei locației dorite. Apoi, unitatea de control „activează semnalul READ”

– la LC-3 WE devine 0, iar după scurgerea timpului de acces la memorie data de la locația dorită se va încărca în registrul MDR (registrul de date al memoriei). Pe de altă parte, scrierea datelor în memorie se realizează în următoarele etape: se depune adresa în MAR, se depune data ce se vrea memorată în MDR și „*se activează semnalul WRITE*” – la LC-3 WE devine 1. Scrierea registrului MAR poate fi făcută din trei surse (instrucțiuni *load*, *store* sau intrerupere software *TRAP*) prin intermediul diferitelor multiplexoare. Una din surse (ADDR1MUX din figura 6.17) este obținută din înșumarea PC-ului cu IR[8:0] căruia i se extinde semnul pe 16 biți în cazul instrucțiunilor LD / ST și LDI / STI. A doua sursă (MARMUX) este obținută din vectorul de intrerupere (câmpul IR[7:0] care se extinde cu 0-uri pe încă 8 poziții semnificative) pentru determinarea adresei primei instrucțiuni din rutina de tratare a intreruperii. A treia sursă (obținută tot prin intermediul multiplexorului ADDR1MUX din figura 6.17) este generată din suma dintre un registru general și o valoare imediată pe 6 biți, extinsă cu 0-uri semnificative pe 16 biti, aferentă instrucțiunilor cu referire la memorie în mod de adresare indexat (LDR / STR).

**Unitatea aritmetică-logică (ALU)**, componentă a *unității de procesare* și evident a fluxului datelor la LC-3 ISA, acceptă ca și intrări fie doi regiștri sursă din **setul de regiștri generali**, selectați cu câmpurile IR[8:6] și respectiv IR[2:0] (SR1 și SR2 în figura 6.17), fie un registru sursă și valoarea imediată din câmpul registrului instrucțiunii căruia i se extinde semnul până la 16 biți. Multiplexorul SR2MUX din figura 6.17 va selecta între valoarea imediată și registru sursă cu ajutorul bitului 5 din registrul instrucțiunii. Rezultatul generat de către ALU va fi scris pe magistrala globală de unde va fi transferat în setul de regiștri generali la locația specificată prin registrul destinație corespunzător instrucțiunii procesate. De asemenea, rezultatul va fi folosit de către structura „LOGIC” pentru a seta regiștri booleani de condiție (N, Z și P). Pe lângă instrucțiunile aritmetico-logice (ADD, AND și NOT) și instrucțiunile de transfer date în regiștri (LD, LDI, LDR și LEA) setează codurile de condiție prin intermediul busului global.

**Setul de regiștri generali**, componentă esențială a fluxului datelor, este o structură *biport* pentru citire și *uniport* pentru scriere. Scrierea în registrul destinație poate fi făcută de pe magistrala globală, informația ajungând aici fie de la ALU fie de la memorie prin registrul MDR.

Registrul **PC** furnizează prin intermediul magistralei globale registrului MAR adresa instrucțiunii de la care se va procesa (va începe următorul ciclu al instrucțiunii). PC-ul este încărcat prin intermediul unui multiplexor 4:1 (**PCMUX**) în funcție de instrucțiunea care se va executa

(salt condiționat, necondiționat, apel indirect, intrerupere software). Una din cele 4 intrări în PCMUX (vezi figura 6.17) este (PC+1), valoare stabilită în faza FETCH a instrucțiunii în curs de procesare. Dacă instrucțiunea este salt condiționat (salt care se face) atunci intrarea selectată în PCMUX va fi cea determinată din suma dintre PC și câmpul IR[8:0] căruia î se extinde semnul de la 9 la 16 biți. O altă intrare în PCMUX va fi obținută din setul de regiștri generali (mai precis din R7 în cazul instrucțiunii RET – revenirea din subrutina utilizator). A patra intrare se obține prin intermediul magistralei globale datorită intreruperii software sau datorită instrucțiunii de salt / apel indirect (JSRR). Deși în figura 6.17 se văd doar trei intrări, în realitate sunt cele patru anterior enunțate. Problema este că multiplexorul ADDR1MUX va selecta adevărul responsabil pentru generarea noului PC – vechiul PC sau un registru general.

**Unitatea de control** își pune în aplicare numele, controlând în fiecare moment fluxul datelor în sistemul de calcul. După aducerea instrucțiunilor în IR, aceasta va fi decodificată (stabilită operația ce se va executa, operanzii). În fiecare ciclu mașină, prin intermediul automatului cu stări finite (FSM), comandată de biți ai registrului instrucțiunii, sunt stabilite semnalele de control pentru următoarea fază de procesare a instrucțiunii: cine devine conducătorul pe magistrala globală (*cine scrie informația*), care regiștri vor fi scrisi (WE va fi 1 pentru care structură logică), ce operație va efectua unitatea aritmetică-logică ?

### 6.3. EXERCIȚII ȘI PROBLEME

1. Se consideră cunoscute valorile inițiale pentru regiștrii și locațiile de memorie următoare:

$$\begin{aligned} \text{PC} &= 0x2081, \text{R6} = 0x2035, \text{LOC} = 0x2044, \text{Mem}[0x2044] = 0x3456 \\ \text{Mem}[0x2041] &= 0x12CF, \text{Mem}[0x3456] = 0x201F \end{aligned}$$

Să se determine care este adresa efectivă a următoarelor instrucțiuni, precum și codificarea fiecăreia dintre ele, specificând și modurile de adresare:

- a) LD R1, LOC
- b) LDI R2, LOC
- c) LDR R3, R6, #12

- d) ADD R1, R3, R2  
 e) ADD R5, R1, #15
2. Să se identifice instrucțiunile a căror codificare este dată mai jos. Specificați conținutul fiecărui registru și a locațiilor de memorie afectate după execuția instrucțiunilor. Ce se poate observa?

| PC     | Codificare instrucțiuni | Semnificație |
|--------|-------------------------|--------------|
| 0x30F6 | 1110 001 000000100      |              |
| 0x30F7 | 0001 010 001 1 01110    |              |
| 0x30F8 | 0011 010 111111110      |              |
| 0x30F9 | 0101 010 010 1 00000    |              |
| 0x30FA | 0001 010 010 1 00101    |              |
| 0x30FB | 0111 010 001 001110     |              |
| 0x30FC | 1010 011 011110100      |              |

3. a) Secvența de cod de mai jos calculează expresia  $(R1 \times R1) + 6$ , punând rezultatul în R3. Se cere pentru început să translatați programul din cod mașină (secvență binară a instrucțiunilor codificate) în limbaj de asamblare (sau eventual într-un limbaj codificat de tip transfer registru numit *RTL* – „register transfer language”) cunoscând instrucțiunile prezentate pe parcursul acestui capitol. De exemplu, instrucțiunea 1001 0000 0111 1111 este “ $R0 \leftarrow \text{NOT } R1$ ” în RTL. După translatarea instrucțiunilor completați cu biții lipsă astfel încât programul să realizeze cerința impusă.

| PC    | Codificare instrucțiuni | Limbaj de asamblare / codificare de tip transfer registru |
|-------|-------------------------|-----------------------------------------------------------|
| x3000 | 0101 0110 1110 0000     |                                                           |
| x3001 | _____                   |                                                           |
| x3002 | 0001 0110 1100 0001     |                                                           |

|       |                     |  |
|-------|---------------------|--|
| x3003 | 0001 0100 1011 1111 |  |
| x3004 | 0000 101_____       |  |
| x3005 | 0001 0110 1110 0110 |  |

**b)** Dacă R1 și R3 rețin numere întregi în complement față de 2 pe 16 biți, pentru ce valori ale lui R1 rezultatul din R3 este corect. Justificați.

4. **a)** Instrucțiunile LC-3 următoare (A și B) realizează în principiu același lucru. Explicați în cel mult 10 cuvinte ce fac ele.

A 0000 0001 0101 0101

B 0001 0000 0010 0000

Totuși, ele nu pot fi interschimbate deoarece nu fac chiar același lucru. În cel mult 10 cuvinte explicați care este diferența între cele două instrucțiuni.

**b)** În cadrul LC-3 ISA sunt adunate următoarele două numere întregi în complement față de 2 pe 16 biți: 010101011010101 și 0011100111001111 obținându-se rezultatul 1000111100100100. Rezultatul este corect? Este vreo problemă? Dacă *da* care este aceasta, dacă *nu* de ce nu este nici o problemă.

**c)** În cadrul LC-3 ISA se dorește execuția unei instrucțiuni care să scadă valoarea întreagă 20 din registrul R1 și să depuna rezultatul în R2. Poate fi realizat acest lucru? Dacă *da* scrieți mai jos codificarea instrucțiunii. Dacă *nu* explicați care este problema.

15

0

**d)** Ce specifică arhitectura setului de instrucțiuni aferentă unui procesor. Care sunt diferențele dintre instrucțiunile LD, LDI și LDR? Dar diferența dintre acestea și instrucțiunea LEA?

**e)** Dacă dimensiunea totală a memoriei este de 1MB ( $2^{20}$  octeți) și adresabilitatea este de 32 de octeți, câți biți de adresă sunt necesari pentru adresarea întregului spațiu de memorie?

5. Se consideră următorul program scris în limbaj mașină LC-3. Registrul R1 reprezintă variabila de intrare în această secvență de program iar R2

reprezintă variabila de ieșire la încheierea buclei. Dacă valoarea inițială a lui R1 este un număr întreg pozitiv  $n$ , exprimați ieșirea R2 în funcție de  $n$ . Se presupune că valorile prelucrate de acest program sunt suficient de mici pentru a nu apărea depășirea de reprezentare (*overflow*).

| PC    | Codificare instrucțiuni | Codificare de tip transfer registru (RTL) |
|-------|-------------------------|-------------------------------------------|
| x3001 | 0101 0100 1010 0000     | R2 <- 0                                   |
| x3002 | 0001 0100 1010 0001     | R2 <- R2 + 1                              |
| x3003 | 0001 0100 1000 0010     | R3 <- R2 + R2                             |
| x3004 | 0001 0100 1000 0011     | R2 <- R2 + R3                             |
| x3005 | 0001 0010 0111 1111     | R1 <- R1 - 1                              |
| x3006 | 0000 0011 1111 1100     | BRp x3003                                 |

6. Rezolvați următoarele două cerințe:
- Care este intervalul de numere întregi (exprimat în zecimal) care poate fi specificat în câmpul *Imm* (de valoare imediată) aferent unei instrucțiuni de adunare ADD?
  - Scrieți codificarea a două instrucțiuni în LC-3 ISA care împreună decrementează registrul R3 cu 3 și depune rezultatul în registrul R3. Completați următorul tabel.

| PC    | Codificare instrucțiuni | Limbaj de asamblare / codificare de tip transfer registru (RTL) |
|-------|-------------------------|-----------------------------------------------------------------|
| x3001 |                         |                                                                 |
| x3002 |                         |                                                                 |

7. Se presupune că doriți să scrieți un program începând cu adresa 0x3001 și care cuprinde instrucțiunile cu semantica din ultima coloană a tabelului următor:

| PC    | Codificare instrucțiuni | Codificare de tip transfer registru (RTL) |
|-------|-------------------------|-------------------------------------------|
| x3001 |                         | R2 <- M[R1+0]                             |
| x3002 |                         | R3 <- M[R1+1]                             |
| x3003 |                         | R4 <- NOT R3                              |
| x3004 |                         | R4 <- R4 + 1                              |
| x3005 |                         | R5 <- R2 + R4                             |
| x3006 |                         | BRzp x3009                                |

|       |  |               |
|-------|--|---------------|
| x3007 |  | M[R1+2] <- R3 |
| x3008 |  | BRnzp x3010   |
| x3009 |  | M[R1+2] <- R2 |

- a) Completăți tabelul cu codificarea fiecărei instrucțiuni.
- b) Parcurgeți programul pas cu pas începând cu adresa 0x3001 și completați conținutul următoarelor resurse pe măsură ce se execută fiecare instrucțiune. Prima coloană reprezintă adresa instrucțiunilor ce vor fi procesate, a doua coloană ilustrează operațiile propriu-zise de executat. Următoarele colane redau starea inițială a reștrictiilor generali și a celor de condiție din LC-3 ISA. Se presupune de asemenea că la adresa de memorie 0x3100 se găsește valoarea 14 iar la adresa 0x3101 se găsește valoarea 27.

| PC                                | Operația     | R0 | R1    | R2 | R3 | R4 | R5 | R6 | R7 | CCs |
|-----------------------------------|--------------|----|-------|----|----|----|----|----|----|-----|
| Starea inițială a reștrictiilor → |              | 0  | x3100 | 0  | 3  | 4  | 5  | 6  | 7  |     |
| x3001                             | R2 ← M[R1+0] |    |       | 14 |    |    |    |    |    | P   |
| x3002                             |              |    |       |    |    |    |    |    |    |     |
| x3003                             |              |    |       |    |    |    |    |    |    |     |
| x3004                             |              |    |       |    |    |    |    |    |    |     |
| x3005                             |              |    |       |    |    |    |    |    |    |     |
| x3006                             |              |    |       |    |    |    |    |    |    |     |
| x3007                             |              |    |       |    |    |    |    |    |    |     |
| x3008                             |              |    |       |    |    |    |    |    |    |     |
| x3009                             |              |    |       |    |    |    |    |    |    |     |

- c) Într-o singură propoziție ce calculează programul anterior?
8. Tabelul următor conține un program LC-3 codificat binar și stocat în memorie începând cu adresa 0x3001.

| PC    | Codificare instrucțiuni               | Codificare de tip transfer registru (RTL) |
|-------|---------------------------------------|-------------------------------------------|
|       | 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 |                                           |
| x3001 | 0 1 1 0 0 1 0 0 0 1 0 0 0 0 0 0       | R2 ← M[R1+0]                              |
| x3002 | 0 1 1 0 0 1 1 0 0 1 0 0 0 0 0 1       |                                           |
| x3003 | 1 0 0 1 0 1 1 0 1 1 1 1 1 1 1 1       |                                           |
| x3004 | 0 0 0 1 0 1 1 0 1 1 1 0 0 0 0 1       |                                           |

|       |                                 |  |
|-------|---------------------------------|--|
| x3005 | 0 0 0 1 0 1 0 0 1 0 0 0 0 0 1 1 |  |
| x3006 | 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 |  |
| x3007 | 1 0 0 1 0 1 0 0 1 0 1 1 1 1 1 1 |  |
| x3008 | 0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 1 |  |
| x3009 | 0 1 1 1 0 1 0 0 0 1 0 0 0 0 1 0 |  |

a) Pentru început determinați ce face fiecare instrucțiune. Descrieți printr-o codificare de tip transfer registru (RTL).

b) Parcurgeți programul pas cu pas începând cu adresa 0x3001 și completați conținutul următoarelor resurse pe măsură ce se execută fiecare instrucțiune. Prima coloană reprezintă adresa instrucțiunilor ce vor fi procesate, a doua coloană ilustrează operațiile propriu-zise de executat (determinate la punctul anterior). Următoarele colane redau starea inițială a regiștrilor generali și a celor de condiție din LC-3 ISA. Se presupune de asemenea că la adresa de memorie 0x3100 se găsește valoarea -34 iar la adresa 0x3101 se găsește valoarea -20.

| PC                              | Operația     | R0 | R1    | R2  | R3 | R4 | R5 | R6 | R7 | CCs |
|---------------------------------|--------------|----|-------|-----|----|----|----|----|----|-----|
| Starea inițială a regiștrilor → |              |    | x3100 | 2   | 3  | 4  | 5  | 6  | 7  |     |
| x3001                           | R2 ← M[R1+0] |    |       | -34 |    |    |    |    |    | N   |
| x3002                           |              |    |       |     |    |    |    |    |    |     |
| x3003                           |              |    |       |     |    |    |    |    |    |     |
| x3004                           |              |    |       |     |    |    |    |    |    |     |
| x3005                           |              |    |       |     |    |    |    |    |    |     |
| x3006                           |              |    |       |     |    |    |    |    |    |     |
| x3007                           |              |    |       |     |    |    |    |    |    |     |
| x3008                           |              |    |       |     |    |    |    |    |    |     |
| x3009                           |              |    |       |     |    |    |    |    |    |     |

c) Într-o singură propoziție ce calculează programul anterior ?

9. LC-3 ISA nu furnizează un opcode pentru funcția logică SAU (OR). Cu toate acestea, se poate scrie o secvență scurtă de instrucțiuni pentru implementarea operației de SAU logic. Cele patru instrucțiuni de mai jos efectuează operația de SAU logic având ca operanzi sursă regiștrii R1 și R2 iar rezultatul este depus în registrul R3. Completați cele două instrucțiuni care lipsesc pentru obținerea rezultatului dorit.

(1): 1001 100 001 111111

(2): \_\_\_\_\_

(3): 0101 110 100 000 101

(4): \_\_\_\_\_

- 10.** a) Dispunând doar de instrucțiunile ADD, AND și NOT cum poate fi implementată o instrucțiune de scădere (descrieți succesiunea de instrucțiuni care concură la execuția unei operații de scădere):

**SUB Reg[Dst], Reg[Src1], Reg[Src2].**

b) Aceeași problemă dar pentru instrucțiunea

**XOR Reg[Dst], Reg[Src1], Reg[Src2].**

c) Cum copiem un registru sursă într-unul destinație:

**MOVE Reg[Dst], Reg[Src1].**

d) Cum inițializăm un registru cu 0 ?

- 11.** Pe timpul cărei faze de procesare din ciclul instrucțiunii se modifică registrul PC ? Dar IR, MAR și MDR ? Exemplificați pe următoarele cazuri:

a) Pentru instrucțiunea de adunare al cărei opcode este 0001 (ADD):

|     | <i>Fetch Instrucțiune</i> | Decodificare | Evaluare Adresă | Fetch Operand | Execuție | Scrie Rezultat |
|-----|---------------------------|--------------|-----------------|---------------|----------|----------------|
| PC  |                           |              |                 |               |          |                |
| IR  |                           |              |                 |               |          |                |
| MAR |                           |              |                 |               |          |                |
| MDR |                           |              |                 |               |          |                |

b) Pentru instrucțiunea de citire din memorie în mod de adresare directă al cărei opcode este 0010 (LD):

|     | <i>Fetch Instrucțiune</i> | Decodificare | Evaluare Adresă | Fetch Operand | Execuție | Scrie Rezultat |
|-----|---------------------------|--------------|-----------------|---------------|----------|----------------|
| PC  |                           |              |                 |               |          |                |
| IR  |                           |              |                 |               |          |                |
| MAR |                           |              |                 |               |          |                |
| MDR |                           |              |                 |               |          |                |

- c) Pentru instrucțiunea de scriere în memorie în mod de adresare directă cărei opcode este 0011 (ST):

|     | <i>Fetch Instrucțiune</i> | Decodificare | Evaluare Adresă | Fetch Operand | Execuție | Scrie Rezultat |
|-----|---------------------------|--------------|-----------------|---------------|----------|----------------|
| PC  |                           |              |                 |               |          |                |
| IR  |                           |              |                 |               |          |                |
| MAR |                           |              |                 |               |          |                |
| MDR |                           |              |                 |               |          |                |

- d) Pentru instrucțiunea de salt condiționat al cărei opcode este 0000 (BR):

|     | <i>Fetch Instrucțiune</i> | Decodificare | Evaluare Adresă | Fetch Operand | Execuție | Scrie Rezultat |
|-----|---------------------------|--------------|-----------------|---------------|----------|----------------|
| PC  |                           |              |                 |               |          |                |
| IR  |                           |              |                 |               |          |                |
| MAR |                           |              |                 |               |          |                |
| MDR |                           |              |                 |               |          |                |

12. Pentru următoarele instrucțiuni descrieți ce operații au loc pe perioada fiecărei faze de procesare din ciclul instrucțiunii.
- ADD R1, R2, R3
  - LD R1, LABEL
  - NOT R1, R1
13. Ce se întâmplă dacă în codificarea instrucțiunii de salt BR x, *Label*, câmpul IR[11:9] – este „000” ? Dar dacă este „111” ?

## **7. LIMBAJUL DE ASAMBLARE AFERENT ARHITECTURII LC-3. ASAMBLORUL. ETAPELE GENERĂRII CODULUI MAŞINĂ. TABELA DE SIMBOLURI**

### **7.1. MOTIVE PENTRU A PROGRAMA ÎN LIMBAJ DE ASAMBLARE**

Limbajul de asamblare este un limbaj de programare, principala sa deosebire față de limbajele de nivel înalt, cum sunt BASIC, PASCAL și C/C++, fiind aceea că el oferă doar câteva tipuri simple de comenzi și date. Limbajele de asamblare nu specifică tipul valorilor păstrate în variabile, lăsând programatorul să aplice asupra lor operațiile potrivite. Scopul limbajului de asamblare este de a face mai prietenos procesul de programare decât programarea directă în limbaj mașină.

În ciuda unor dezavantaje clare, specifice programării în limbaj de asamblare: *lizibilitate greoie a codului* (greu de scris, citit și înțeles), *depanare și întreținere dificilă*, *lipsa portabilității codului*, există motive pentru care încă, nu s-a renunțat la limbajul de asamblare. Printre acestea se numără viteza ridicată de execuție a programelor, spațiul relativ redus consumat de acestea dar și permiterea accesului la anumite resurse hardware, acces care nu este disponibil în limbajele de nivel înalt [Seb].

Un motiv **pentru programarea în limbaj de asamblare** îl reprezintă prezența rutinelor aferente sistemului de operare. Întrucât acestea sunt apelate foarte des pe parcursul funcționării sistemului de calcul (atât în programe utilizator cât și în funcții ale sistemului de operare), este necesar un **timp redus de execuție** din partea lor și să ocupe un **cât mai puțin spațiu de memorie**. Programarea în limbaj de asamblare este în primul rând dependentă de mașina (microarhitectura hardware) pe care se procesează, obligând programatorul să cunoască cât mai detaliat arhitectura setului de instrucțiuni – ISA.

Un alt motiv **în favoarea** programării în limbaj de asamblare îl reprezintă ampolarea și dinamismul existent în dezvoltarea de sisteme

dedicate. Performanța se focalizează pe îndeplinirea cerințelor de timp real ale aplicației (aplicații cu microcontrolere, procesoare de semnal, aparate foto și camere video, comanda aparatelor electrocasnice, telefoane mobile, imprimante, comenzi auto, jocuri electronice, switch-uri pentru rețele, etc). Sunt caracterizate în principal de **consumuri reduse de putere** (deseori sunt alimentate prin baterii și acumulatori) și **memorii de capacitate relativ reduse**.

Un alt aspect care **recomandă studiul limbajelor de asamblare** (deși este dependent de un anumit ISA principiile sunt aceleași) îl reprezintă **caracterul său formativ**: o cunoaștere și o mai bună înțelegere a modului de lucru al procesorului, a modurilor de adresare, a organizării memoriei, a lucrului cu stive poate ajuta la înțelegerea mecanismelor de generare a stivei de date aferentă funcțiilor, a recursivității și a transferului de parametrii la nivelul funcțiilor, conducând în final la scrierea de programe eficiente în limbajele de nivel înalt (independente de mașină) [Seb, Lun05, Mus97].

De asemenea, **medii integrate de programare-dezvoltare** și compilatoare de limbi de nivel înalt (C, Pascal, etc.) prezintă **facilități de inserare în codul sursă de nivel înalt a liniilor scrise direct în limbaj de asamblare** sau link-editarea într-un singur modul a mai multor module obiect provenite de la compilarea unor coduri sursă, scrise în limbi de programare diferite (C, asamblare). În cazul aplicațiilor ample, modulele care necesită structuri de date complexe și tehnici de programare / algoritmi complicați de rezolvare, sunt scrise module în limbi de nivel înalt, iar cele care sunt critice din punct de vedere al timpului de execuție și al resurselor utilizate sunt implementate în limaj de asamblare specific procesorului pe care se execută aplicația.

La toate acestea se mai pot adăuga cauze externe cum ar fi integrarea programatorului într-un colectiv / proiect software care lucrează la rutine ale sistemului de operare sau care trebuie să modifice anumite programe existente, scrise în asamblare, sau anumite zone de cod rulează prea încet sau consumă prea multă memorie.

Pe lângă prezentarea instrucțiunilor din limbajul de asamblare LC-3 acest capitol urmărește descrierea etapelor necesare generării imaginii executabile a unui program pornind de la sursa sa scrisă în limbaj de asamblare. Instrumentul software care realizează acest lucru se numește **asamblor**. Acesta transformă fiecare instrucțiune scrisă în limbaj de asamblare (într-o formă „cât de cât” prietenosă programatorului – de exemplu ADD R6,R2,R1) **într-o singură instrucțiune scrisă în limbaj mașină** (succesiune de 0 și 1 – extrem de prietenosă procesorului și întregului sistem de calcul 0001110010000001). Procesul de asamblare

realizează o corespondență între fiecare simbol (element de limbaj de asamblare) și setul de instrucțiuni specificat de ISA-ul mașinii hardware pe care se execută programul. Mnemonicile (ADD, LDR, BRnz, etc.) sunt înlocuite cu biții câmpului de opcode, etichetele – nume simbolice (LOOP, YES, NO, AGAIN, etc.) – sunt înlocuite cu adresele reale ale locațiilor de memorie. Suplimentar, datorită directivelor de asamblare se fac operații de alocare de memorie și initializare date. Trebuie adăugat că unei instrucțiuni dintr-un limbaj de nivel înalt (ex: C, Pascal, etc.) îi corespunde o secvență de instrucțiuni mașină (unul sau mai multe coduri).

## 7.2. SINTAXA ASAMBLOR LC-3 [Patt03]

Fiecare linie într-un program de asamblare reprezintă una din următoarele:

- instrucțiune
- directivă de asamblare
- comentariu

Spațiile albe dintre simboluri sunt ignorate. Limbajul de asamblare **LC-3 nu este case sensitiv**. Comentariile în fișiere de asamblare LC-3 încep cu simbolul ';' (ca și la INTEL). Orice urmează acestui caracter până la sfârșitul liniei este ignorat. Identifierii sunt o secvență de caractere alfanumerice, linie de subliniere, și trebuie să nu înceapă cu un număr. Opcode-ul instrucțiunilor sunt cuvinte rezervate care nu pot fi folosite ca identifieri. Etichetele sunt declarate prin așezarea lor la începutul unei linii. Numerele sunt implicit în baza 10 și sunt precedate de simbolul#. Dacă sunt precedate de caracterul 0x, ele sunt interpretate în sistemul de numerație hexazecimal. Deci, #256 și 0x100 semnifică aceeași valoare.

Șirurile sunt încadrate de ghilimele “”. Caracterele speciale din șiruri urmează convenția limbajului C. Astfel:

- linie nouă \n
- tab \t
- ghilimele ””

Directivele de asamblare reprezintă false operații întrucât ele nu referă operații execute de programul utilizator, fapt pentru care nu sunt translatable în instrucțiuni ale limbajului mașină (LM). Deși se aseamănă cu instrucțiunile (caracterizate de un cod de operație) ele sunt precedate întotdeauna de „.” (simbolul punct). Sunt utilizate de asamblor pentru a

aloca, inițializa zone de memorie de date necesare în program dar și pentru a marca începutul și sfârșitului zonei de cod alocate programului sursă.

În tabelul 7.1. sunt prezentate, câteva din **directivele de asamblare ale LC-3**.

| Nume directivă | Operand              | Semantică                                                                                                                                                                                                                                       |
|----------------|----------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| .ORIG          | address              | Adresa de start a programului în memorie. Această adresă se va încărca în PC la lansarea în execuție a codului mașină.                                                                                                                          |
| .END           |                      | Marchează sfârșitul programului sursă. Atenționează asamblorul să nu mai incrementeze contorul de linii în etapa de generare a tabelei de simboluri.                                                                                            |
| .BLKW          | n                    | Alocă <i>n</i> cuvinte de spațiu pentru eventuale salvări.                                                                                                                                                                                      |
| .EXTERNAL      |                      | Eticheta declarată EXTERNAL indică asamblorului faptul că este definită în alt modul (tabela de simboluri aferentă respectivului modul îi asignează o adresă).                                                                                  |
| .FILL          | val                  | Alocă un cuvânt de memorie și îl inițializează cu valoarea <i>val</i> .                                                                                                                                                                         |
| .STRINGZ       | n - character string | Alocă <i>n+1</i> locații de memorie (cuvinte) și salvează în această zonă sirul de caractere respectiv (câte un cuvânt per locație). În locația <i>n+1</i> este salvat caracterul x0000 – terminatorul NULL – care marchează sfârșitul sirului. |

**Tabelul 7.1.** Directivele de asamblare ale LC-3

Formatul instrucțiunilor aferente LC-3 ISA este de lungime fixă (caracteristică a procesoarelor RISC) pe 16 biți, și după cum poate fi observat și în figura 7.1 este alcătuit din 4 câmpuri: **OPCODE**, **OPERANZI**, **ETICHETE** și **COMENTARII** (dintre care primele două sunt obligatorii iar ultimele două sunt opționale).



**Figura 7.1.** Formatul instrucțiunilor în limbajul de asamblare LC-3

**Opcode – ul** reprezintă cuvinte rezervate care nu trebuie să fie folosite pe post de identificatori, etichete și care corespund instrucțiunilor din setul LC-3 ISA (în limbaj mașină opcode-ul este reprezentat pe 4 biți). Toate instrucțiunile și implicit opcode-urile sunt ilustrate în subcapitolul 7.2.1 (ex: ADD, AND, LD, LDR, ...).

**Operanții** pot exista sub următoarea formă:

- **regiștri** – specificați prin **R<sub>n</sub>**, unde **n** reprezintă numărul registrului ( $n \in [0 \div 7]$  la LC-3 ISA)
- **valori numerice** – reprezentate în sistemul de numerație zecimal folosind # sau hexazecimal (folosind 0x)
- **etichete** – nume simbolice a unor locații de memorie (vezi LD, ST, BR etc.)

Operanții sunt separați prin virgulă. Numărul, ordinea și tipul corespund formatului instrucțiunii (vezi subcapitolul 7.2.1).

Ex:      ADD     R1, R1, R3        R1  $\leftarrow$  R1+R3  
           ADD     R1, R1, #3        R1  $\leftarrow$  R1+3  
           LD       R6, NUMBER      R6  $\leftarrow$  MEM[NUMBER]  
           BRz      LOOP              Execuță salt la LOOP pe condiție  
                                         egală cu zero.

**Etichetele** sunt plasate la începutul fiecărei linii și asignează un nume simbolic corespunzător unei linii de adresă (folosită apoi de instrucțiunile de salt sau de instrucțiunile cu referire la memorie).

Ex1      LOOP     ADD     R1,R1,#-1  
             BRp      LOOP

Ex2:

```

.
.
LD       R2, SIX
.
.
SIX
.FILL    6
```

**Comentariu** este orice secvență de simboluri care urmează caracterului „;”. Este ignorat de către asamblor, rolul său fiind de a ajuta dezvoltatorii și utilizatorii de programe pentru o mai bună documentare și înțelegere a secvențelor de cod. Există însă și câteva artificii (reguli de respectat) în cazul folosirii comentariilor:

- Trebuie evitată comentarea unor lucruri evidente: de ex. “se decrementează R1”.
- Furnizați indicii suplimentare de genul “în R6 se calculează produsul prin acumulare – însumări repetate”.
- Folosiți comentariile pentru a separa bucătile de program cu caracter distinct.

În continuare sunt prezentate câteva sfaturi legate de stilul de programare pentru îmbunătățirea lizibilității și înțelegерii codului scris în limbaj de asamblare, dar nu numai.

1. Realizați un antet cu numele autorului, eventuale date de contact și scopul programului
2. Etichetele, opcode-ul, operanții și comentariile să înceapă în aceeași coloană, exceptând cazurile în care întreg rândul este un comentariu.
3. Folosiți comentarii pentru a explica ce reține fiecare registru și respectiv ce face fiecare instrucțiune.
4. Folosiți nume simbolice edificatoare, dacă este cazul mixați literele mici cu cele mari (de ex. ASCIItoBinary, InputRoutine, SaveR1).
5. Folosiți comentariile pentru a separa secțiunile de program cu caracter distinct.
6. Evitați trunchierile de instrucțiuni sau desfășurarea acestora pe două pagini de text. Enunțurile lungi separați-le într-o manieră estetică.

Primul program scris în limbaj de asamblare LC-3 propus drept exemplu realizează înmulțirea unui număr întreg cu o constantă (6) prin adunări repetitive.

```
.ORIG x3050
LD    R1, SIX
LD    R2, NUMBER
AND   R3, R3, #0 ; Se inițializează R3 cu 0. În R3 se va
                  calcula produsul.
```

; Bucla de calcul a sumei repetitive (produsul)

AGAIN

```
ADD   R3, R3, R2 ; R3←R3+R2
ADD   R1, R1, #-1 ; R1 păstrează numărul de iterații (de
                  însumări care trebuie făcute) R1←R1 - 1
```

BRp      AGAIN ; dacă este setat bitul de condiție P (în urma scăderii rezultatul ; este strict pozitiv) se execută salt la eticheta AGAIN și reia o ; nouă iterație

HALT  
NUMBER

.BLKW 1 ; pentru ca programul să execute înmulțirea dintre numerele dorite trebuie ca ; la locația NUMBER să se intervină la nivelul simulatorului și să se înscrie ; o valoare numerică sau directiva de asamblare .BLKW 1 să fie înlocuită cu ; una de genul FILL *număr\_dorit*

SIX  
.FILL x0006  
.END

### 7.2.1. CORESPONDENȚĂ LIMBAJ DE ASAMBLARE LC-3 – LIMBAJ MAȘINĂ SPECIFIC LC-3 ISA

| M    | 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8     | 7 | 6 | 5 | 4 | 3 | 2           | 1 | 0 |
|------|----|----|----|----|----|----|---|-------|---|---|---|---|---|-------------|---|---|
| ADD  | 0  | 0  | 0  | 1  |    | DR |   | SR1   |   | 0 | 0 | 0 |   | SR2         |   |   |
| ADD* | 0  | 0  | 0  | 1  |    | DR |   | SR1   |   | 1 |   |   |   | Imm5        |   |   |
| AND  | 0  | 1  | 0  | 1  |    | DR |   | SR1   |   | 0 | 0 | 0 |   | SR2         |   |   |
| AND* | 0  | 1  | 0  | 1  |    | DR |   | SR1   |   | 1 |   |   |   | Imm5        |   |   |
| BR   | 0  | 0  | 0  | 0  | n  | z  | p |       |   |   |   |   |   | Pageoffset9 |   |   |
| JSR  | 0  | 1  | 0  | 0  | L  | 0  | 0 |       |   |   |   |   |   | Pageoffset9 |   |   |
| JSRR | 1  | 1  | 0  | 0  | L  | 0  | 0 | BaseR |   |   |   |   |   | Index6      |   |   |
| LD   | 0  | 0  | 1  | 0  |    | DR |   |       |   |   |   |   |   | Pageoffset9 |   |   |
| LDI  | 1  | 0  | 1  | 0  |    | DR |   |       |   |   |   |   |   | Pageoffset9 |   |   |
| LDR  | 0  | 1  | 1  | 0  |    | DR |   | BaseR |   |   |   |   |   | Index6      |   |   |
| LEA  | 1  | 1  | 1  | 0  |    | DR |   |       |   |   |   |   |   | Pageoffset9 |   |   |

|             |   |   |   |   |           |   |   |                    |                  |   |   |   |   |   |   |   |
|-------------|---|---|---|---|-----------|---|---|--------------------|------------------|---|---|---|---|---|---|---|
| <b>NOT</b>  | 1 | 0 | 0 | 1 | <b>DR</b> |   |   | <b>SR1</b>         |                  |   | 1 | 1 | 1 | 1 | 1 | 1 |
| <b>RET</b>  | 1 | 1 | 0 | 1 | 0         | 0 | 0 | 0                  | 0                | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| <b>RTI</b>  | 1 | 0 | 0 | 0 | 0         | 0 | 0 | 0                  | 0                | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| <b>ST</b>   | 0 | 0 | 1 | 1 | <b>SR</b> |   |   | <b>Pageoffset9</b> |                  |   |   |   |   |   |   |   |
| <b>STI</b>  | 1 | 0 | 1 | 1 | <b>SR</b> |   |   | <b>Pageoffset9</b> |                  |   |   |   |   |   |   |   |
| <b>STR</b>  | 0 | 1 | 1 | 1 | <b>SR</b> |   |   | <b>BaseR</b>       | <b>Index6</b>    |   |   |   |   |   |   |   |
| <b>TRAP</b> | 1 | 1 | 1 | 1 | 0         | 0 | 0 | 0                  | <b>Trapvect8</b> |   |   |   |   |   |   |   |

#### Legendă:

Coloana **M** reprezintă mnemonicele instrucțiunilor limbajului de asamblare LC-3.

Corespunzător fiecărei linii (instrucțiuni) coloanele **15÷0** reprezintă instrucțiunea în limbaj mașină, biții **15÷12** reprezentând **opcode-ul** (se reamintește faptul că LC-3 ISA conține 16 instrucțiuni distințe).

**DR** – registru destinație

**SR** – registru sursă

**Imm5** – valoare imediată pe 5 biți. Instrucțiunile de adunare și „SI Logic” pot opera atât cu doi operanzi aflați în registrii cât și cu unul situat în registru și al doilea fiind o valoare imediată căreia își se extinde semnul pe 16 biți.

**BaseR** – registru de bază folosit în instrucțiunile cu referire la memorie și mod de adresare indexat iar **Index6** reprezintă deplasamentul pe 6 biți.

**Pageoffset9** – deplasament pe 9 biți relativ la o adresă de bază (aceasta poate fi PC-ul instrucțiunii următoare în cazul instrucțiunilor LD, ST, BR sau JSR).

**Trapvect8** – codificare vectorului de intrerupere pe 8 biți fără semn, existând 256 de intreruperi la arhitectura LC-3 ISA

#### 7.2.2. APELURI SISTEM

Întreruperile software la nivel *low* numite **apeluri sistem** reprezintă un mic set de servicii ale sistemului de operare prin instrucțiuni (*syscall* – la procesorul MIPS, întreruperi software *int 21h* la Intel, *TRAP* la arhitectura

LC-3). Pentru a apela un serviciu, trebuie încărcat codul apelului sistem într-unul din registri arhitecturali (la MIPS în \$2 (\$v0), la LC-3 în R0, la Intel în AH). În tabelul 7.2 sunt prezentate cele mai uzuale apele sisteme implementate în cadrul arhitecturii LC-3 - ISA.

| Serviciul | Cod Apel Sistem | Descriere                                                                                                                                                                  |
|-----------|-----------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| HALT      | TRAP x25        | Se oprește execuția și se afișează un mesaj corespunzător pe consolă.                                                                                                      |
| IN        | TRAP x23        | Se afișează un mesaj pe consolă – „gen prompter”, citește (cu ecou) un caracter de la tastatură.. Codul ASCII al caracterului respectiv este memorat în registrul R0[7:0]. |
| OUT       | TRAP x21        | Afișează pe consolă caracterul având codul ASCII în R0[7:0].                                                                                                               |
| GETC      | TRAP x20        | Citește (fără ecou) un caracter de la tastatură.. Codul ASCII al caracterului respectiv este memorat în registrul R0[7:0].                                                 |
| PUTS      | TRAP x22        | Afișează pe consolă un sir de caractere încheiat cu terminatorul NULL. Adresa sirului se găsește în R0.                                                                    |

**Tabelul 7.2. Servicii Sistem**

### 7.3. PROCESUL DE ASAMBLARE - ETAPELE GENERĂRII CODULUI MAȘINĂ

Procesul de asamblare presupune convertirea unui fișier scris în mnemonică de asamblare (.asm – la LC-3 și Intel, .s la MIPS) într-un fișier executabil pe platforma destinație (în cazul de față simulatorul LC-3). Codul generat poate fi direct executabil (gata de rulare) sau în format cod obiect (pseudo-executabil .obj) care trebuie legat (link-editat) cu codul obiect al funcțiilor de bibliotecă apelate în modulul respectiv sau cu alte fișiere obiect. Se disting două etape:

- Scanarea codului sursă asamblare și **generarea tabelei de simboluri**

- Reanalizarea programului sursă și folosind informațiile din tabela de simboluri se generează **codul în limbaj mașină specific mașinii destinație**



**Figura 7.2.** Etapele generării codului mașină pornind de la limbajul de asamblare LC-3

### 7.3.1. GENERAREA TABELEI DE SIMBOLURI (TS)

Reprezintă prima etapă a procesului de asamblare și presupune următoarea secvență de pași:

- Se parcurge fiecare linie din fișierul sursă asamblare.
- Pentru fiecare linie nevidă din program, se determină dacă aceasta conține o etichetă (pe prima coloană) și se calculează adresa corespunzătoare (vezi mai jos) adăugându-se la tabelă de simboluri. O linie care conține doar comentariu se consideră vidă din punctul de vedere al asamblorului.
- Se identifică directiva **.ORIG**, care stabilește adresa de start a primei instrucțiuni.
- Se păstrează un contor local (LC) al adreselor (incrementat cu 1 la fiecare instrucțiune). Contorul local se initializează cu valoarea adresei specificată prin directiva **.ORIG**.
- Procesul se încheie la întâlnirea directivei **.END**.
- Trebuie specificat că la întâlnirea directivelor de asamblare **.BLKW** sau **.STRINGZ** contorul local se incrementează cu numărul de cuvinte (words) alocate.

Revenind la exemplul din subcapitolul 7.2 tabela de simboluri arată în felul următor:

| <b>Simbol</b> | <b>Adresă</b> |
|---------------|---------------|
| AGAIN         | 0x3053        |
| NUMBER        | 0x3057        |
| SIX           | 0x3058        |

### 7.3.2. OBTINEREA CODULUI ÎN LIMBAJUL MAȘINĂ

Reprezintă cea de-a doua etapă a procesului de asamblare și presupune parcurgerea de la început a programului asamblare, linie cu linie, și folosind(dacă este cazul) informațiile din tabela de simboluri tocmai generată se translatează fiecare instrucțiune în cod binar (limbaj mașină). Practic fiecare opcode este înlocuit cu secvența de 4 biți corespunzătoare (vezi secțiunea 7.2.1) iar cei 8 registri sunt înlocuiți cu codificarea binară pe 3 biți a indexului lor. La întâlnirea unei etichete care face parte din corpul unei instrucțiuni (nu este pe prima coloană) se caută aceasta în tabela de simboluri și se ia adresa corespunzătoare. Se verifică să aparțină această adresă în intervalul +256 / -255 linii față de instrucțiunea în cauză (într-o pagină de 9 biți cu semn relativă la PC-ul curent). Se înlocuiește apoi în câmpul corespunzător instrucțiunii curente cei 9 biți mai puțini semnificativi ai adresei obținute făcând diferența dintre **adresa din TS și PC-ul instrucțiunii următoare** (celei cu eticheta).

Pot apărea următoarele probleme:

- ☛ Folosirea necorespunzătoare a numărului sau tipului de argumente.  
De exemplu:

|     |              |
|-----|--------------|
| NOT | R1,#7        |
| ADD | R1,R2        |
| ADD | R3,R3,NUMBER |

- Folosirea argumentelor de tip *imediat* care depășesc domeniul de reprezentare. De exemplu:

ADD R1, R2, #1023

- Utilizarea adreselor (asociate etichetelor) care nu se regăsesc în aceeași pagină de memorie cu instrucțiunea curentă. În acest caz nu se poate aplica modul direct de adresare (trebuie utilizate instrucțiuni cu mod de adresare indexat).

- De asemenea pot apărea erori dacă se folosesc adrese nedeclarate extern și care nu se găsesc în tabela de simboluri.

Revenind la exemplul din subcapitolul 7.2, ținând cont și de tabela de simboluri generată în subcapitolul 7.3.1, codul în limbaj mașină al programului va arăta astfel:

```
, Program de înmulțire a unui număr cu 6
    .ORIG   x3050
x3050      LD R1, SIX           x3050  0010001000000111
x3051      LD R2, NUMBER        x3051  0010010000000101
x3052      AND R3, R3, #0       x3052  0101011011100000
                ; Bucla de calcul
x3053      AGAIN   ADD   R3, R3, R2   x3053  0001011011000010
x3054          ADD   R1, R1, #-1   x3054  0001001001111111
x3055          BRp   AGAIN        x3055  0000001111111101
x3056          HALT        x3056  1111 0000 0010 0101
x3057      NUMBER   BLKW  1       x3057  0000000000000000
x3058      SIX     .FILL  x0006   x3058  0000 0000 0000 0110
                .END
```

După cum se poate observa în figura 7.3, în urma aplicării procesului de asamblare unui fișier sursă asamblare (.asm), folosind opțiunea de **Assemble** din meniu **Translate** al utilitarului **LC-3Edit**, pe lângă fișierul obiect (.obj) sunt generate următoarele fișiere auxiliare:

- Fișierul binar (.bin) conține translatarea fiecărei instrucțiuni în binar (limbaj mașină) inclusiv linia corespunzătoare directivei .ORIG.
- Fișierul binar (.hex) este copia semantică a fișierului binar cu deosebirea că liniile sunt de fapt nu valori în binar ci în hexazecimal.
- Fișierul (.sym) reprezintă tabela de simboluri (ilustrează maparea **nume\_eticheta → Adresă**).
- Fișierul (.lst) conține pe prima coloană adresa instrucțiunii care se va procesa, pe următoarea codificarea hexazecimală a instrucțiunii, urmată de codificarea binară a instrucțiunii, numărul curent al liniei (în zecimal) și pe ultima coloană instrucțiunea în mnemonică asamblare.
- Fișierul obiect (.obj) conține aceleași informații ca și fișierul (.bin) cu deosebirea că informația (programul în limbaj mașină) în fișierul obiect este scrisă în **format binar** (date în format neprintabil) în timp ce în fișierul .bin informația este stocată în format ASCII (poate fi vizualizată folosind un editor de text gen *notepad.exe*). Fișierul .obj urmează a fi încărcat în simulatorul LC-3 și executat. Considerând un nivel suficient

de redus de abstractizare, formatul binar de fișier este caracterizat de o reprezentare compactă a informației în vederea unei analize sintactice și semantice eficiente („*parsing*”). Formatul ELF („***Executable and Linking Format***”) reprezintă un format binar implicit de reprezentare a fișierelor în sistemul de operare Linux. Fișierul ELF este compus dintr-un antet („ELF header”) care conține detalii despre tipul fișierului obiect – direct executabil, partajabil, relocabil, despre arhitectura țintă pe care se va procesa, etc.; antetul este urmat de 0 sau mai multe segmente și 0 sau mai multe secțiuni. Segmentele conțin informații necesare pentru execuția fișierului de aplicație, în timp ce secțiunile conțin date importante necesare procesului de creare a legăturilor între mai multe fișiere obiect (link-editare) și eventual pentru relocate (vezi în continuare).



**Figura 7.3.** Fișierele generate de asamblorul inclus în LC-3Edit în urma asamblării unui cod sursă

### 7.3.3. CREAREA LEGĂTURILOR ÎNTRE MODULE, ÎNCĂRCAREA ȘI LANSAREA ÎN EXECUȚIE

Un fișier obiect nu este neapărat un program complet, gata de rulare. **Imaginea executabilă poate fi generată din mai multe module obiect:** programe de aplicație asamblate, scrise de unul sau mai mulți utilizatori și respectiv funcții de bibliotecă furnizate de către sistemul de operare. Simulatorul LC-3 permite încărcarea mai multor fișiere obiect în memorie și începerea execuției de la o anumită adresă. Un singur fișier obiect trebuie să fie modulul principal (identic cu cazul proiectelor în mediile de programare bazate pe limbajul C când există un singur modul ce conține funcția *main*). Rutinele sistem, destinate interfeței cu tastatura sau consola, sunt încărcate automat în *memoria sistem*, la adrese inferioare valorii 0x1000 – vezi harta de memorie la arhitectura LC-3 (capitolul 10 - figura 10.4). Prin convenție, codul utilizator (instrucțiunile) poate fi încărcat în intervalul de adrese 0x3000 și 0xCFFF. Fiecare fișier obiect trebuie să includă o adresă de start. Programatorii trebuie să aibă grijă să nu suprapună mai multe programe obiect în memorie iar referințele declarate prin directiva .EXTERNAL (încrucișate între mai multe module) trebuie rezolvate atent la generarea codului obiect.

**Crearea legăturilor** – „*Linking*” – reprezintă procesul de rezolvare a simbolurilor partajate între module independente. Link-editorul reprezintă instrumentul software (de regulă component al compilatorului) care va căuta în tabela de simboluri a tuturor modulelor obiect generate pentru a afla adresa reală a etichetelor declarate .EXTERNAL în anumite module și de încheia fază de generare de cod, pregătind încărcarea și apoi execuția.

**Încărcarea și începerea execuției** – „*Loading*” – reprezintă procesul de copiere a imaginii executabile a unui program în memorie (se copiază lista de instrucțuni mașină cu toate referințele simbolice rezolvate în memorie, începând cu adresa specificată prin directiva .ORIG). Lansarea în execuție se face prin copierea adresei de start în registrul PC (*program counter*). „*Încărcătoare software*” mai complexe sunt capabile să ~~reloc~~ (gestioneze eficient, modificând chiar) spațiul aferent imaginii executabile astfel încât codul mașină să poată fi încadrat în memoria disponibilă. Problema relocării apare mai ales în situația utilizării mai multor fișiere obiect scrise de programatori independenți și care folosesc adrese de start identice sau situate într-o vecinătate a spațiului de memorie. În aceste cazuri trebuie reajustate target-urile instrucțiunilor de ramificație și adresele datelor solicitate de către instrucțiunile cu referire la memorie (load / store).

## 7.4. EXERCIȚII ȘI PROBLEME

1. Secvența de program de mai jos urmărește să deplaseze registrul R3 la stânga cu 4 biți, dar conține o eroare. Identificați eroarea și explicați cum poate fi înălțată astfel încât programul să funcționeze corect.

```

.ORIG x3000
AND R2, R2, #0
ADD R2, R2, #4
LOOP BRz DONE
      ADD R2, R2, # -1
      ADD R3, R3, R3
      BRnzp LOOP
DONE   HALT
.END

```

2. Următorul program intenționează să citească două numere (caractere) de la tastatură, să le adune și apoi să afișeze suma.

|         |                                                |
|---------|------------------------------------------------|
| ADDTHEM | TRAP x23 ; IN – se citește primul număr        |
|         | ADD R4,R0,#0                                   |
|         | TRAP x23 ; IN – se citește al doilea număr     |
|         | ADD R0,R4,R0                                   |
|         | TRAP x21 ; OUT – afișare rezultat              |
|         | TRAP x25 ; HALT – încheiere program utilizator |

- a) Ce nu este în regulă cu acest program ?  
 b) Dacă se introduce de la tastatură 5, și apoi 3, ce rezultat se va afișa pe consolă (ecran) ?
3. Câte locații de memorie va aloca asamblorul LC-3 pentru stocarea următorului mesaj? (toate numerele din soluție sunt în sistemul de numerație zecimal).

.STRINGZ "Hasta la vista, baby!"

- a. 19
- b. 20
- c. 21
- d. 22

4. La adresa 0xA400 se consideră instrucțiunea:

0xA400            LDR R1, R2, 0x10

În plus cunoscând că: (R2) = 0xB000; Mem[xB000] = 0xFFFF;  
Mem[0xB010] = 0x000F;

Care este valoarea registrului R1 după execuția instrucțiunii de la adresa 0xA400?

- a. 0xA420
- b. 0xB000
- c. 0xB020
- d. 0x000F
- e. 0xFFFF

5. Care dintre următoarele instrucțiuni va seta codurile de condiție (n, z, p) bazându-ne doar pe valoarea conținută în registrul R1, fără a modifica conținutul **niciunui** registru? Puteți modifica una dintre instrucțiunile date pentru a mai găsi o soluție ?

- a. ADD R2, R1, #0
- b. ST R1, LABEL
- c. ADD R1, R1, R1
- d. AND R1, R1, #0
- e. AND R1, R1, # -1

6. Următorul program LC-3 program determină dacă un sir de caractere este sau nu **palindrom**. Un palindrom este un sir de caractere care citit invers (de la dreapta la stânga) este identic cu sirul citit în sensul normal (de la stânga la dreapta). Un astfel de exemplu este sirul “racecar”. Presupunând că sirul este stocat în memorie începând cu adresa 0x4000, și se încheie cu valoarea 0x0, similar cu funcția directivei de asamblare .STRINGZ. Dacă sirul aflat în memorie este palindrom, programul se încheie setând valoarea 1 în registrul R5. În caz contrar, programul se încheie, în R5 introducându-se valoarea 0. Se cere să se completeze spațiile goale cu instrucțiunile lipsă pentru ca programul să funcționeze.

```
.ORIG 0x3000
; Step 1
LD   R0, PTR
ADD R1, R0, #0
```

|                  |                                                             |
|------------------|-------------------------------------------------------------|
| AGAIN            | LDR R2, R1, #0<br>BRz CONT<br>ADD R1, R1, #1<br>BRnzp AGAIN |
| <hr/>            |                                                             |
| CONT<br>; Step 2 | LDR R3, R0, #0                                              |
| <hr/>            |                                                             |
| LOOP             | NOT R4, R4<br>ADD R4, R4, #1<br>ADD R3, R3, R4<br>BRnp NO   |
| <hr/>            |                                                             |
| ; Step 3         | NOT R2, R0<br>ADD R2, R2, #1<br>ADD R2, R1, R2<br>BRnz YES  |
| <hr/>            |                                                             |
| ; Step 4         | AND R5, R5, #0<br>ADD R5, R5, #1<br>BRnzp DONE              |
| YES              | AND R5, R5, #0<br>HALT                                      |
| NO               |                                                             |
| DONE             |                                                             |
| PTR              | .FILL x4000<br>.END                                         |

7. Următorul program este asamblat și executat. Din fericire, nu există erori depistate nici în faza de asamblare nici în cea de execuție. Ce se afișează pe ecran în urma execuției? Presupunem că toți regiștrii sunt inițializați cu 0 înainte de începerea execuției. Se reamintește că întreruperea software TRAP 0x22 afișează pe ecran un sir de caractere, a cărui adresă se află în registrul R0, până întâlnește terminatorul NULL.

173

```
.ORIG x3000
ST R0, x3007
LEA R0, LABEL
TRAP x22
TRAP x25

.STRINGZ "FUNKY"

.STRINGZ "HELLO WORLD"
END
```

8. Completati tabela de simboluri si asamblați instrucțiunile de la etichetele D, E, și F în spațiile avute la dispoziție. Se poate considera că la adresa A, înainte de începerea execuției se află un număr pozitiv. Ce execută programul ?

```
.ORIG 0x3000  
AND R0, R0, #0
```

```

D      LD R1, A
      AND R2, R1, #1
      BRp B

E      ADD R1, R1, #-1

B      ADD R0, R0, R1
      ADD R1, R1, #-2

F      BRp B
      ST R0, C
      TRAP x25

A      .BLKW 1

C      .BLKW 1
      FND

```

## Tabela de simboluri

| Eticheta<br><i>(simbol)</i> | Valoare |
|-----------------------------|---------|
|                             |         |
|                             |         |
|                             |         |
|                             |         |
|                             |         |
|                             |         |
|                             |         |
|                             |         |
|                             |         |
|                             |         |
|                             |         |
|                             |         |

9. Ce realizează programul următor ? Care este valoarea stocată la adresa RESULT după încheierea execuției programului ?

```
.ORIG 0x3000
LD R2, ZERO
LD R0, M0
LD R1, M1
LOOP  BRz  DONE
      ADD R2, R2, R0
      ADD R1, R1, # -1
      BRnzp DONE
DONE   ST R2, RESULT
      HALT
RESULT .FILL 0x0000
ZERO   .FILL 0x0000
M0     .FILL 0x0004
M1     .FILL 0x0803
      .END
```

10. Scrieți un program în limbaj de asamblare LC-3 care contorizează numărul de biți de 1 din valoarea stocată în registrul R0 și depune rezultatul în R1. De exemplu, dacă R0 reține valoarea 0001001101110000, atunci după execuția programului rezultatul stocat în R1 va fi 0000000000000110.

11. Care este scopul directivei de asamblare .END? Prin ce diferă de instrucțiunea HALT?

12. La execuția programului asamblare LC-3, de câte ori se va procesa instrucțiunea de la adresa de memorie etichetată cu LOOP?

```
.ORIG 0x3005
LEA R2, DATA
LDR R4, R2, #0
LOOP  ADD R4, R4, # -3
      BRzp LOOP
      TRAP 0x25
DATA   .FILL 0x000B
      .END
```

13. Se consideră o secvență de numere întregi nenegative stocată în locații consecutive de memorie (câte un cuvânt – număr întreg – per locație) începând cu adresa 0x4000. Fiecare număr întreg are o valoare între 0 și 30000 (zecimal). Secvența se încheie când se întâlnește valoarea -1. Ce realizează programul următor ?

```
.ORIG 0x3000
AND R4, R4, #0
AND R3, R3, #0
LD R0, NUMBERS
LOOP    LDR R1, R0, #0
        NOT R2, R1
        BRz   DONE
        AND R2, R1, #1
        BRz   L1
        ADD R4, R4, #1
        BRnzp NEXT
L1      ADD R3, R3, #1
NEXT    ADD R0, R0, #1
        BRnzp LOOP
DONE    TRAP 0x25
NUMBERS .FILL 0x4000
.END
```

14. Se consideră o secvență de numere întregi stocată în locații consecutive de memorie (câte un număr întreg per locație) începând cu adresa 0x4000. Secvența se încheie când se întâlnește valoarea 0x0000. Ce realizează programul următor ?

```
.ORIG 0x3000
LD R0, NUMBERS
LD R2, MASK
LOOP    LDR R1, R0, #0
        BRz   DONE
        AND R5, R1, R2
        BRz   L1
        BRnzp NEXT
L1      ADD R1, R1, R1
        STR R1, R0, #0
NEXT    ADD R0, R0, #1
```

```

        BRnzp LOOP
DONE      TRAP 0x25
NUMBERS   .FILL 0x4000
MASK      .FILL 0x8000
        .END

```

15. Următorul program asamblare LC-3 compară două siruri de caractere de aceeași lungime. Definiția celor două siruri (stocarea lor în memorie) s-a realizat folosind directiva de asamblare .STRINGZ *șir*. Primul șir începe de la locația FIRST din memorie, iar al doilea de la locația SECOND. Dacă cele două siruri sunt identice, programul se încheie setând valoarea 0 în R5. Dacă sirurile sunt diferite programul se termină generând valoarea 1 în R5. Completați cele 3 spații libere cu instrucțiunile lipsă astfel încât programul să funcționeze corect.

```

        .ORIG 0x3000
        LD R1, FIRST
        LD R2, SECOND
        AND R0, R0, #0
LOOP      _____
        LDR R4, R2, #0
        BRz NEXT
        ADD R1, R1, #1
        ADD R2, R2, #1
        _____
        ADD R3, R3, R4
        BRz LOOP
        AND R5, R5, #0
        BRnzp DONE
NEXT      AND R5, R5, #0
        ADD R5, R5, #1
DONE      TRAP 0x25
FIRST     .FILL 0x4000
SECOND    .FILL 0x4100
        .END

```

## **8. ÎNTRERUPERI SOFTWARE LA NIVEL LOW. APELURI DE SUBRUTINE – DIRECTE ȘI INDIRECTE. REVENIRI. SALVAREA ȘI RESTAURAREA REGIȘTRILOR. STRATEGIILE “CALLER-SAVE” RESPECTIV “CALLEE SAVE”**

### **8.1. ÎNTRERUPERI. DEFINIȚIE. CLASIFICARE**

Prin **întrerupere** se înțelege oprirea programului în curs de execuție și transferul controlului la o nouă adresă de program [Mus97]. La această adresă se află rutina de tratare a încadrării, dedicată soluționării cererii de încadrare. Mecanismul de realizare a transferului este de tipul *apel funcție / revenire*, astfel încât ultima instrucțiune din rutina de tratare trebuie să fie una de revenire (*return*) care să faciliteze întoarcerea în programul principal (cel aflat în execuție în momentul apariției încadrării), în general<sup>11</sup> pe prima instrucțiune de după cea pe care a apărut încadrarea.

Din punct de vedere al generării lor, încadrările se clasifică în **hardware** și **software**. Încadrările inițiate hardware apar ca răspuns la un semnal extern, fiind de două tipuri: **nemascabile** (sau nedezactivabile) și **mascabile** (sau dezactivabile). Încadrările hardware sunt frecvent folosite în calculul de timp real din sistemele multitasking (preluarea controlului de către procesor în anumite situații critice). Încadrările software sunt de regulă implementate ca și instrucțiuni în setul de instrucțiuni al fiecărui procesor. Se cunosc două tipuri de încadrări software:

- **Excepții**, deoarece încadrarea apare numai dacă există o condiție de eroare, care nu permite execuția corespunzătoare a unei instrucțiuni (împărțire cu zero, depășire de domeniu, etc). Un tip

<sup>11</sup> În general revenirea din rutina de tratare a încadrării se face pe instrucțiunea imediat următoare celei care a cauzat încadrarea. Pot însă apărea instrucțiuni de genul *Load Adresă* care să cauzeze o excepție de tip *Page Fault*. În această situație va fi tratată excepția după care se va relua execuția programului cu aceeași instrucțiune de acces la memorie (*Load Adresa*).

special de excepție îl reprezintă *excepția de depanare*, care permite execuția unui program instrucțiune cu instrucțiune („*pas cu pas*”).

- **Întreruperi generate la fiecare execuție a instrucțiunii TRAP *n*** (unde  $n \in (0 \div 255)$ ).

Din punct de vedere al sincronizării cu ceasul procesorului, intreruperile *software* sunt evenimente **sincrone**, reprezentând răspunsuri ale procesorului la anumite evenimente detectate în timpul execuției unei instrucțiuni, în timp ce intreruperile *hardware* sunt evenimente **asincrone**, fiind generate de dispozitive externe. Întreruperile software sunt întotdeauna reproductibile prin reexecuția programului în aceleași condiții de intrare, în timp ce intreruperile hardware sunt de obicei independente de execuția procesului curent.

## **8.2. ÎNTRERUPERI SOFTWARE LA NIVEL LOW – INSTRUCȚIUNILE TRAP**

La nivelul unui sistem de calcul există câteva instrucțiuni prin care un anumit program poate afecta comportamentul altuia (numite *privilegiate*) și care sunt cel mai bine executate de către un program *supervizor* (sistemul de operare) și nu de către programele *utilizator*.

- ◆ Instrucțiuni de Intrare / Ieșire care necesită cunoștințe specifice de utilizare și protecție a regiștrilor de interfață cu dispozitivele periferice (KBDR, KBSR – tastatura și CRTSR, CRTDR – monitorul, etc). Întrucât dispozitivele periferice sunt partajate între mai multe programe și mai mulți utilizatori, o greșală dintr-un program poate afecta mai mulți utilizatori.
- ◆ Instrucțiuni pentru resetarea ceasului sistemului (la acționarea butonului *Reset* sau la oprirea sistemului).
- ◆ Instrucțiuni care marchează încheierea aplicației utilizator și cedarea controlului sistemului de operare.
- ◆ Încărcarea regiștrilor aferenți dispozitivelor periferice și mapări în memoria sistemului de calcul (*memory-mapped registers*<sup>12</sup>)

<sup>12</sup> Majoritatea proiectanților de sisteme de calcul preferă să nu specifiche un set de instrucțiuni suplimentare pentru tratarea interacțiunii dintre procesor și dispozitivele periferice. Aceștia folosesc aceleși instrucțiuni de transfer date utilizate la citirea / scrierea datelor din / în memorie în / din regiștri procesorului (load / store). Astfel, o instrucțiune Load a cărui adresă sursă este specificată printr-un registru aferent unui dispozitiv periferic

Unitatea centrală de procesare (CPU) poate fi proiectată să lucreze în două moduri:

- Mod utilizator
- Mod privilegiat (numit și supervisor, nucleu, monitor).

Doar programele supervisor pot executa instrucțiuni privilegiate. În plus, nu toți programatorii cunosc sau își doresc să afle aceste informații la un nivel foarte ridicat de detaliu.

### 8.2.1. RUTINELE DE TRATARE AFERENTE APELURILOR SISTEM LA LC-3 ISA

Întreruperile software la nivel *low* numite **apeluri sistem** reprezintă un mic set de servicii ale sistemului de operare prin instrucțiuni (*syscall* – la procesorul MIPS, întreruperi software *int* 21h la Intel, TRAP la arhitectura LC-3) care au rolul de a efectua în siguranță operații privilegiate. Pentru a apela un serviciu, trebuie încărcat codul apelului sistem într-unul din regiștri arhitecturali (la MIPS în \$2 (\$v0), la LC-3 în R0, la Intel în AH). Protocolul de efectuare a unui apel sistem se realizează în etapele:

1. Utilizatorul invocă un apel sistem.
2. Este predat controlul sistemului de operare care determină execuția secvenței de cod aferentă rutinei de tratare a întreruperii respective.
3. Returnează controlul programului utilizator.

În cazul arhitecturii LC-3 acest protocol se numește *mecanismul TRAP*. Instrucțiunile TRAP izolează secțiunile de cod critice de utilizator. Mecanismul TRAP se bazează pe următoarele componente:

1. **Mulțimea rutinelor de serviciu** (de tratare a diferențelor întreruperi – rutinele TRAP)

de intrare în sistem, se numește instrucțiune de intrare. Similar, o instrucțiune *Store* a cărui adresă destinație este specificată printr-un registru aferent unui dispozitiv periferic de ieșire din sistem, se numește instrucțiune de ieșire. Întrucât sunt folosite aceleași tipuri de instrucțiuni de acces la memorie și pentru periferice, regiștrii dispozitivelor de intrare / ieșire trebuie identificate în mod unic în același fel cum sunt identificate locațiile de memorie. Astfel, fiecărui registru aferent unui dispozitiv periferic îi este asignată o adresă în spațiul de memorie descris de ISA-ul fiecărui procesor. Practic **regiștrii de intrare / ieșire sunt mapăți spre o zonă de adrese specifică dispozitivelor periferice și nu memoriei de date**. Exemple de familii de procesoare care folosesc regiștrii aferenți dispozitivelor periferice mapăți în memorie în combinație cu instrucțiuni *load / store* sunt MIPS, SPARC și Motorola, iar Intel folosește instrucțiuni speciale de intrare / ieșire incluse în ISA (IN / OUT) pentru citirea sau scrierea datelor din / în regiștrii dispozitivelor periferice.

- Sunt parte integrantă a sistemului de operare; adresele de început a fiecarei rutine sunt arbitrar alese în spațiul de memorie  $0x0000\div 0x2FFF$  sau  $0xCFFF\div 0xFFFF$ .

- Pot fi implementate până la 256 de rutine la arhitectura LC-3 ISA.

- Rutinele de serviciu asigură trei funcții speciale:

- Izolează programatorii de detalii specifice sistemului de operare.
- Permite scrierea codului frecvent utilizat o singură dată și apelarea de câte ori este nevoie.
- Protejează resursele sistemului de programatorii neîndemâncători.

## 2. Tabela adreselor de start

- Adresele de start sunt memorate într-o tabelă de 256 de intrări începând cu adresa  $0x0000$  și până la adresa  $0x00FF$ , numită **tabelă vectorilor de întrerupere TRAP** sau blocul de control sistem în cazul altor arhitecturi. Deși în versiunea actuală a arhitecturii LC-3 ISA sunt implementate doar 5 apele sisteme, orice tentativă de folosire (scriere / citire) a zonei de adrese  $0x0000\div 0x001F$  va genera o excepție.

## 3. Instrucțiunile TRAP

- Sunt folosite în programele utilizator pentru a transfera controlul sistemului de operare. Codifică în corpul instrucțiunii un vector de întrerupere pe 8 biți (codul apelului sistem) care reprezintă un index în tabela cu adresele de start a rutinelor de serviciu. Informația de la locația specificată reprezintă adresa primei instrucțiuni din rutina de tratare a întreruperii, valoare care se încarcă în registrul PC.

## 4. Instrucțiunea RET

- Trebuie să fie prezentă în fiecare rutină de tratare a întreruperii, având rolul de a transfera controlul de la nivelul sistemului de operare la nivelul programului utilizator (în cazul procesorului INTEL se numește *IRET*, iar la MIPS se numește *rfe – return from exception*). Revenirea se face pe instrucțiunea imediat următoare instrucțiunii TRAP.

| 15          | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0                |
|-------------|----|----|----|----|----|---|---|---|---|---|---|---|---|---|------------------|
| <b>TRAP</b> | 1  | 1  | 1  | 1  | 0  | 0 | 0 | 0 |   |   |   |   |   |   | <b>trapvect8</b> |

Figura 8.1. Formatul instrucțiunii TRAP



Figura 8.2. Modul de lucru al instrucțiunii TRAP

În figura 8.1 este prezentat formatul instrucțiunii TRAP iar figura 8.2 ilustrează modul de lucru al acesteia. Primii 4 biți ai instrucțiunii sunt 1 urmați de 4 biți de 0 iar ultimii 8 biți reprezintă codul apelului. În registrul R7 se încarcă valoarea PC-ului (care în momentul execuției instrucțiunii TRAP pointează deja la instrucțiunea următoare din program, PC-ul fiind incrementat în timpul fazei FETCH) – vezi operația 1 din figura 8.2. Întrucât adresele de început ale rutinelor de tratare sunt stocate în memorie de la adresa 0x0000 la adresa 0x00FF rezultă că pentru selecția adresei de început a rutinei corespunzătoare, în registrul MAR, cei mai semnificativi 8 biți ai codului de apel (din registrul IR aferent instrucțiunii TRAP) se extind cu 0 pe 8 biți – vezi operația 1 din figura 8.2. În PC se încarcă adresa primei instrucțiuni din rutina de tratare (valoare citită din memorie de la adresa indicată de MAR și depusă apoi în MDR – vezi operația 2 din figura 8.2), în acest fel fiind predat controlul sistemului de operare – vezi operația 3 din figura 8.2. Trebuie specificat că în cadrul arhitecturii LC-3 ISA, rolul registrului **R7 este de adresă de revenire în programul apelant** iar **R6 are rolul de indicator de stivă** (pointer la ultima locație – cea mai recent – ocupată în stivă). Toate arhitecturile RISC dețin astfel de regiștri (la MIPS – \$ra și \$sp).

Instrucțiunea RET trebuie să fie practic ultima instrucțiune din rutina de tratare a întreruperii (sau a oricărei rutine). Rolul său este de a transfera

conținutul registrului R7 în registrul PC cedând astfel controlul înapoi programului apelant (utilizator) pe instrucțiunea imediat următoare instrucțiunii TRAP (doar dacă nu cumva a fost alterată în interiorul rutinei). Formatul instrucțiunii RET este cel din figura 8.3 iar modul său de lucru este ilustrat în figura 8.4.



**Figura 8.3.** Formatul instrucțiunii RET



**Figura 8.4.** Modul de lucru al instrucțiunii RET

| Vector | Simbol      | Operații efectuate                                                                                                                                                                                                          |
|--------|-------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| x20    | <b>GETC</b> | <ul style="list-style-type: none"> <li>Citește un singur caracter de la tastatură fără ecou.</li> <li>Scrie codul ASCII al caracterului citit în registrul R0[7:0], biții R0[15:8] setându-i pe 0.</li> </ul>               |
| x21    | <b>OUT</b>  | Afișează pe monitor caracterul al cărui cod ASCII se regăsește în registrul R0[7:0].                                                                                                                                        |
| x22    | <b>PUTS</b> | Afișează pe consolă sirul de caractere al cărui adresă de început se află în registrul R0.                                                                                                                                  |
| x23    | <b>IN</b>   | <ul style="list-style-type: none"> <li>Afișează un mesaj pe consolă și citește fără ecou un caracter de la tastatură.</li> <li>Înscrie codul ASCII al caracterului citit în R0[7:0] și resetează biții R0[15:8].</li> </ul> |
| x25    | <b>HALT</b> | Afișează un mesaj de atenționare pe ecran și întrerupe execuția programului.                                                                                                                                                |

|       |       |
|-------|-------|
| ⋮     | ⋮     |
| x0020 | x0400 |
| x0021 | x0430 |
| x0022 | x0450 |
| x0023 | x04A0 |
| x0024 | x04E0 |
| x0025 | xFD70 |
| ⋮     | ⋮     |

**Figura 8.5.** Semantica instrucțiunilor TRAP. Adresele de start aferente rutinelor de tratare ale întreruperii

Se consideră următorul exemplu care folosește apelurile sistem de *citire / scriere caracter* și *încheiere program*. Problema care se rezolvă *citește un caracter de la tastatură atâta timp cât este diferit de cifra 7 și la codul său ASCII se adaugă 0x20* (dacă s-ar tasta doar litere mari ale alfabetului englez atunci programul le transformă în litere mici).

|        |                 |                                                                                     |
|--------|-----------------|-------------------------------------------------------------------------------------|
|        | .ORIG x3000     | Încarcă inversul codului ASCII al cifrei ‘7’ (-55)                                  |
|        | LD R2, TERM;    | Încarcă diferența de cod ASCII dintre litere mici și mari                           |
|        | LD R3, ASCII;   | Se citește un caracter de la tastatură                                              |
| AGAIN: | TRAP x23;       | Se verifică dacă s-a tastat ‘7’ în caz afirmativ înceindu-se execuția programului   |
|        | ADD R1, R2, R0; | S-a tastat ‘7’ salt la apelul sistem de ieșire din program                          |
|        | BRz EXIT ;      | Se adaugă diferența de 0x20 la codul ASCII al caracterului introdus de la tastatură |
|        | ADD R0, R0, R3; | Se afișează pe monitor noul caracter obținut                                        |
|        | TRAP x21 ;      | Se reia execuția până se va tasta ‘7’ de la tastatură                               |
|        | BRnzp AGAIN;    | -‘7’                                                                                |
| TERM:  | .FILL xFFC9 ;   | Diferența dintre litere mici și mari                                                |
| ASCII: | .FILL x0020 ;   | Se încheie execuția programului                                                     |
| EXIT:  | TRAP x25 ;      |                                                                                     |
|        | .END            |                                                                                     |

**Obs:** Codul ASCII pentru cifra ‘7’ este 0x37=55 în zecimal. Trebuie specificat că cifra ‘7’ a fost aleasă doar pentru test, putând fi aleasa oricare altă valoare (caracter) de test.

Secvența următoare de cod reprezintă conținutul rutinei de tratare aferentă apelului sistem de afișare caracter – ***Output Service Routine (TRAP 0x21)***.

|          |                                                                |                                                                                                                                                                                          |
|----------|----------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|          | .ORIG x0430 ;                                                  | Adresa de start a rutinei de tratare a apelului <b>TRAP 0x21</b>                                                                                                                         |
|          | ST R7, SaveR7;                                                 | Salvează conținutul regiștrilor R7 și R1 – posibil a fi modificați pe parcursul rutinei de tratare                                                                                       |
|          | ST R1, SaveR1<br>; ----- <i>Scrie caracter</i>                 |                                                                                                                                                                                          |
| TryWrite | LDI R1, CRTSR;                                                 | Citește starea monitorului (registratorul CRTSR). Dacă bitul cel mai semnificativ este 1 atunci se înscrive codul ASCII al caracterului de afișat în registrator de date al monitorului. |
|          | BRzp TryWrite;                                                 | Se testează bitul cel mai semnificativ al registratorului de stare                                                                                                                       |
| WriteIt  | STI R0, CRTDR;                                                 | Se înscrive codul ASCII al caracterului de afișat în registrator de date al monitorului (registrator CRTDR)                                                                              |
|          | ; ----- <i>Revenire din apelul sistem de afișare TRAP 0x21</i> |                                                                                                                                                                                          |
| Return   | LD R1, SaveR1;                                                 | Restaurează conținutul regiștrilor R7 și R1 care au fost modificați pe parcursul rutinei de tratare                                                                                      |
|          | LD R7, SaveR7<br>RET                                           | ;Transferă controlul înapoi utilizatorului                                                                                                                                               |
| CRTSR    | .FILL xF3FC                                                    |                                                                                                                                                                                          |
| CRTDR    | .FILL xF3FF                                                    |                                                                                                                                                                                          |
| SaveR1   | .FILL 0                                                        |                                                                                                                                                                                          |
| SaveR7   | .FILL 0                                                        |                                                                                                                                                                                          |
|          | .END                                                           |                                                                                                                                                                                          |



**Figura 8.6.** Etapele parcuse în urma apariției unui apel sistem de citire caracter în programul utilizator

Secvența următoare de cod reprezintă conținutul rutinei de tratare aferentă apelului sistem de citire caracter cu ecou – **Character Input Service Routine (TRAP 0x23)**. Figura 8.6 ilustrează etapele majore parcuse din momentul apariției apelului și până la revenirea din rutina de tratare. Pe scurt, în rutina de tratare se desfășoară următoarele subetape: se afișează caracterul special *newline* (deci implicit sunt incluse instrucțiunile de afișare caracter), urmat de afișarea unui mesaj care solicită introducerea unui caracter de la tastatură (sunt incluse instrucțiunile de afișare sir de caractere). Urmează citirea propriu-zisă de la tastatură iar apoi afișarea ecoului și în final trecerea pe o nouă linie.

```

.ORIG x04A0
; ----- Salvează conținutul regiștrilor care vor fi alterați la nivelul subrutinei
START    ST     R7, SaveR7   ; Salvează adresa de revenire în
                           ; programul apelant (R7)
          ST     R1, SaveR1   ; Salvează valorile regiștrilor necesari
                           ; în rutina: R1, R2 și R3
          ST     R2, SaveR2
          ST     R3, SaveR3   ; trebuie restaurați înaintea execuției
                           ; instrucțiunii RET

```

; ----- *Scrie caracter special newline*

|    |                                                                                                                                                                                                                                              |
|----|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| L1 | LD R2, Newline ; Se încarcă în R2 codul ASCII al caracterului special <i>newline</i>                                                                                                                                                         |
|    | LDI R3, CRTSR ; Verifică starea perifericului – dacă permite scrierea în registrul de date al monitorului <i>CRTDR este disponibil?</i>                                                                                                      |
|    | BRzp L1 ; Registrul CRTDR este disponibil dacă bitul cel mai semnificativ al registrului de stare (cel de semn – CRTSR <sub>15</sub> ) este 1. Dacă nu este încă disponibil pentru afișare atunci se va continua cu citirea stării acestuia. |
|    | STI R2, CRTDR ; Este permisă afișarea caracterului <i>Newline</i> la consolă                                                                                                                                                                 |

; ----- *Afișează pe ecran mesajul de atenționare pentru citirea unui caracter de la tastatură*

|      |                                                                                                 |
|------|-------------------------------------------------------------------------------------------------|
| Loop | LEA R1, Prompt ; Prompt reprezintă adresa de start a mesajului de atenționare                   |
|      | LDR R0, R1, #0 ; Încarcă în R0 caracter după caracter din mesajul de afișat                     |
|      | BRz Input ; Dacă s-a ajuns la sfârșitul mesajului trece la citirea caracterului de la tastatură |
| L2   | LDI R3, CRTSR ; Verifică starea monitorului                                                     |
|      | BRzp L2 ; Periferic disponibil $\Rightarrow$ afișează caracterul curent al mesajului            |
|      | STI R0, CRTDR ; Trece la următorul caracter din mesaj                                           |
|      | ADD R1, R1, #1 ; Repetă afișarea până la sfârșitul sirului                                      |
|      | BRnzp Loop ; Repetă afișarea până la sfârșitul sirului                                          |

; ----- *Citire caracter de la tastatură*

|       |                                                                                                                                                                                     |
|-------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Input | LDI R3, KBSR ; Verifică starea tastaturii – <i>s-a apăsat vreo tastă?</i>                                                                                                           |
|       | BRzp Input ; Registrul KBDR este disponibil dacă bitul cel mai semnificativ al registrului de stare (cel de semn – KBSR <sub>15</sub> ) este 1. Dacă nu este încă disponibil pentru |

*Using just for studying and non-commercial purposes*

afișare atunci se va continua cu citirea stării acestuia.

LDI R0, KBDR ; Preia caracterul apăsat de la tastatură în registrul R0

; ----- Afisează pe ecran ecoul caracterului citit

L3 LDI R3, CRTSR  
BRzp L3  
STI R0, CRTDR ; Afisează caracterul citit de la tastatură pe monitor

; ----- Scrie caracter special **newline** – trece la o nouă linie

L4 LDI R3, CRTSR  
BRzp L4  
STI R2, CRTDR ; Mută cursorul pe ecran la o linie nouă

; ----- Reface conținutul regiștrilor care au fost alterați la nivelul subrutinei

LD R1, SaveR1 ; Preluarea lui R1, R2 și R3 de la adresele unde au fost salvați  
LD R2, SaveR2  
LD R3, SaveR3  
LD R7, SaveR7 ; Restaurarea lui R7 la valoarea avută la intrarea în rutina de serviciu  
RET ; Revenirea din rutina de serviciu pe prima instrucțiune în programul apelant ulterioră TRAP 0x23 (echivalentă cu: JMP R7)

; ----- Spațiul aferent datelor necesare rutinei de serviciu

|        |              |                                                           |
|--------|--------------|-----------------------------------------------------------|
| SaveR7 | .FILL 0x0000 |                                                           |
| SaveR1 | .FILL 0x0000 |                                                           |
| SaveR2 | .FILL 0x0000 |                                                           |
| SaveR3 | .FILL 0x0000 |                                                           |
| CRTSR  | .FILL 0xF3FC | ; adresa de memorie a registrului de stare al monitorului |
| CRTDR  | .FILL 0xF3FF | ; adresa de memorie a registrului de date al monitorului  |
| KBSR   | .FILL 0xF400 | ; adresa de memorie a registrului de stare al tastaturii  |
| KBDR   | .FILL 0xF401 | ; adresa de memorie a registrului de                      |

|         |                               |                                                         |
|---------|-------------------------------|---------------------------------------------------------|
|         |                               | date al tastaturii                                      |
| Newline | .FILL 0x000A                  | ; codul ASCII al caracterului special<br><i>newline</i> |
| Prompt  | .STRINGZ "Input a character>" | ; mesaj de atenționare                                  |
|         | .END                          | ; încheierea secvenței de cod                           |

Se reamintește că oprirea sistemului de calcul presupune oprirea unității de control, deci anularea semnalului de tact care reprezintă „pulsul” sistemului (vezi capitolul 5, figura 5.8). Arhitectura setului de instrucțiuni aferentă primelor sisteme de calcul conțineau o instrucțiune specială (HALT) pentru oprirea sistemului. Ulterior, proiectanții acestora au realizat cât de rar este folosită instrucțiunea HALT și totodată, faptul că se irosește un cod de operație pentru stocarea ei, care uneori poate fi necesar pentru definirea altor instrucțiuni (operații) cu caracter mult mai frecvent. La ora actuală, sistemele de calcul folosesc apele rutine (routine) sistem pentru anularea semnalului de tact și implicit oprirea unității de control. În cadrul LC-3 ISA, prin întreruperea TRAP 0x25 se urmărește practic oprirea ceasului sistemului, însă, aflându-ne într-un simulator (aplicație software) și nu pe un calculator gazdă, practic se oprește funcționarea simulatorului LC-3 (a aplicației care a rulat pe acesta) și se predă controlul sistemului de operare care rulează și gestionează procesele aferente calculatorului gazdă.

Secvența următoare de cod reprezintă conținutul rutinei de tratare aferentă apelului sistem de încheiere program și transfer control sistemului de operare – **Halt Service Routine** (TRAP 0x25). Pe scurt, în rutina de tratare se desfășoară următoarele subetape: se afișează caracterul special *newline* (folosindu-se apelul sistem TRAP 0x21), urmat de afișarea unui mesaj care atenționează asupra încheierii aplicației utilizator și cedarea controlului sistemului de operare (se folosește apelul sistem TRAP 0x22 pentru afișarea sirului de caractere). Urmează apoi resetarea bitului cel mai semnificativ al registrului de control al mașinii (MCR<sub>15</sub>) localizat în memoria LC-3 la adresa 0xFFFF.

|               |   |                                                                               |
|---------------|---|-------------------------------------------------------------------------------|
| .ORIG 0xFD70  | ; | Adresa de început a rutinei                                                   |
| ST R7, SaveR7 | ; | Salvează adresa de revenire în<br>programul apelant (R7)                      |
| ST R1, SaveR1 | ; | R1 este folosit să stocheze temporar<br>registrul de control al mașinii (MCR) |
| ST R0, SaveR0 | ; | R0 este folosit ca temporar în<br>operațiile din rutina de serviciu           |

; ----- Afisează pe ecran mesajul de atenționare pe linie nouă

```
LD    R0, ASCII.NewLine  
TRAP 0x21  
LEA   R0, Message  
TRAP 0x22  
LD    R0, ASCII.NewLine  
TRAP 0x21
```

; ----- Resetarea bitului cel mai semnificativ al registrului de control al mașinii ( $MCR_{15}$ ) pentru oprirea ceasului sistemului

```
LDI   R1, MCR      ; Încarcă conținutul registrului de control al mașinii în R1. Registrul – fiind reprezentat de o locație de memorie – este necesar accesul indirect.  
LD    R0, MASK     ; R0 = 0x7FFF, reprezintă masca pentru stergerea bitului 15 al MCR  
AND   R0, R1, R0    ; Ceilalți biți ai registrului MCR rămân nemodificați  
STI   R0, MCR      ; Scrie în memorie valoarea modificată a MCR
```

; ----- Revenirea din rutina sistem dedicată opririi ceasului sistemului

```
LD    R1, SaveR1    ; Restaurarea regiștrilor alterați în rutină. Preluarea lui R0 și R1 de la adresele unde au fost salvați  
LD    R0, SaveR0    ; Restaurarea lui R7 la valoarea avută la intrarea în rutina de serviciu  
LD    R7, SaveR7    ; Revenirea din rutina de serviciu în sistemul de operare (procesul părinte care a lansat în execuție simulatorul LC-3).  
RET
```

; ----- Spațiul aferent datelor necesare rutinei de serviciu

|               |                                 |
|---------------|---------------------------------|
| ASCII.NewLine | .FILL 0x000A                    |
| SaveR0        | .FILL 0x00000                   |
| SaveR1        | .FILL 0x00000                   |
| SaveR7        | .FILL 0x00000                   |
| Message       | .STRINGZ "Halting the machine." |

|      |              |                                              |
|------|--------------|----------------------------------------------|
| MCR  | .FILL 0xFFFF | ; Adresa de memorie a registrului MCR        |
| MASK | .FILL 0x7FFF | ; Masca necesară resetării bitului 15 al MCR |
|      | .END         | ; încheierea secvenței de cod                |

### **8.2.2. SALVAREA ȘI RESTAUREA REGIȘTRILOR ÎN CAZUL RUTINELOR DE SERVICIU**

Conținutul unui registru trebuie salvat dacă registrul va fi modificat de către rutina de serviciu iar valoarea acestuia va fi necesară și după încheierea rutinei. Se pune întrebarea cine salvează valoarea registrului:

- ☛ **Apelantul** rutinei de tratare (programul utilizator) care știe ce regiștri sunt necesari după încheierea rutinei, dar nu știe ce regiștri sunt modificați în rutină ? Salvările efectuate la nivelul apelantului poartă numele de „**caller-save**” și presupune stocarea temporară în memorie a conținutului regiștrilor care sunt distruși de către programul apelant sau în rutinele apelate (dacă este vizibil sau apriori cunoscut ceea ce se modifică în rutină) și valorile acestora sunt necesare ulterior. În cazul arhitecturii LC-3 ISA, strategia „**caller-save**” impune salvarea lui R7 înaintea oricărei instrucțiuni TRAP și de asemenea, salvarea lui R0 înaintea apelului TRAP 0x23 (deoarece rezultatul acestuia presupune stocarea codului ASCII al caracterului citit de la tastatură în R0). O altă posibilitate, realistă în cazul arhitecturilor cu număr ridicat de regiștri generali ai procesorului, presupune evitarea folosirii acestor regiștri cu funcții speciale (adresă de revenire, indicator de stivă, registrul care păstrează valoarea returnată din (sub)rutine) în operații uzuale (aritmetico-logice, etc).

sau

- ☛ **Rutina apelată** (în acest caz cea de tratare a întreruperii) ? Avantajul acestei variante este că, rutina cunoaște regiștrii pe care îi va modifica, dar nu cunoaște ce regiștrii vor fi necesari ulterior după execuția rutinei. În acest caz, strategia de salvare a regiștrilor se numește „**callee-save**”. Înainte de intrarea propriu-zisă în (sub)rutină sunt salvați toți regiștrii care vor fi alterați, exceptându-i pe cei care, chiar dacă sunt alterați, nu sunt necesari la nivelul programului apelant (totuși, acest lucru nu este întotdeauna vizibil de la nivelul (sub)rutinei apelate). Înainte de revenirea din (sub)rutină, regiștrii salvați inițial sunt restaurați la valorile anterioare apelului. Opțiunea „**callee-save**”

este utilizată în mod frecvent și în cazul apelurilor de subroutines (routine definite de programator / utilizator) nu doar în situația rutinelor de tratare a întreruperilor.

Salvarea și restaurarea regiștrilor stau la baza unui principiu fundamental al programării ce poartă numele de **reguli de scop** în cadrul limbajelor de nivel înalt. Regulile de scop informează despre faptul că o entitate de program (variabilă, parametru al funcției etc.) este „vizibil” sau accesibil într-un anumit loc. Astfel, locul în care o entitate este vizibilă este referit ca **scopul** entității.

În continuare se prezintă un exemplu care dovedește necesitatea salvării registrului R7 (adresa de revenire) de către programul apelant înaintea execuției unui apel sistem (*TRAP 0x23* în acest caz). Programul urmărește stocarea a 10 caractere (numerice) citite de la tastatură sub formă de cifre de la 0 la 9. Din păcate nu se întâmplă acest lucru, mai mult, programul intră în buclă infinită. Greșeala este provocată de faptul (ascuns la prima vedere) că apelul sistem *TRAP 0x23* modifică valoarea lui R7 cu adresa instrucțiunii *ADD R0, R0, R6 (0x3004)*. La revenirea din apel R7 va avea această valoare, pozitivă, se va executa saltul la *AGAIN* și se reexecută apelul sistem, șamdată, intrându-se astfel în buclă infinită.

Salvarea adresei de revenire în programul apelant trebuie făcută în cazul oricărui apel imbricat de rutină (incluzându-l și pe cel recursiv), altfel se pierde legătura spre programul apelant și revenirea se face la infinit pe aceeași instrucțiune într-o singură rutină apelată.

|       |                                                                          |                                                                                                                                                                              |
|-------|--------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|       | .ORIG x3000                                                              |                                                                                                                                                                              |
|       | LEA R3, Binary;                                                          | În R3 se încarcă adresa de început a tabloului de numere                                                                                                                     |
|       | LD R6, ASCII;                                                            | R6 conține valoarea <b>-48</b> care trebuie scăzută din fiecare caracter (cifră) citit de la tastatură pentru determinarea valorii numerice a cifrei                         |
| AGAIN | LD R7, COUNT;<br>TRAP x23;                                               | Inițializarea lui R7 cu 10<br>Citește un caracter de la tastatură (în R0 se află codul său ASCII)                                                                            |
|       | ADD R0, R0, R6;<br>STR R0, R3, #0;<br>ADD R3, R3, #1;<br>ADD R7, R7, -1; | Transformă caracterul în număr<br>Stochează numărul în tablou<br>Incrementează poziția în tablou<br>Decrementează contorul de elemente ce mai trebuie citite de la tastatură |
|       | BRp AGAIN;                                                               | Mai sunt elemente de citit ?                                                                                                                                                 |

|                                                                                                               |                                                                                               |
|---------------------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------|
| ASCII      BRnzp NEXT;<br>COUNT     .FILL xFFD0;<br>Binary    .FILL #10<br>NEXT     .BLKW #10<br>HALT<br>.END | S-au citit cele 10 elemente, salt la<br>încheierea programului<br><b>Valoarea ASCII = -48</b> |
|---------------------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------|

*Ce modificări trebuie aduse acestei secvențe pentru ca la locația Binary să fie stocate numerele (și nu codurile lor ASCII) citite de la tastatură ?*

### 8.3. SUBRUTINE

Subrutinele sunt secțiuni de cod (fragmente de program) definite de programator / utilizator și care:

- Sunt stocate în spațiul de memorie utilizator
- Realizează o sarcină bine precizată (execuță operații bine definite de către programator)
- Este invocată (apelată) de către un alt program utilizator (sau subrutină) – program apelant
- La încheierea ultimei instrucțiuni din subrutină se predă controlul programului apelant pe instrucțiunea succesoare apelului.

Subrutinele diferă de rutinele de tratare a întreruperilor prin faptul că nu sunt parte componentă a sistemului de operare, nu necesită privilegii speciale și nu fac uz de resurse hardware protejate.

Există câteva motive în favoarea utilizării subrutinelor:

- Reutilizarea, eficientă din punct de vedere al timpului de execuție, a codului, fără a fi necesară rescrierea lui. O consecință a acestui fapt îl reprezintă reducerea numărului de erori care pot apărea la scrierea unui program.
- Elaborarea algoritmilor prin descompunerea unei probleme în *subprobleme* mai simple și distribuirea sarcinilor între mai mulți programatori – fiecare realizează un anumit task, independent de ceilalți. În acest fel crește lizibilitatea codului, el putând fi mai ușor de urmărit, depanat și corectat.

- Cele mai frecvent folosite funcții (subroutines) matematice, grafice, sau cu diferite caracteristici, sunt implementate și furnizate de producătorii de sisteme software, sub forma funcțiilor de bibliotecă. Se impune însă respectarea câtorva cerințe:
- Transmiterea parametrilor subroutinei apelate și returnarea rezultatului de către aceasta subroutinei apelante (eventual programului principal) se face prin regiștri sau memorie. De exemplu, în cazul procesorului MIPS, în regiștri \$a0, \$a1, \$a2, \$a3 sunt transmiși parametrii subroutinei apelate, iar în caz că sunt mai mulți de 4 aceștia se depun pe stivă. Rezultatul returnat de subroutine este transmis prin intermediul regiștrilor \$v0 și \$v1 dacă este necesar.
- Subroutinele trebuie să poată fi apelate din orice punct al programului (sau subroutine componente), revenirea făcându-se pe instrucțiunea imediat următoare apelului.

### 8.3.1. MECANISMUL DE APEL SUBRUTINE ȘI REVENIRE

Figura 8.7. ilustrează execuția unui program sursă conținând mai multe secțiuni de cod independente – secvențele contigue din punct de vedere al execuției X, A, Y, Z și W. Trebuie menționat că secvența de cod A se repetă de câteva ori astfel încât ar fi recomandabilă stocarea codului într-o subroutine, scrisă o singură dată și apelată repetat.



**Figura 8.7.** Execuția unui program sursă: (a) fără subroutine prin macroexpandarea<sup>13</sup> codului, (b) folosind subroutine și apelul repetat al acestora

<sup>13</sup> Repetarea (scrierea conținutului rutinei sau funcției în locul apelului său).

Scopul principal al instrucțiunilor **JSR/JMP** este de a efectua un salt necondiționat la o adresă. Deosebirea dintre ele constă în faptul că, instrucțiunea JSR reprezintă mai mult decât un salt necondiționat, este chiar un apel de subrutină, întrucât presupune suplimentar și salvarea în R7 a adresei de revenire (PC-ul următoarei instrucțiuni) în programul apelant – operație numită **linking** (*păstrarea legăturii cu programul apelant*) cu implicații importante și asupra stivei de date aferentă funcțiilor (vezi capitolul 10). Diferențierea efectivă între cele două instrucțiuni se face prin bitul *L* (IR[11]) din formatul instrucțiunii (vezi figura 8.8). Astfel dacă *L*=0 instrucțiunea este simplu salt necondiționat (se rămâne în programul apelant).

| JSR / JMP | 15 | 14 | 13 | 12 | 11    | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0         |
|-----------|----|----|----|----|-------|----|---|---|---|---|---|---|---|---|---|-----------|
|           | 0  | 1  | 0  | 0  | L   0 | 0  |   |   |   |   |   |   |   |   |   | pgoffset9 |

Figura 8.8. Formatul instrucțiunilor JSR/JMP

În figura 8.8 este prezentat formatul instrucțiunii JSR / JMP iar figura 8.9 ilustrează modul de lucru al acesteia. Primii 4 biți ai instrucțiunii sunt 0100 urmați de un bit *L* (*L*=1 specifică automatului cu stări finite din unitatea de control aferentă arhitecturii LC3 că instrucțiunea este un apel de subrutină și nu un salt necondiționat) și 2 biți de 0. Ultimii 9 biți reprezintă deplasamentul (adresa relativă pozitivă sau negativă) la care se află subrutina față de adresa următoarei instrucțiuni. În registrul R7 se încarcă valoarea PC-ului (care în momentul execuției instrucțiunii JSR pointează deja la instrucțiunea următoare din programul apelant, PC-ul fiind incrementat în timpul fazei FETCH) – vezi operația 1 din figura 8.9. În PC se încarcă adresa primei instrucțiuni din subrutina apelată, predându-se controlul acesteia – vezi operația 2 din figura 8.9. Adresa primei instrucțiuni din subrutina apelată se obține prin adăugarea la valoarea PC-ului curent a extensiei de semn a câmpului offset din formatul instrucțiunii de apel (PC  $\leftarrow$  (PC) + Sext(IR[8:0])).



**Figura 8.9.** Modul de lucru al instrucțiunii JSR

În figura 8.10 este prezentat formatul instrucțiunilor JSRR / JMPR iar figura 8.11 ilustrează modul de lucru al acesteia. Semantica instrucțiunilor JSRR / JMPR este similară cu cea a instrucțiunilor JSR / JMP, singura deosebire constând în faptul că adresa de apel / salt se obține în cazul primelor prin mod de adresare indexat, iar în cazul celor din urmă prin mod de adresare direct. Această caracteristică importantă permite ca apelul subrutinelor respectiv saltul necondiționat implicat de instrucțiunile JSRR / JMPR să nu se realizeze neapărat într-o vecinătate a instrucțiunii curente (cazul JSR / JMP – echivalent apelurilor / salturilor de tip NEAR la procesorul INTEL) ci și în alte zone din spațiul de memorie utilizator (apeluri / salturi de tip FAR).



**Figura 8.10.** Formatul instructiunilor JSRR/JMPR

Primii 4 biți din formatul instrucțiunii JSRR / JMPR sunt 1100, urmati de bitul IR[11]=L cu același rol de selecție între apel (L=1) și salt necondiționat (L=0). Următorii doi biți 0 iar biții IR[8:6] codifică registrul de bază folosit în adresare. Deplasamentul este obținut din câmpul *index6* IR[5:0] extins cu 0 până la 16 biți. Adresa de apel / salt se obține prin însumarea conținutului registrului de bază cu deplasamentul (lucru ilustrat de etapa 2 din figura 8.11). În registrul R7 se încarcă valoarea PC-ului (care

În momentul execuției instrucțiunii JSRR indică spre instrucțiunea următoare din programul apelant, PC-ul fiind incrementat în timpul fazei FETCH) – vezi operația 1 din figura 8.11. În PC se încarcă adresa primei instrucțiuni din subrutina apelată, predându-se controlul acesteia – vezi operația 3 din figura 8.11. Revenirea din subrutină în cazul instrucțiunilor JSR / JSRR se realizează cu ajutorul instrucțiunii RET, care restaurează în PC valoarea aflată în R7 (adresa primei instrucțiuni din subrutina apelantă, succesoare apelului), mecanism similar cu cel întâlnit în cazul instrucțiunilor TRAP. Întrucât în cazul instrucțiunilor JMP / JMPR nu se face apel ci doar salt necondiționat rezultă că nu se va face uz de instrucțiunea RET, în caz contrar s-ar modifica în mod eronat semantica programului (*pasul 1 din figura 8.11 nu apare în cazul instrucțiunii JMPR*).

Instrucțiunile JSRR / JMPR poartă numele de instrucțiuni de apel / salt cu mod de adresare indirect prin registru. Ele, ca de altfel toate instrucțiunile de salt condiționat / necondiționat, apel direct / indirect cauzează hazarduri de ramificație în procesarea pipeline a instrucțiunilor. Metodele de soluționare implementate în procesoarele actuale sunt fie *software* bazate pe reorganizarea codului sursă, dar mai ales *hardware* bazate pe predicția dinamică a adreselor destinație aferente instrucțiunilor de salt. După cum se știe, predicția adreselor destinație ale salturilor / apelurilor indirecte este o problemă extrem de *dificilă* (întrucât adresele săntă se modifică în mod dinamic) și *actuală* iar soluțiile propuse nu sunt încă mulțumitoare. În cadrul unei lucrări anterioare, autorul acestei cărți a sesizat faptul că, înainte de a aborda efectiv problema predicției ar trebui să înțeleagă în profunzime modurile în care aceste apeluri indirecte sunt generate prin compilare. Pentru aceasta, el dezvoltă programe de test proprii, atât procedurale cât și obiectuale, care conțin corpuri “suspectate” de a genera apeluri și salturi indirecte în urma compilării. Pe baza acestei cercetări se extrag concluzii valoroase și deosebit de utile cu privire la construcțiile din programele (limbajele) de nivel înalt (*High Level Languages*) generatoare ale unor astfel de salturi (apeluri indirecte de funcții prin pointeri, construcții *switch/case*, prezența funcțiilor de bibliotecă, inclusiv biblioteci dinamice de tip DLL, legarea dinamică realizată prin polimorfism etc.). Toate aceste informații de nivel semantic superior pot fi utilizate cu succes în predicția adreselor salturilor / apelurilor indirecte care, actualmente, utilizează în majoritatea lor informații de nivel semantic mai scăzut, precum codul obiect, adrese binare etc. Practic, pierderea semantică codului de nivel înalt după compilare, devine inaceptabilă pentru noua generație de microprocesoare.



Figura 8.11. Modul de lucru al instrucțiunii JSRR

În continuare se prezintă un exemplu de folosire a unei subrutine definite de utilizator. Subrutina de la adresa **2sComp** determină *complementul față de 2* al unui număr transmis ca parametru prin registrul R0, iar rezultatul este returnat tot prin intermediul registrului R0. Programul principal urmărește calcularea diferenței dintre regiștrii R1 și R3. Întrucât scăderea unui operand reprezintă de fapt o adunare cu negativul acestuia (operandul transformat în complement față de 2), în cazul de față, registrul R3 având rolul de scăzător, nu va fi scăzut ci va fi transmis ca argument (parametru efectiv) subrutinei 2sComp. La revenirea din subrutină la descăzut (R1) se adaugă rezultatul returnat de subrutina 2sComp (valoarea – R3). Evident că, pentru o funcționare corectă a programului, dacă valoarea registrului R0 va fi necesară în continuare, atunci programul apelant trebuie să salveze conținutul lui R0 înaintea apelului subrutinei 2sComp.

; Calculul complementului față de 2 a valorii stocate în registrul R0

|               |                |                                                                                                                            |
|---------------|----------------|----------------------------------------------------------------------------------------------------------------------------|
| <b>2sComp</b> | NOT R0, R0     | ; inversează fiecare bit al registrului<br>(se determină <i>complementul față de 1</i><br>a valorii stocate inițial în R0) |
|               | ADD R0, R0, #1 | ; se adună 1 pentru a determina<br><i>complementul față de 2</i>                                                           |
|               | RET            | ; revenirea din subrutină                                                                                                  |

- ; Apelul subroutinei din programul principal trebuie făcut din aceeași pagină cu subroutine (mod de adresare direct)  
; Se dorește calcularea valorii  $R4 = R1 - R3$

```

ADD R0, R3, #0      ; valoarea lui R3 este transmisă ca argument subroutinei 2sComp; se copiază R3 în R0
JSR 2sComp          ; apelul subroutinei pentru negarea valorii din R0
ADD R4, R1, R0      ; scăderea se realizează prin adunarea negatului scăzătorului la descăzut

```

### **8.3.2. TRANSFERUL PARAMETRILOR CĂTRE ȘI DE LA SUBRUTINE**

Transferul de informație de la programul (subroutine) apelant(ă) la subroutine apelată și invers se realizează prin intermediul **argumentelor** și respectiv al **valorii returnate**.

Argumentele reprezintă una sau mai multe valori, transmise subroutinei apelate prin intermediul reștricțiilor, necesare acesteia pentru a-și îndeplini task-ul. Exemple de argumente la LC-3 ISA:

- În subroutine 2sComp, R0 reprezintă numărul ce trebuie negat (valoarea care trebuie transformată în complement față de 2).
- În rutina de serviciu aferentă apelului sistem OUT, R0 reprezintă codul ASCII al caracterului ce va fi afișat.
- În rutina de serviciu aferentă apelului sistem PUTS, R0 reprezintă adresa sirului de caractere ce va fi afișat.

Valoarea returnată constituie rezultatul calculat de subroutine (un număr sau o adresă a unui tablou de numere sau de caractere). Exemple:

- În subroutine 2sComp, valoarea negată (complementul față de 2 a valorii primite ca parametru) este transmisă prin registrul R0.
- În rutina de serviciu GETC, codul ASCII al caracterului citit de la tastatură este returnat prin R0.

Pentru a putea folosi o subroutine, programatorul trebuie să cunoască:

- Adresa acesteia (valoare numerică sau simbolică – etichetă, care identifică prima instrucțiune din subroutine).
- Ce realizează subroutine (scopul, funcția, rezultatul acesteia).

Așa cum s-a amintit anterior referitor la avantajul utilizării subroutinelor și distribuirea sarcinilor între programatori, un programator nu

trebuie să cunoască neapărat cum funcționează subrutina (în interiorul său), ci doar ce modificări sunt vizibile la nivelul stării arhitecturale a mașinii (procesorului), după execuția subrutinei. De asemenea, trebuie să știi argumentele și respectiv, dacă există, valoarea returnată.

### 8.3.3. SALVAREA ȘI RESTAUREA REGIȘTRILOR ÎN CAZUL SUBRUTINELOR. RUTINE (FUNCȚII) DE BIBLIOTECĂ

La fel ca și în cazul utilizării rutinelor de serviciu aferente întreruperilor software, regiștrii trebuie salvați și restaurați la valorile anterioare apelului. *În aproape toate cazurile de utilizare a subrutinelor este folosită strategia „callee-save”, excepție făcând salvarea regiștrilor care reprezintă valoarea returnată.* Sunt salvați toți regiștrii care vor fi alterați pe parcursul execuției subrutinei, acest lucru nefiind vizibil la nivelul apelantului. Restaurarea argumentelor de intrare în subrutină la valoarea anterioară apelului este o practică uzuală. Dacă argumentele sunt transmise însă subrutinei prin referință (adresă) atunci valorile acestora pot fi modificate în interiorul acesteia și să rămână așa la revenirea din subrutină (pentru mai multe detalii vezi capitolul 12). **Atenție** însă, înaintea apelului oricărei subruteine folosind instrucțiunile JSR sau JSRR, sau înaintea oricărui apel sistem (instrucțiune TRAP) valoarea registrului R7 trebuie salvată, în caz contrar revenirea nu se va mai face la nivelul apelantului.

Pe lângă subrutinele definite de utilizator în programele de calcul se întâlnesc **biblioteci de rutine cu funcții specifice**: formule matematice, dedicate aplicațiilor grafice, aferente dispozitivelor periferice, anumitor componente ale sistemului de calcul sau sistemului de operare. Rutinele de bibliotecă sunt definite în afara programului utilizator (independent de acesta) și sunt apelate în programele utilizator. Pentru aceasta, în LC-3 ISA, declararea în programul utilizator a adresei de start (de regulă simbolice) a unei rutine de bibliotecă se face folosind directiva *.EXTERNAL*. Fiecare rutină de bibliotecă este caracterizată de propria tabelă de simboluri. Link-editorul este utilitarul (aplicația) responsabil(ă) cu rezolvarea (identificarea corectă) a fiecărei adrese declarată *.EXTERNAL* înaintea creării imaginii executabile a aplicației. Comerțanții de aplicații software (sisteme de operare, compilatoare, aplicații dedicate, drivere pentru diferite componente ale sistemului de calcul, etc.) pun la dispoziția utilizatorilor fișiere obiect (precompilate) conținând diverse rutine de bibliotecă. Din motive de proprietate intelectuală nu se asigură codul sursă al acestora. De asemenea, trebuie ca în programul apelant să se realizeze apelul (cel mai probabil) prin

instrucțiuni JSRR, iar asamblorul și link-editorul să suporte declarații de etichete .EXTERNAL.

În continuare este prezentat un exemplu care utilizează rutina de bibliotecă matematică de extragere a radicalului.

|        |                |                                                                                                                                                                                   |
|--------|----------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| ...    | .EXTERNAL SQRT | ; rutina matematică de extragere a radicalului este definită în alt modul, probabil la un deplasament mai mare de 256 adrese (crescător sau descrescător relativ la PC-ul curent) |
| ...    | LD R2, SQAddr  | ; încarcă adresa de început a subrutinei <i>SQRT</i>                                                                                                                              |
| SQAddr | JSRR R2, #0    | ; realizează apelul indirect                                                                                                                                                      |
| ...    | .FILL SQRT     |                                                                                                                                                                                   |

#### 8.4. EXERCIȚII ȘI PROBLEME

- Se consideră următorul program scris în limbaj de asamblare LC-3:

```

.ORIG x3000
L1  LEA   R1, L1
     AND  R2, R2, x0
     ADD  R2, R2, x2
     LD   R3, P1

     JSR  L2
     BRnzp NEXT
L2  LDR  R0, R1, x16
     ST   R7, SAVER7
     OUT
     LD   R7, SAVER7
     ADD  R3,R3,-1

```

```
BRz GLUE
ADD R1, R1, R2
BRnzp L2
GLUE RET
NEXT LEA R1, L1
ADD R1, R1, #1
LD R3, P1
ADD R3, R3, #-7
JSR L2
HALT
P1 .FILL x12
.STRINGZ "SLaArMbUaLtToIrAiNFle!rriCcaizt!ea!"
SAVER7 .BLKW 1
.END
```

- a) Generați tabela de simboluri aferentă acestui program.
  - b) Scrieți codificarea binară a instrucțiunilor aflate la următoarele adrese: x3000, x3004, x3008, x300B, x300E, x3012.
  - c) Ce afișează programul ? De ce sunt necesare cele două instrucțiuni care îl salvează și restaurează temporar pe R7 ?
2. Răspundeți la întrebările:
- a) Câte rutine de serviciu pot fi implementate prin intermediul instrucțiunilor de apel sistem TRAP în cadrul arhitecturii LC-3 ? De ce ?
  - b) De ce este necesară utilizarea unei instrucțiuni RET pentru revenirea dintr-o rutină TRAP (de tratare a unei întreruperi) ? De ce nu poate fi folosită în schimb o instrucțiune de salt necondiționat BRnzp ?
  - c) Câte accese la memorie se fac în timpul procesării unei instrucțiuni TRAP, presupunând că ea a fost adusă deja în registrul IR (s-a efectuat faza FETCH) ?
  - d) Poate o rutină de tratare (nu doar cele implementate la LC-3 ISA ci în cazul general) să apeleze o altă rutină de tratare ? În caz afirmativ, există vreo acțiune specială care trebuie realizată la nivelul rutinelor apelante ? Justificați.
  - e) Există vreun apel sistem care să repornească ceasul sistemului ?
3. Se consideră următorul program scris în limbaj de asamblare LC-3:

```

.ORIG x3000
LEA R0, DATA
AND R1, R1, #0
ADD R1, R1, #9
LOOP1
    ADD R2, R0, #0
    ADD R3, R1, #0
LOOP2
    JSR SUB
    ADD R2, R2, #1
    ADD R3, R3, #-1
    BRP LOOP2
    ADD R1, R1, #-1
    BRP LOOP1
    HALT
DATA .BLKW #10
SUB LDR R5, R2, #0
NOT R4, R5
ADD R4, R4, #1
LDR R6, R2, #1
ADD R4, R4, R6
BRZP CONT
STR R5, R2, #1
STR R6, R2, #0
CONT RET
.END

```

Presupunem că locațiile de memorie începând cu adresa de la eticheta DATA conțin 10 numere întregi în complement față de 2. Aceste numere trebuie setate de utilizatorul programului înainte de execuție. Ce realizează programul ? Care este relația dintre valorile inițiale și cele finale de la adresele respective ?

4. Intenția următorului program este de a afișa valoarea 5 pe consolă (ecran). Din nefericire nu se întâmplă acest lucru. De ce ? Răspundeți în cel mult 10 cuvinte.

```

.ORIG x3000
JSR A
OUT
BRnzp DONE

```

```

A      AND R0, R0, #0
      ADD R0, R0, #5
      JSR    B
      RET
DONE   HALT
ASCII  .FILL 0x0030
B      LD R1, ASCII
      ADD R0, R0, R1
      RET
      .END

```

5. Răspundeți la întrebările:
- Care sunt diferențele dintre instrucțiunile TRAP și JSRR ? Dar dintre JSR și JSRR ?
  - Există vreo instrucțiune care face același lucru ca și instrucțiunea JMP ?
  - Care este scopul apelurilor sistem ?
  - Care este diferența dintre strategiile “*caller-save*” și “*callee-save*” în salvarea și restaurarea regiștrilor la apelul și revenirea din subrutine.
  - Ce anume (dacă există ceva) este greșit în următoarea subrutină ?

```

DO      JSR  DOTHIS
        JSR  DOTTHAT
        RET

```

6. În tabelul de mai jos sunt ilustrate conținuturile regiștrilor arhitecturii LC-3 înainte și după execuția instrucțiunii de la adresa 0x3010. Identificați instrucțiunea memorată la adresa 0x3010. De notat că, există suficientă informație în tabelul specificat care să personalizeze instrucțiunea.

|    | <b>Înainte</b> | <b>După</b> |
|----|----------------|-------------|
| R0 | xFF1D          | xFF1D       |
| R1 | x321C          | x321C       |
| R2 | x2F11          | x2F11       |
| R3 | x5321          | x5321       |
| R4 | x331F          | x331F       |
| R5 | x1F22          | x1F22       |
| R6 | x01FF          | x01FF       |
| R7 | x341F          | x3011       |
| PC | x3010          | x3220       |

|   |   |   |
|---|---|---|
| N | 0 | 0 |
| Z | 1 | 1 |
| P | 0 | 0 |

Completați instrucțiunea lipsă în căsuțele libere:

7. Cele două secvențe de mai jos sunt asamblate separat. În urma acestui proces sunt detectate două erori: una în fază de asamblare și una în fază de link-editare. Încercuiți fiecare greșeală și stabiliți în ce fază a fost detectată.

```

    .EXTERNAL
SQRT      .ORIG 0x3000      SQRT      .ORIG 0x3200
          LD R0, VALUE        ;codul necesar
          JSR     SQRT        implementării funcției de
          ST R0, DEST         extragere a rădăcinii
          HALT                pătrate
VALUE     .FILL 0x30000     ;returnează rezultatul în R0
DEST      .FILL 0x0025      RET
          .END

```

8.

a) Completați tabela de simboluri pentru următorul program.

```

.ORIG x3000
LEA    R6, STACKBASE
ADD   R6, R6, #-1
LEA    R0, PROMPT
TRAP  x22          ; PUTS
AND   R1, R1, #0
LOOP
      TRAP  x20          ; IN
      TRAP  x21

```

|           |                                      |                                                                                                  |
|-----------|--------------------------------------|--------------------------------------------------------------------------------------------------|
| ADD       | R3, R0, x-A                          | ; negația (valoarea<br>în complement<br>față de 2) a<br>codului ASCII<br>pentru tastă<br>"Enter" |
| BRz       | INPUTDONE                            |                                                                                                  |
| JSR       | PUSH                                 |                                                                                                  |
| ADD       | R1, R1, #1                           |                                                                                                  |
| BRnzp     | LOOP                                 |                                                                                                  |
| INPUTDONE | ADD                                  | R1, R1, #0                                                                                       |
| LOOP2     | BRz                                  | DONE                                                                                             |
|           | JSR                                  | POP                                                                                              |
|           | TRAP                                 | x21                                                                                              |
|           | ADD                                  | R1, R1, #-1                                                                                      |
|           | BRp                                  | LOOP2                                                                                            |
| DONE      | TRAP                                 | x25 ; HALT                                                                                       |
| PUSH      | ADD                                  | R6, R6, #1                                                                                       |
|           | STR                                  | R0, R6, #0                                                                                       |
|           | RET                                  |                                                                                                  |
| POP       | LDR                                  | R0, R6, #0                                                                                       |
|           | ADD                                  | R6, R6, #1                                                                                       |
|           | RET                                  |                                                                                                  |
| PROMPT    | .STRINGZ "Please enter a sentence: " |                                                                                                  |
| STACKBASE | .BLKW #50                            |                                                                                                  |
|           | .END                                 |                                                                                                  |

## Tabela de Simboluri

| Etiqueta ( <i>label</i> ) | Adresa |
|---------------------------|--------|
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |
|                           |        |

**b)** Ce realizează programul anterior ? Explicați rolul fiecărui registru folosit: R0, R1, R3 și R6. Mai există și alți regiștri care își modifică valoarea pe parcursul execuției programului ?

**9.** În secvența de program de mai jos lipsesc câteva instrucțiuni. Semantica programului este următoarea: utilizatorului îi este cerut să își introducă numele. Programul memorează mesajul „Hello, ” urmat de numele introdus, ca un sir de caractere începând de la adresa indicată de simbolul HELLO și-l afișează pe consolă. Se presupune că utilizatorul a încheiat introducerea numelui său de la tastatură prin Enter, al cărui cod ASCII este 0xA. Numele este restricționat la maximum 25 de caractere. De exemplu, presupunând că utilizatorul a introdus de la tastatură numele John, atunci pe consolă va apărea mesajul:

*Please enter your name: John  
Hello, John*

Se cere să se introducă în secvență instrucțiunile lipsă.

|        |       |            |        |
|--------|-------|------------|--------|
|        | .ORIG | x3000      |        |
| AGAIN  | LEA   | R1, HELLO  |        |
|        | LDR   | R2, R1, #0 |        |
|        | BRz   | NEXT       |        |
|        | ADD   | R1, R1, #1 |        |
|        | BRnzp | AGAIN      |        |
| NEXT   | LEA   | R0, PROMPT |        |
|        | TRAP  | 0x22       | , PUTS |
| <hr/>  |       |            |        |
| AGAIN2 | TRAP  | 0x20       | ; GETC |
|        | TRAP  | 0x21       | ; OUT  |
|        | ADD   | R2, R0, R3 |        |
|        | BRz   | CONT       |        |
| <hr/>  |       |            |        |
| <hr/>  |       |            |        |
| CONT   | BRnzp | AGAIN2     |        |
|        | AND   | R2, R2, #0 |        |
| <hr/>  |       |            |        |
|        | LEA   | R0, HELLO  |        |
|        | TRAP  | 0x22       | ; PUTS |

```

        TRAP      0x25          ; HALT
NEGENERTER .FILL    0xFFFF6      ; -0x0A
PROMPT     .STRINGZ „Please enter your name: ”
HELLO      .STRINGZ „Hello, ”
        .BLKW    #25
        .END

```

- 10.** Programului de mai jos îl lipsesc câteva instrucțiuni importante! Dacă sunt completate corect atunci programul va afișa pe ecran mesajul: ABCFGH. Completați instrucțiunile lipsă astfel încât programul original să realizeze ceea ce și-a propus. În fiecare spațiu lipsește exact o instrucțiune iar toate celelalte instrucțiuni sunt corecte.

```

        .ORIG x3000
        LEA R1, TESTOUT
BACK_1    LDR R0, R1, #0
        BRz NEXT_
        TRAP x21

; BRnzp BACK_1

NEXT_1    LEA R1, TESTOUT
BACK_2    LDR R0, R1, #0
        BRz NEXT_2
        JSR SUB_1
        ADD R1, R1, #1
        BRnzp BACK_2

; NEXT_2

; SUB_1

K         LDI R2, CRTSR

STI R0, CRTDR
RET
CRTSR    .FILL xF3FC
CRTDR    .FILL xF3FF
TESTOUT   .STRINGZ "ABC"
        .END

```

## **9. STIVA – STRUCTURĂ. PRINCIPIU DE FUNCȚIONARE. OPERAȚII AFERENTE (*PUSH & POP*)**

### **9.1. STRUCTURA DE DATE DE TIP STIVĂ**

#### **9.1.1. PRINCIPIU DE FUNCȚIONARE**

Conceptul de **stivă** vine să încheie partea de introducere în știința și ingineria calculatoarelor strict legată de hardware (de ISA aferentă unui procesor). Din punct de vedere fizic, stiva reprezintă o importantă structură de memorare folosită pentru implementarea la nivel hardware a concepte software (mecanisme) fundamentale: *apelul funcțiilor*, *recursivitate*. Definițoriu pentru stivă reprezintă modul de acces la elementele sale și nu modul specific de implementare. Din punct de vedere software stiva este o structură de date abstractă definită prin regulile de inserare și extragere a datelor în / din ea, ambele operații fiind efectuate la același capăt. Prințipiu de memorare este de tip **LIFO (last-in first-out)**, adică ultimul inserat va fi primul extras din stivă, elementele extrase apărând practic în ordine inversă față de cum au fost introduse.. Analizând stiva pe o perioadă îndelungată se poate spune, chiar dacă nu este tot timpul adevărat, și că primul introdus în stivă este ultimul care va fi scos.

#### **9.1.2. IMPLEMENTARE HARDWARE ȘI SOFTWARE.**

Din punct de vedere fizic, cel mai intuitiv mod de a înțelege stiva îl reprezintă o stivă de farfurii sau mai bine, un resort care reține monede una peste cealaltă. Si într-un caz și în celălalt **accesul se face doar la elementul** (farfurie / moneda) **din vârf**. Dacă se dorește accesul la oricare alt element trebuie extrase din stivă elementele din vârf până la cel solicitat.



Figura 9.1. Exemplu de stivă. Model fizic

În figura 9.1 sunt prezentate operațiile cu stiva din perspectiva unui model fizic (un resort cu monede). Ordinea operațiilor este de la stânga la dreapta. În fază inițială stiva fiind vidă resortul este relaxat (necomprimat). Prima depunere în stivă este cea a monedei de etichetă 1995. Urmează alte trei depunerri: întâi moneda etichetată 1982, apoi cea 1998 și ultima 1996. Imaginea cea mai din dreapta reprezintă configurația stivei după extragerea monedei din vârful stivei (a monedei etichetate 1996). Noul vârf al stivei are eticheta 1998.

În continuare (vezi figura 9.2) este descrisă implementarea în hardware a stivei de monede, folosind regiștri. În acest caz, stiva este alcătuită dintr-un număr de regiștri hardware aflați în poziții bine determinate (fixe). La depunerea a căte unui element în stivă dacă stiva nu este goală atunci informația este translatată (în jos) spre baza stivei (copiată dintr-un registru în altul), iar în vârful stivei se copiază noua valoare inserată. Se observă că **implementarea stivei de monede în hardware folosind regiștri implică deplasarea informației între regiștri inacceptabil din punct de vedere al memoriei implementată fizic** (este inefficient din punct de vedere al procesării informației ca fiecare scriere în memorie – depunere în stivă – să implice transferul tuturor informațiilor existente la acel moment între locații succesive de memorie).

În figura 9.2 sunt prezentate operațiile cu stiva din perspectiva unui model hardware (stiva compusă din regiștri). Ordinea operațiilor este de la stânga la dreapta. Inițial stiva este vidă (Funcția Empty ilustrează dacă există elemente în stivă. În acest caz ea va returna Da). Prima operație o reprezintă inserarea în stivă a valorii 18 (Funcția Empty va genera Nu). Urmează trei depunerri succesive în stivă (făcând referire la figura 9.1 se poate spune că resortul se comprimă). Se depun în stivă pe rând valorile: 31, 5 și apoi 12 (evident că funcția Empty returnează Nu). Colțul din dreapta al figurii ilustrează conținutul stivei după două operații succesive de extragere

din stivă (a elementelor din vârful stivei – întâi 12 și apoi 5). Trebuie observat că vârful stivei (TOP – *top of the stack*) – indicator la ultima locație ocupată din stivă, rămâne tot timpul în același loc. Întrucât în stivă mai rămân valorile 31 și 5 funcția Empty va genera Nu.



**Figura 9.2.** Implementarea stivei de monede în hardware folosind regiștri

Implementarea software a stivei are la bază ideea de a nu permite deplasarea informației în memorie la fiecare acces la stivă. Doar vârful stivei poate să-și modifice poziția, el fiind reținut într-un singur registru.



**Figura 9.3.** Implementarea software a stivei

Prin convenție la LC-3 ISA [Patt03] registrul R6 reține adresa vârfului stivei (reprezintă un indicator spre ultima locație ocupată din stivă). La alte arhitecturi (Intel, MIPS) acest regisztr se numește SP (*stack pointer* – vezi capitolul 12 pentru clarificarea noțiunii de pointer).

### 9.1.3. OPERAȚII AFERENTE (PUSH & POP)

Asupra unei stive se definesc câteva operații, dintre care cele mai importante sunt:

1. Depune un element pe stivă (PUSH);
2. Extrage un element din stivă (POP);

Cele două operații se realizează în vârful stivei. Astfel, dacă se scoate un element din stivă, atunci acesta este cel din vârful stivei și în continuare, cel pus anterior lui pe stiva ajunge în vârful stivei. Dacă un element se pune pe stivă, atunci acesta se pune în vârful stivei și în continuare el ajunge în vârful stivei. La eliminarea tuturor elementelor din stivă aceasta devine *vidă*.

Din punct de vedere software implementarea unei stive poate fi făcută printr-o listă simplu înlățuită. Trebuie însă identificate baza și vârful stivei cu ajutorul capetele listei simplu înlățuite. Există două posibilități:

- a. Nodul spre care indică (pointează) variabila *prim* este baza stivei, iar nodul spre care indică variabila *ultim* este vârful stivei;
- b. Nodul spre care pointează variabila *prim* este vârful stivei, iar nodul spre care pointează variabila *ultim* este baza stivei.

În continuare este descrisă implementarea în LC-3 ISA a codului aferent operațiilor de bază de depunere în stivă (Push) și de extragere din stivă (Pop). De menționat că, procesoarele Intel au definite instrucțiuni cu același nume *PUSH reg* și *POP reg*. Procesoarele RISC însă (denumite și mașini load/store) implementează operațiile cu stiva prin instrucțiuni de scriere și citire din memorie (*store* – pentru Push și *load* – pentru Pop).

#### **Push**

|                |                                                                    |
|----------------|--------------------------------------------------------------------|
| ADD R6, R6, #1 | ; incrementează valoarea indicatorului de stivă (se modifică TOS). |
|----------------|--------------------------------------------------------------------|

|                |                                                            |
|----------------|------------------------------------------------------------|
| STR R0, R6, #0 | ; memorează (depune în stivă) data aflată în registrul R0. |
|----------------|------------------------------------------------------------|

#### **Pop**

|                |                                                            |
|----------------|------------------------------------------------------------|
| LDR R0, R6, #0 | ; citește din memorie data de la adresa specificată de TOS |
|----------------|------------------------------------------------------------|

|                 |                                                         |
|-----------------|---------------------------------------------------------|
| ADD R6, R6, #-1 | ; decrementează indicatorul de stivă (se modifică TOS). |
|-----------------|---------------------------------------------------------|

**Obs:** De remarcat că, deși în cazul unei stive fizice (de farfurii – de exemplu), la extragerea din stivă elementul dispare, în urma operației de *POP* din stivă data se preia din memorie într-un registru destinație, dar informația rămâne la adresa respectivă. Actualizarea vârfului stivei

este operația ce marchează extragerea unui element din stivă permitându-se în continuare încărcarea altuia la locația „recent eliberată”.

Condițiile de eroare ce pot să apară sunt:

- *Underflow* (Încercarea de a extrage un element dintr-o stivă vidă).
- *Overflow* (Încercarea de a depune pe stivă plină un element).

Pentru evitarea apariției acestor condiții de eroare trebuie monitorizată adresa vârfului stivei (top of stack – *TOS*). În cadrul LC-3 ISA, vârful stivei reține tot timpul adresa ultimei locații ocupate din stivă (fiecare operație Push incrementeză *TOS* iar fiecare operație Pop îl decrementeză). Astfel înaintea fiecărei operații de depunere în stivă trebuie întâi actualizat vârful stivei și apoi scrisă informația la noua adresă (noul *TOS*) iar la fiecare extragere din stivă trebuie, după citirea datei din stivă, să se actualizeze *TOS*. Stiva crește în capacitate (în locații utilizate) în jos. La anumite procesoare (MIPS pe platformă Linux) stiva crește în capacitate de la adrese mari spre adrese mici (deci registrul SP va fi decrementat la fiecare operație Push și incrementat la fiecare Pop).

Practic înaintea operației de depunere în stivă trebuie testată condiția de *overflow* iar la extragere trebuie testată condiția de *underflow*. Schema logică de mai jos verifică dacă înaintea unei extrageri stiva este vidă și marchează în registrul R5 rezultatul (1 dacă apare *underflow* și 0 dacă se poate face extragerea, iar în R0 se depune valoarea din vârful stivei).



**Figura 9.4** Testarea condiției de *underflow*

Astfel prin introducerea instrucțiunilor care testează condițiile de eroare codul echivalent instrucțiunilor PUSH și POP se complică. În continuare sunt descrise două subroutines care implementează cele două operații cu stiva.

### Codul aferent operației POP cu verificarea condiției de *Underflow*

, se consideră implementarea software a stivei din figura 9.3 în care valoarea indicatorului de stivă (R6) pentru stiva vidă este 0x3FFF.

|       |                 |                                                                                 |
|-------|-----------------|---------------------------------------------------------------------------------|
| POP   | LD R1, EMPTY    | ; EMPTY = -0x3FFF (inversul indicatorului de stivă în cazul în care stiva vidă) |
|       | ADD R2, R6, R1  | ; Se verifică dacă stiva este vidă                                              |
|       | BRz FAIL        | ; În caz afirmativ se trece la setarea condiției pentru eroare                  |
|       | LDR R0, R6, #0  | ; Stiva nefiind vidă se încarcă în R0 valoarea din vârful acesteia              |
|       | ADD R6, R6, #-1 | ; Se decrementează indicatorul de stivă                                         |
|       | AND R5, R5, #0  | ; Se indică SUCCESS prin resetarea registrului R5                               |
|       | RET             |                                                                                 |
| FAIL  | AND R5, R5, #0  | ; FAIL: R5 = 1                                                                  |
|       | ADD R5, R5, #1  | ; Se încarcă în R5 valoarea 1 pentru a marca eroare la descărcare din stivă     |
|       | RET             |                                                                                 |
| EMPTY | .FILL xC001     |                                                                                 |

### Codul aferent operației PUSH cu verificarea condiției de *Overflow*

; Se consideră implementarea software a stivei din figura 9.3 cu 5 valori care pot fi depuse în stivă. Indicatorul de stivă (R6) pentru stiva vidă este 0x3FFF. Secvența de mai jos verifică dacă înaintea unei depunerî pe stivă aceasta este plină (nu mai pot fi depuse alte elemente) și marchează în registrul R5 rezultatul (1 dacă apare *overflow* și 0 dacă se poate face depunere, valoarea care va fi scrisă în vârful stivei fiind cea aflată în registrul R0).

```
PUSH LD R1, MAX      ; MAX = -x4004
ADD R2, R6, R1        ; Compară stack pointer-ul cu x3FFF
BRz FAIL
```

```

ADD R6, R6, #1      ; Vârful stivei va fi incrementat, stiva
                      crescând în capacitate
STR R0, R6, #0
AND R5, R5, #0 ; SUCCESS: R5 = 0
RET
FAIL    AND R5, R5, #0 ; FAIL: R5 = 1
        ADD R5, R5, #1
        RET
MAX     .FILL 0xBFFC

```

#### **9.1.4. MODUL DE LUCRU PRIN ÎNTRERUPERI HARDWARE.**

Una din facilitățile mecanismului de stivă o reprezintă posibilitatea apelării funcțiilor imbicate (recursivitate directă sau indirectă) și după cum se va vedea în continuare al tratării intreruperilor imbicate (apariția unei intreruperi în chiar rutina de serviciu (tratare) a altrei intreruperi, atunci când este permis). După cum s-a mai specificat și în capitolul 8, o intrerupere hardware poate fi considerată un apel de subrutină (spre necunoscut din punct de vedere al programatorului dar nu și al procesorului și al sistemului de operare) declanșat asincron de un eveniment extern.

Modul de lucru prin intreruperi hardware urmărește tratarea eficientă din punct de vedere al performanței de procesare a interacțiunilor dintre dispozitivele periferice și procesor. De câte ori dorește un serviciu de la procesor, dispozitivul extern, prin interfața sa, lănează un semnal de intrerupere (de exemplu, când se introduce un caracter de la tastatură sau când monitorul / imprimanta sunt gata pentru a afișa un nou caracter). În urma recepționării semnalului de intrerupere, procesorul încheie ciclul instrucțiunii aflate în execuție și părăsește programul principal urmând să intre în rutina de serviciu a intreruperii respective (similară ruteinelor de serviciu aferente intreruperilor software – instrucțiunilor TRAP la LC-3 ISA) pentru satisfacerea cererii respectivelui dispozitiv extern. În cele mai multe cazuri, la încheierea rutinei de tratare a intreruperii se predă controlul programului utilizator (cu ajutorul instrucțiunii RTI la LC-3 ISA, IRET la Intel sau JR \$31 la MIPS), reluarea procesării făcându-se cu instrucțiunea imediat următoare celei pe care a apărut intreruperea. Pot apărea însă cazuri în care, în timpul tratării unei intreruperi apare o nouă cerere de intrerupere din partea altui dispozitiv periferic. Dacă este permisă intreruperea (vezi într-un exemplu ulterior) atunci se intră în rutina de tratare a noii intreruperi.

La încheierea acestea se revine în rutina de tratare a primei întreruperi care se va procesa până la terminare, în final cedându-se controlul programului principal.

Avantajul modului de lucru prin întreruperi hardware constă în faptul că procesorul nu mai trebuie să interogheze la anumite intervale de timp fiecare dispozitiv periferic, putând executa alte sarcini în acest timp (instrucțiuni utile).

Dintre cauzele apariției întreruperilor hardware se disting următoarele:

- Evenimentele externe sunt nesigure și au o apariție neregulată (de exemplu, sosirea pachetelor de date din rețea, apăsarea tastelor).
- Operațiile cu dispozitivele externe durează foarte mult (de exemplu, transferul datelor pe/de pe disc în/din memorie) iar procesorul poate face altceva pe perioada transferului (cazul transferurilor cu acces direct la memorie).
- Evenimente rare dar critice: incendii sau alte calamități, situații în care este necesară oprirea sistemelor de calcul.

Figura 9.5 prezintă interacțiunea dintre procesor și un dispozitiv extern. Când respectivul periferic vrea să întrerupă activitatea procesorului și să îi ceară acestuia un serviciu, prin intermediul interfeței sale (*controller*) va seta semnalul de întrerupere externă (INT=1). Toate acțiunilor executate de către procesor din momentul apariției semnalului de întrerupere INT până în momentul procesării primei instrucțiuni din rutina de tratare a întreruperii formează așa numitul **protocol hardware de acceptare a întreruperii** desfășurat în următoarele etape successive:

1. În general, procesoarele verifică activarea întreruperilor la finele ultimului ciclu aferent instrucțiunii în curs de execuție [Mus97, Lun05] (în cazul LC-3 ISA [Patt03] între faza *STORE RESULT* a instrucțiunii aflate în execuție și faza *FETCH* instrucțiunea care urmează). Odată sesizată întreruperea INT de către procesor acesta își va termina instrucțiunea în curs de execuție după care, dacă nu există activată o cerere de întrerupere sau de magistrală mai prioritară, nu va face faza *FETCH* a următoarei instrucțiuni ci va trece la pasul 2.
2. Identificarea întreruperii: procesorul va inițializa așa numitul **ciclu de achitare a întreruperii**. Pe parcursul acestui ciclu extern va genera un semnal de răspuns (achitare) a întreruperii **INTA** (*interrupt acknowledge*) spre toate interfețele de intrare - ieșire. Ca urmare a recepționării INTA interfața care a înterrupt va furniza procesorului prin intermediul bus-ului de date o succesiune de 8 biți reprezentând **vectorul de întrerupere (vector)**. Acest vector diferă pentru fiecare periferic în parte, identificându-l într-un mod unic. Similar cu cazul instrucțiunilor TRAP, vectorul de întrerupere reprezintă un index în

tabela cu adresele de start a rutinelor de serviciu. Informația de la locația specificată reprezintă adresa primei instrucțiuni din rutina de tratare a întreruperii, valoare care se încarcă în registrul PC. Vectorilor de întrerupere diferiți îi vor corespunde adrese de rutine diferite.

3. Procesorul va salva pe stivă PC-ul aferent instrucțiunii imediat următoare instrucțiunii executate de către procesor din programul principal (adresa de revenire), pentru a putea să la finele rutinei de tratare a întreruperii unde să revină exact în programul principal. De asemenea, sunt salvate pe stivă codurile de condiție (N, Z, P) – vezi exemplul din figurile 9.7÷9.10. Acest fapt se poate dovedi insuficient având în vedere că în cadrul rutinei de serviciu pot fi alterați anumiți registri interni ai procesorului – alterare care poate fi chiar dezastroasă la revenirea în programul principal. Din acest motiv cade în sarcina celui care scrie rutina de serviciu să salveze (folosind accese de depunere în stiva – PUSH) respectiv să returneze corespondență (folosind accese de extragere din stiva – POP) acești registrii.
4. După încheierea rutinei de tratare a întreruperii, instrucțiunea RTI restaurează codurile de condiție și vechiul PC (adresa de revenire). Este necesară practic o altă instrucțiune de revenire deoarece instrucțiunea RET preia doar adresa de revenire din registrul R7 și o depune în PC, nu și codurile de condiție.



**Figura 9.5.** Modul de lucru prin întreruperi hardware

În cazul în care mai mult de un dispozitiv extern dorește să întrerupă activitatea procesorului în același timp, procesorul trebuie să asigure un mecanism de prioritizare a cererilor de întrerupere (deservirea perifericelor respective).

În continuare, se exemplifică folosind registrul de stare al tastaturii (KBSR – *keyboard status register*) cum se generează semnalul INT de întrerupere a activității procesorului prin apăsarea unei taste de către utilizator. La majoritatea dispozitivelor de intrare / ieșire registrul de stare conține pe lângă bitul *Ready* (care marchează disponibilitatea perifericului în generarea unei întreruperi) și un bit de validare a întreruperii de către procesor (*Interrupt Enable*) – vezi figura 9.6. Practic la apăsarea unei taste bitul Ready al KBSR este setat (devine 1). La fel, în cazul în care circuitele

electronice asociate monitorului au încheiat cu succes afișarea ultimului caracter, bitul Ready al CRTSR (registrul de stare al monitorului) devine 1. Cu toate că întreruperea este solicitată de către dispozitivul periferic, în realitate, procesorul nu poate fi întrerupt, fără acceptul acestuia. Bitul 14 al KBSR (IE) poate fi setat sau sters de către procesor, în funcție de disponibilitatea acestuia de a fi întrerupt de către respectivul periferic. Unele procesoare dețin un registru de validare a întreruperilor numit „mască de întreruperi” (*Interrupt Mask*). LC-3 ISA nu deține un astfel de regisztr. Dacă procesorul acceptă să fie întrerupt atunci, în momentul în care bitul Ready este setat se generează semnalul INT (cerere de întrerupere a activității procesorului).

Se observă că: **INT = IE AND Ready**. Practic, nu e suficient ca utilizatorul să apese o tastă dacă procesorul nu acceptă să fie întrerupt (fiind de exemplu, într-o rutină de serviciu neinteruptibilă, mai priorită), dar de asemenea, nu e suficient ca procesorul să valideze întreruperile ci trebuie ca și „ceva să se întâpte” (se apasă o tastă, se introduce un CD în unitatea CD-ROM spre citire, trebuie imprimat un text pe ecran sau imprimantă, etc.).



**Figura 9.6.** Generarea cererii perifericului de întrerupere a activității procesorului

În continuare sunt prezentate o secvență de ipostaze care justifică **necesitatea stivei în cazul tratării întreruperilor hardware imbicate**. În figura 9.7 programul principal A execută instrucțiunea de adunare ADD de la adresa 0x3006, moment în care este întrerupt de către perifericul B.



**Figura 9.7.** Programul principal A execută instrucțiunea ADD de la adresa 0x3006 când perifericul B îl întrerupe

La apariția semnalului INT, procesorul încheie instrucțiunea de adunare ADD, salvează pe stivă adresa următoarei instrucțiuni din programul principal (PC=0x3007) și codurile de condiție tocmai setate de rezultatul adunării și încarcă în PC valoarea vectorului de întrerupere, citește din memorie de la adresa respectivă adresa primei instrucțiuni din rutina de tratare (0x6200) pe care o încarcă în PC, predând controlul rutinei de serviciu.



**Figura 9.8.** Protocolul de achitare a întreruperii – pașii 2 și 3

Rutina de serviciu aferentă întreruperii provocate de dispozitivul B conține 17 instrucțiuni de la adresa 0x6200 la adresa 0x6210. În timpul execuției instrucțiunii AND (vezi figura 9.9) de la adresa 0x6202 dispozitivul C trimite procesorului o cerere de întrerupere.



**Figura 9.9.** Instantaneu cu execuția instrucțiunii AND din rutina de serviciu a perifericului B

Înainte de preluarea controlului de către rutina de serviciu aferentă perifericului C (vezi figura 9.10), sunt salvate în stivă adresa instrucțiunii din rutina perifericului B, următoare celei pe care a apărut întreruperea (PC=0x6203) și codurile de condiție (reșîrri booleani N, Z și P). Rutina de serviciu aferentă perifericului C este plasată la adresa 0x6300 și conține 22 de instrucțiuni.



**Figura 9.10.** Instantaneu cu stiva, programul principal și cele două rutine de serviciu

Execuția instrucțiunii RTI (*return from interrupt*) de la adresa 0x6315 (vezi figura 9.11), ultima din rutina de tratare aferentă perifericului C, presupune extragerea din stivă atât a codurilor de condiție cât și a adresei instrucțiunii succesoare AND-ului pe care a apărut întreruperea de la perifericul C. În continuare sunt executate instrucțiunile din rutina de serviciu aferentă perifericului B.



**Figura 9.11.** Revenirea din rutina de serviciu aferentă perifericului C

Execuția instrucțiunii RTI (*return from interrupt*) de la adresa 0x6210 (vezi figura 9.12), ultima din rutina de tratare aferentă perifericului B, presupune extragerea din stivă atât a codurilor de condiție cât și a adresei

instrucțiunii succesoare ADD-ului pe care a apărut întreruperea de la perifericul B. În continuare sunt executate instrucțiunile din programul principal. În acest moment se observă cum indicatorul de vârf al stivei revine pe poziția inițială (dinaintea apariției întreruperii provocate de perifericul B) când stiva era liberă.



**Figura 9.12.** Efectul instrucțiunii RTI asupra stivei

În figura 9.13 se prezintă sintetic un instantaneu cu etapele parcuse la apariția întreruperilor provocate de cele două periferice (B și C), și care au fost detaliate prin intermediul figurilor 9.7-9.12. La momentul inițial stiva este liberă, programul principal A execută instrucțiunea de adunare de la adresa 0x3006, moment în care perifericul B lansează o cerere de întrerupere. La finele fazei de *Scriere Rezultat* aferente instrucțiunii ADD (procesorul acceptă întreruperea, efectuându-se protocolul de achitare a acesteia), sunt salvate în stivă adresa instrucțiunii următoare ADD-ului din programul A și codurile de condiție, cedându-se controlul primei instrucțiuni din rutina de tratare a întreruperii provocate de perifericul B (etapa marcata cu 1). În timpul execuției instrucțiunii AND de la adresa 0x6202 din rutina de serviciu aferentă perifericului B, dispozitivul C trimite procesorului o cerere de întrerupere. La finele fazei de *Scriere Rezultat* aferente instrucțiunii AND (procesorul acceptă întreruperea, efectuându-se protocolul de achitare a acesteia), sunt salvate în stivă adresa instrucțiunii următoare AND-ului din rutina de serviciu a perifericului B și codurile de condiție, cedându-se controlul primei instrucțiuni din rutina de tratare a întreruperii provocate de perifericul C (etapa marcata cu 2). Execuția instrucțiunii RTI de la adresa 0x6315, ultima din rutina de tratare aferentă perifericului C, presupune extragerea din stivă atât a codurilor de condiție cât și a adresei instrucțiunii succesoare AND-ului pe care a apărut

întreruperea de la perifericul C. Aceasta marchează practic etapa cu numărul 3). În continuare sunt executate instrucțiunile din rutina de serviciu aferentă perifericului B. Execuția instrucțiunii RTI de la adresa 0x6210, ultima din rutina de tratare aferentă perifericului B, presupune extragerea din stivă atât a codurilor de condiție cât și a adresei instrucțiunii succesoare ADD-ului pe care a apărut întreruperea de la perifericul B, marcând practic etapa cu numărul 4. În continuare sunt executate instrucțiunile din programul principal ca și cum nimic nu s-ar fi întâmplat, cu o oarecare întârziere din punct de vedere al timpului de execuție al programului A. În acest moment se observă cum indicatorul de vârf al stivei revine pe poziția inițială (dinaintea apariției întreruperii provocate de perifericul B) când stiva era liberă. Totuși anumite locații în stivă au fost afectate, chiar dacă acum ele figurează ca libere.



**Figura 9.13.** Instantaneu care sintetizează etapele parcuse la apariția întreruperilor de la cele două periferice

## 9.2. OPERAȚII ARITMETICE FOLOSIND STIVA

O aplicabilitate importantă a mecanismului stivei o reprezintă implementarea mașinilor virtuale. De regulă, aceste arhitecturi folosesc în locul regiștrilor o stivă pentru operanzei sursă și destinație (se mai numesc arhitecturi fără operanzi – „zero-address machine”). Instrucțiunile în acest caz sunt simple: *ADD*, *MUL*. Execuția lor presupune extragerea din stivă a ultimelor două locații ocupate, execuția propriu-zisă a adunării sau înmulțirii

cu cei doi operanzi aflați în stivă, rezultatul fiind apoi depus înapoi în stivă. Instrucțiunile *PUSH*, *POP*, *ADD*, *MUL*, *NEG*, etc. aparțin mașinii virtuale dar nu arhitecturii gazdă pe care rulează aceasta (în cazul de față – LC-3 ISA). Codul aferent operațiilor implicate de respectivele instrucțiuni sunt descrise prin intermediul unor rutine formate din instrucțiuni ale arhitecturii gazdă. Aceste rutine nu pot fi alterate (modificate) de către programator. Ele reprezintă de fapt semnale de control (componente microarhitecturale) folosite de către arhitectura gazdă pentru declanșarea operațiilor care au loc la nivelul mașinii virtuale.

Pentru exemplificare se consideră următoarea expresie de calculat:  $E = (A+B)\cdot(C+D)$ . Dacă A reține valoarea 25, B conține valoarea 17, C este egal cu 3 și D este egal cu 2, să se memoreze rezultatul în E.

a) *Evaluarea expresiei pe o arhitectură cu trei operanzi:*

Presupunând că LC-3 ISA pune la dispoziție o instrucțiune de înmulțire (notată cu *MUL*), atunci într-o arhitectură cum este LC-3 (*three-address machine*) codul sursă pentru evaluarea expresiei  $E = (A+B)\cdot(C+D)$  este următorul:

```
LD R0, A  
LD R1, B  
ADD R0, R0, R1  
LD R2, C  
LD R3, D  
ADD R2, R2, R3  
MUL R0, R0, R2  
ST R0, E
```

b) *Evaluarea expresiei pe o arhitectură cu zero operanzi (bazată pe stivă):*

```
PUSH A  
PUSH B  
ADD  
PUSH C  
PUSH D  
ADD  
MUL  
POP E
```

Un exemplu foarte des folosit în sistemele de calcul moderne îl constituie **mașina virtuală Java** (JVM). Aceasta reprezintă un model abstract de arhitectură de calcul destinată execuției unui program scris într-un limbaj independent de mașină (bytecode Java).

- ✓ Interacționează atât cu sistemul de operare cât și cu arhitectura hardware a sistemului gazdă
- ✓ Unul din **avantajele majore** îl constituie faptul că asigură portabilitatea aplicațiilor Java (implementarea browser-elor JVM).

Componentele de bază ale mașinii virtuale Java:

- *Regiștri* – include un program counter (*PC*) și trei alți regiștri folosiți pentru a administra *stiva*. Întrucât JVM este o arhitectură bazată pe stivă rezultă necesitatea unui număr redus de regiștri.
- Bytecodul este stocat în *zona de cod*. Registrul PC indică spre următorul *bytecod* (instrucțiune) din zona de cod care va fi executat de JVM. Parametrii pentru instrucțiunile bytecod (metode), ca și rezultatele executării instrucțiunilor bytecod (rezultatele returnate de metode) sunt stocate pe stivă.
- *Stiva* este folosită și pentru a menține contextul fiecărei metode invocate, numit *stack frame*. Pentru a administra stack frame-ul (contextul), se folosesc regiștrii *top*, *frame* și *vars*. Parametrii instrucțiunilor *bytecod* precum și rezultatele execuției acestor instrucțiuni sunt memorate în stivă.

O altă aplicabilitate importantă a mecanismului stivei se regăsește în **evaluarea expresiilor** (aritmetice, simbolice, relationale) din cadrul analizei sintactice – componentă a compilatoarelor [Gol97].

Pentru evaluarea unei expresii aritmetice compilatorul o aduce la o formă bazată pe forma poloneză postfixată în care au fost desființate parantezele rotunde. Ordinea de evaluare a expresiilor compuse este determinată de:

- ✓ utilizarea parantezelor
- ✓ precedența operatorilor

Notația poloneză (sau *postfixată*) este un mod de scriere a expresiilor, în care ordinea operatorilor și a operanzilor este schimbată față de cea dintr-o expresie uzuală.

În notația uzuală (numită și *infix*) o expresie are forma: ***operand operator operand***

În notația *postfixată* (poloneză) expresia este scrisă sub forma: ***operand operand operator***.

De exemplu:

$a + b$  devine în notație poloneză  $a\ b\ +$   
 $(a - b) * c$  devine  $a\ b\ -\ c\ *$   
 $a - b * (c + d)$  devine  $a\ b\ c\ d\ +\ *\ -$

Avantajul notației poloneze este acela că indică ordinea corectă a evaluării operațiilor fără a utiliza paranteze. Astfel, o expresie poloneză poate fi evaluată printr-o singură parcurgere a sa. **Pentru evaluarea unei expresii în notație poloneză se poate folosi o stivă de valori reale.** Ori de câte ori întâlnim în expresie un operand, valoarea lui este introdusă în stivă. Dacă întâlnim un operator atunci se extrag două valori din vârful stivei, care sunt, de fapt, cei doi operanzi, se aplică operatorul asupra valorilor extrase și rezultatul este depus în stivă. În momentul în care s-a terminat parcurgerea expresiei, rezultatul final al expresiei este în vârful stivei (și stiva conține doar această valoare).

### 9.3. CONVERSIA INFORMAȚIEI DIN FORMAT ASCII ÎN ZECIMAL

Conversia informației în sistemele de calcul este necesară pentru a facilita transmiterea acestora dintr-o formă prietenoasă pentru utilizator spre procesare într-o formă prietenoasă pentru calculator. Conversia informației din format ASCII în format decimal trebuie făcută întrucât rutinile de intrare a informației în calculator (citirea de la tastatură sau din fișiere) preiau datele în format ASCII (caractere, nu valori numerice). De asemenea, ieșirea informației din sistem se face în același format. Spre exemplificare se consideră următorul program scris în limbaj de asamblare LC-3.

|                |                                                        |
|----------------|--------------------------------------------------------|
| TRAP 0x23      | ; îintrerupere software pentru citirea de la tastatură |
| ADD R1, R0, #0 | ; transferă codul ASCII al caracterului citit în R1    |
| TRAP 0x23      | ; îintrerupere software pentru citirea de la tastatură |
| ADD R0, R1, R0 | ; adună cele două informații citite (codurile ASCII)   |

|           |                                                            |
|-----------|------------------------------------------------------------|
| TRAP 0x21 | ; afișează caracterul al cărui cod ASCII se află în R0     |
| TRAP 0x25 | ; HALT – întrerupere care marchează încheierea programului |

Dacă utilizatorul introduce succesiv valorile 2 și apoi 3 rezultatul afișat pe ecran va fi caracterul „e”. Explicația este următoarea: codul ASCII al caracterului „2” este 0x32, cel al caracterului „3” este 0x33 rezultând în registrul R0 valoarea  $(0x32 + 0x33) = 0x65$ , iar caracterul cu acest cod ASCII este „e”.

### 9.3.1. CONVERSIA DIN ASCII ÎN BINAR

Exemplul din paragraful anterior este însă valabil doar dacă se citesc de la tastatură numere alcătuite dintr-o cifră. În continuare va fi prezentată o secvență de program care permite conversia unui sir de caractere într-un număr alcătuit din mai mulți digiti. Se consideră astfel că, de la tastatură se citește sirul de caractere "259" și se stochează într-o zonă de memorie, de unde va fi luat fiecare caracter în parte, transformat în digit și prelucrat pentru generarea numărului final. Etapele conversiei sunt următoarele:

- Ⓐ Se convertește primul caracter al sirului (cel mai semnificativ – în acest caz 2) în digitul corespunzător (se scade valoarea 0x30) și se înmulțește cu 100.
- Ⓑ Se convertește al doilea caracter al sirului (în acest caz 5) în digitul corespunzător și se înmulțește cu 10.
- Ⓒ Se convertește al treilea caracter al sirului (în acest caz 9) în digitul corespunzător. Dacă numărul ar fi avut mai mulți digiti inițial identificată lungimea sirului, iar aflarea fiecărei cifre continua până la cifra unităților.
- Ⓓ Se adaugă toate cele trei numere obținute la fiecare pas.

Una din operațiile amintite anterior și necesară în procesul de conversie o reprezintă înmulțirea. Întrucât arhitectura LC-3 ISA nu dispune de o instrucțiune de înmulțire trebuie găsită o alternativă prin care să se poată realiza înmulțirea unui digit cu 100 și apoi înmulțirea unui digit cu 10. O abordare simplistă ar consta în adunări repetitive (se adună digitul respectiv de 100 de ori), variantă ineficientă totuși. O a doua variantă o reprezintă adunarea numărului 100 cu el însuși de *valoarea digitului* respectiv ori (mai eficientă decât varianta anterioară întrucât se fac mai puține adunări – digitul fiind în mod clar <10). Chiar și această a doua variantă se poate

realiza printr-un artificiu. Decât să se efectueze un număr necunoscut de adunări se apelează la o tabelă de căutare folosită în cazul înmulțirii. Astfel, fiecare intrare în această tabelă va conține un număr (multiplu de 100) între 0 și 900 inclusiv, digitul reprezentând indexul în intervalul (0-9) în tabelă.

|          |                      |
|----------|----------------------|
| Entry 0: | $0 \times 100 = 0$   |
| Entry 1: | $1 \times 100 = 100$ |
| Entry 2: | $2 \times 100 = 200$ |
| etc.     |                      |

Secvența de cod asamblare LC-3 pentru căutarea în tabelă este următorul:

; se înmulțește conținutul lui R0 cu 100, folosind tabela de căutare;

```

LEA R1, Lookup100      ;R1 = adresa de bază a tablei
ADD R1, R1, R0          ;se adaugă la adresa de bază
                        ; indexul aflat în R0
LDR R0, R1, #0          ; se citește locația de memorie
                        ; de la adresa calculată în R1
...
Lookup100    .FILL 0      ; intrarea 0 reține valoarea
                      ; 0*100=0
.FILL 100      ; intrarea 1 reține valoarea
                      ; 1*100=100
.FILL 200      ; intrarea 2 reține valoarea
                      ; 2*100=200
.FILL 300      ; intrarea 3 reține valoarea
                      ; 3*100=300
.FILL 400      ; intrarea 4 reține valoarea
                      ; 4*100=400
.FILL 500      ; intrarea 5 reține valoarea
                      ; 5*100=500
.FILL 600      ; intrarea 6 reține valoarea
                      ; 6*100=600
.FILL 700      ; intrarea 7 reține valoarea
                      ; 7*100=700
.FILL 800      ; intrarea 8 reține valoarea
                      ; 8*100=800
.FILL 900      ; intrarea 9 reține valoarea
                      ; 9*100=900

```

## Rutina de conversie completă din ASCII în decimal

- ; Buffer-ul de trei digiți se numește ASCIIBUF.
- ; R1 indică numărul de digiți care trebuie convertiți. Conversia se va face de la cifra unităților spre sute – de la cel mai puțin semnificativ spre cel semnificativ.
- ; Rezultatul sub forma unui număr zecimal este depus în R0.

|               |                                  |                                                                                                                                                                                                                                                                                                                                                         |
|---------------|----------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| ASCIItoBinary | AND R0, R0, #0<br>ADD R1, R1, #0 | ; inițializare rezultat<br>; testează numărul de digiți<br>rămași pentru conversie<br>; deși pare să nu facă nimic,<br>instrucțiunea anterioară setează<br>bitul de condiție<br>; se sare la eticheta care<br>marchează ultima instrucțiune din<br>rutină dacă nu mai sunt digiți de<br>convertit (bitul Z a fost setat pe 1<br>de adunarea anterioară) |
| ;             | BRz DoneAtoB                     |                                                                                                                                                                                                                                                                                                                                                         |
| ;             | LD R3, NegZero                   | ; R3 = -0x30 – se pregătește<br>decrementarea codului ASCII al<br>caracterului cu inversul codului<br>cifrei „0”                                                                                                                                                                                                                                        |
| ;             | LEA R2, ASCIIBUF                 | ; R2=adresa de bază a primului<br>element din sir (ASCIIBUF)                                                                                                                                                                                                                                                                                            |
| ;             | ADD R2, R2, R1                   | ; R2 indică după caracterul de<br>convertit (în prima fază chiar<br>ultimul)                                                                                                                                                                                                                                                                            |
| ;             | ADD R2, R2, #-1                  | ; R2 indică în fața caracterului<br>de convertit                                                                                                                                                                                                                                                                                                        |
| ;             | LDR R4, R2, #0                   | ; citește din tabelă caracterul de<br>convertit                                                                                                                                                                                                                                                                                                         |
| ;             | ADD R4, R4, R3                   | ; convertește caracterul în digit                                                                                                                                                                                                                                                                                                                       |
| ;             | ADD R0, R0, R4                   | ; adaugă digitul (cifra<br>unităților) la numărul final                                                                                                                                                                                                                                                                                                 |
| ;             | ADD R1, R1, #-1                  | ; decrementează numărul de<br>digiți care mai trebuie convertiți,<br>cu implicații implicate și asupra<br>citirii din buffer-ul de caractere                                                                                                                                                                                                            |

|          |                   |                                                                                                          |
|----------|-------------------|----------------------------------------------------------------------------------------------------------|
|          | BRz DoneAtoB      | ; se sare la eticheta care marchează ultima instrucțiune din rutină dacă nu mai sunt digiți de convertit |
|          | ADD R2, R2, #-1   | ; R2 indică spre digitul zecilor                                                                         |
|          | LDR R4, R2, #0    | ; citește din tabelă caracterul de convertit                                                             |
|          | ADD R4, R4, R3    | ; convertește caracterul în digit                                                                        |
|          | LEA R5, Lookup10  | ; R5 reține adresa tabelei cu zeci (multiplii de 10)                                                     |
|          | ADD R5, R5, R4    | ; se determină offsetul în tabela zecilor -> R5                                                          |
|          | LDR R4, R5, #0    | ; în R4 se depune multiplul de 10 respectiv                                                              |
|          | ADD R0, R0, R4    | ; se adaugă la unități și zecile aferente numărului de convertit                                         |
| ;        |                   |                                                                                                          |
|          | ADD R1, R1, #-1   | ; decrementează cu 1 numărul de digiți care mai trebuie convertiți                                       |
|          | BRz DoneAtoB      | ; se sare la eticheta care marchează ultima instrucțiune din rutină dacă nu mai sunt digiți de convertit |
|          | ADD R2, R2, #-1   | ; R2 indică spre digitul sutelor                                                                         |
|          | LDR R4, R2, #0    | ; citește din tabelă caracterul de convertit                                                             |
|          | ADD R4, R4, R3    | ; convertește caracterul în digit                                                                        |
|          | LEA R5, Lookup100 | ; R5 reține adresa tabelei cu sutele (multiplii de 100);                                                 |
|          | ADD R5, R5, R4    | ; se determină offsetul în tabela sutelor -> R5                                                          |
|          | LDR R4, R5, #0    | ; în R4 se depune multiplul de 100 respectiv                                                             |
|          | ADD R0, R0, R4    | ; se adaugă la numărul deja format și contribuția sutelor                                                |
| ;        |                   |                                                                                                          |
| DoneAtoB | RET               | ; revenirea din rutina de conversie                                                                      |
| NegZero  | .FILL 0xFFD0      | ; -0x30 – inversul codului ASCII al caracterului „0”.                                                    |
| ASCIIBUF | .BLKW 4           | ; se alocă 4 spații pentru sirul de caractere de trei digiți și pentru terminatorul NULL                 |
| Lookup10 | .FILL 0           |                                                                                                          |

```

.FILL 10
.FILL 20
...
Lookup100      .FILL 0
                .FILL 100
...

```

### 9.3.2. CONVERSIA DIN ZECIMAL ÎN ASCII

Întrucât rezultatul oricărui program numeric va fi una sau mai multe valori care se doresc să fie afișate, este absolut necesară și conversia inversă din zecimal în sir de caractere. Afișarea în LC-3 se poate face apoi folosind intreruperea software PPUTS – TRAP 0x22 (pentru întregul sirul) sau OUT – TRAP 0x21 (pentru un singur caracter). Se consideră spre exemplificare un rezultat pe trei digită. În acest caz, operațiile aritmetice ce trebuie efectuate sunt cele de împărțire cu 100 pentru obținerea fiecărui digit în parte și adunarea la acesta codul ASCII al caracterului „0” – 0x30. Împărțirea în acest caz se realizează prin scăderi repetitive a valorii 100 din numărul respectiv până devine strict mai mic decât 100. Numărul de scăderi reprezintă de fapt digitul căutat – corespunzător sutelor. În continuare se scade 10 din numărul rămas până se ajunge la o valoare strict mai mică decât 10. Numărul de scăderi reprezintă digitul căutat – corespunzător zecilor. Numărul rămas reprezintă chiar cifra unităților.

Primul pas îl reprezintă verificarea semnului numărului. Semnul este scris în buffer urmând ca, dacă numărul este negativ să fie transformat într-unul pozitiv.

#### Rutina de conversie din decimal în ASCII

; R0 reprezintă un număr întreg de trei cifre din intervalul -999 și +999.  
; În buffer-ul ASCIIBUF se înscrie pe prima poziție semnul urmat de trei digită în format ASCII.

#### BinaryToASCII

|                                                     |                               |
|-----------------------------------------------------|-------------------------------|
| LEA R1, ASCIIBUF ; R1 – adresa sirului de caractere | care reține rezultatul        |
| ADD R0, R0, #0 ; se testează semnul numărului       |                               |
| BRn NegSign ; dacă este număr negativ se sare la    | secvența care scrie semnul în |

|          |                  |                                                                                                                                             |
|----------|------------------|---------------------------------------------------------------------------------------------------------------------------------------------|
|          | LD R2, ASCIIplus | buffer și transformă numărul într-unul pozitiv.                                                                                             |
|          | STR R2, R1, #0   | ; preia în R2 codul ASCII al simbolului „+”                                                                                                 |
|          | BR Begin100      | ; scrie + pe prima poziție în bufferul cu rezultatul                                                                                        |
| NegSign  | LD R2, ASCIIIneg | ; numărul fiind pozitiv se trece direct la conversie                                                                                        |
|          | STR R2, R1, #0   | ; preia în R2 codul ASCII al simbolului „-”                                                                                                 |
|          | NOT R0, R0       | ; scrie - pe prima poziție în bufferul cu rezultatul                                                                                        |
| Begin100 | ADD R0, R0, #1   | ; instrucțiunea curentă și următoarea determină complementul față de 2 al numărului aflat în R0 (transformă numărul din negativ în pozitiv) |
| Loop100  | LD R3, Neg100    | LD R2, ASCIIoffset ; în R2 se adaugă codul ASCII al caracterului „0”                                                                        |
|          | ADD R0, R0, R3   | ; în R3 se încarcă inversul lui 100 pentru scăderi repetitive                                                                               |
|          | BRn End100       | ; scăd 100 din numărul original până obțin un număr mai mic decât 0                                                                         |
|          | ADD R2, R2, #1   | ; dacă rezultatul este mai mic decât 0 înseamnă că am scăzut prea mult (o dată în plus)                                                     |
| End100   | BR Loop100       | ; În R2 se calculează digitul de pe poziția sutelor incrementat la fiecare scădere                                                          |
|          | STR R2, R1, #1   | ; continui și mai scăd 100                                                                                                                  |
|          | LD R3, Pos100    | ; memorez digitul sutelor în buffer pe poziția a doua – după semn.                                                                          |
|          | ADD R0, R0, R3   | ; restabilesc valoarea corectă mai mică decât 100 în R0 prin adunarea valorii 100 la rezultatul scăderii care s-a făcut o dată în plus      |

```

;

LD R2, ASCIIoffset ; în R2 se adaugă codul ASCII al
                     ; caracterului „0”

LD R3, Neg10 ; în R3 se încarcă inversul lui 10
               ; pentru scăderi repetate
               ; scad 10 din numărul format doar
               ; din zeci și unități până obțin un
               ; număr mai mic decât 0
               ; dacă rezultatul este mai mic decât
               ; 0 înseamnă că am scăzut prea mult
               ; (o dată în plus)
               ; În R2 se calculează digitul de pe
               ; poziția zecilor incrementat la
               ; fiecare scădere
               ; continu și mai scad 10
               ; memorez digitul zecilor în buffer
               ; pe poziția a treia – după semn și
               ; digitul sutelor
               ; restabilesc valoarea corectă mai
               ; mică decât 10 în R0 prin adunarea
               ; valorii 10 la rezultatul scăderii care
               ; s-a făcut o dată în plus

;

LD R2, ASCIIoffset ; în R2 se adaugă codul ASCII al
                     ; caracterului „0”

ADD R2, R2, R0 ; se convertește digitul unităților în
                  ; caracter
STR R2, R1, #2 ; memorez digitul zecilor în buffer
                  ; pe poziția a patra – după semn,
                  ; digitul sutelor și după digitul
                  ; zecilor
                  ; revenirea din rutina de conversie
                  ; codul ASCII al simbolului „+”
                  ; codul ASCII al simbolului „-”
                  ; codul ASCII al simbolului „0”
                  ; inversul valorii 100 (pentru
                  ; scăderi repetate ale sutelor)

RET

ASCIIplus .FILL 0x2B
ASCIIneg .FILL 0x2D
ASCIIoffset .FILL 0x30
Neg100 .FILL 0xFF9C

Pos100 .FILL 100
Neg10 .FILL 0xFFFF

```

Using just for studying and non-commercial purposes

## 9.4. EXERCIȚII ȘI PROBLEME

1. Care sunt caracteristicile definitorii ale stivei? Care este rolul indicatorului spre vârful stivei (*stack pointer*)? Ce operații cu stiva cunoașteți și cum sunt ele implementate din punct de vedere al accesului la memorie? Există anumite condiții (cazuri speciale) care trebuie tratate?
2. Se consideră un sir de intrare pe stivă o listă de elemente care sunt încărcate pe stivă în ordinea stabilită de program (programator). De exemplu, pentru următoarele operații efectuate la nivelul stivei:

PUSH A, PUSH B, POP, PUSH C, PUSH D, POP, PUSH E, POP, POP,  
PUSH F, PUSH G, PUSH H, PUSH I, PUSH J, POP, PUSH K, POP,  
POP, POP, PUSH L, POP, POP, PUSH M

șirul de intrare este următorul: ABCDEFGHIJKLM. Sirul de ieșire reprezintă totalitatea elementelor care se extrag din stivă în ordinea stabilită de program (programator).

- a) Care este sirul de ieșire pentru sirul de intrare specificat anterior?  
Indicație: BD...
- b) Dacă sirul de intrare este ZYXWVUTSR, creați o secvență de operații cu stiva (push și respectiv pop) astfel încât sirul de ieșire să fie YXVUWZSRT.
3. Se reamintește că o arhitectură fără operanzi (zero-address machine) reprezintă o arhitectură bazată pe stivă în care toate operațiile aritmetico-logice sunt realizate folosind valorile din vârful stivei. Pentru această problemă, se presupune că ISA proprie permite următoarele operații:
  - **PUSH M** – depune în vârful stivei valoarea stocată la adresa de memorie M.
  - **POP M** – extrage valoarea aflată în vârful stivei și o depune în memorie la adresa M.
  - **OP** – Extrage primele două valori aflate în vârful stivei și execută operația aritmetică-logică specificată asupra celor două valori. Rezultatul este încărcat înapoi pe stivă.

Pentru această problemă opcode-urile (OP) necesare sunt: ADD și MUL.

- a) Scrieți în limbaj de asamblare secvența de cod care calculează expresia:

$$x = (A * ((B * C) + D))$$

- ✓ Într-o arhitectură fără operanzi de genul celei anterior specificate
- ✓ Într-o arhitectură cu trei operanzi – de genul LC-3 ISA, dar care încorporează suplimentar și instrucțiunea de înmulțire – MUL.

- b) Specificați câte un avantaj și respectiv un dezavantaj al fiecărui tip de mașină din cele anterior descrise.

4. Se consideră cele două operații de depunere în stivă – Push și respectiv de extragere din stivă – Pop. Operația Push  $Rn$  depune în vârful stivei valoarea conținută în registrul specificat ( $Rn$ ). Operația Pop  $Rn$  extrage valoarea din vârful stivei și o depune în registrul specificat  $Rn$ . Mai jos este descris un instantaneu cu cei opt regiștrii ai arhitecturii LC-3 înainte și după execuția a șase operații cu stiva. Trebuie menționat că patru din șase operații nu sunt complet specificate. Completați în locul celor patru linii goale cu numele regiștrilor corespunzători pentru ca instantaneul să fie corect.

|      |    |
|------|----|
| PUSH | R4 |
| PUSH | —  |
| POP  | —  |
| PUSH | —  |
| POP  | R2 |
| POP  | —  |

|    | ÎNAINTE de execuție | DUPĂ de execuție |
|----|---------------------|------------------|
| R0 | 0x0000              | 0x1111           |
| R1 | 0x1111              | 0x1111           |
| R2 | 0x2222              | 0x3333           |
| R3 | 0x3333              | 0x3333           |
| R4 | 0x4444              | 0x4444           |
| R5 | 0x5555              | 0x5555           |
| R6 | 0x6666              | 0x6666           |
| R7 | 0x7777              | 0x4444           |

5. Se consideră următoarele operații realizate la nivelul stivei:

**PUSH A, PUSH B, POP, PUSH C, PUSH D, POP, PUSH E, POP, POP, PUSH F**

- Care este conținutul stivei după ultima depunere – **PUSH F**?
- În care moment de timp stiva conține numărul maxim de elemente?
- Fără a elimina vreunul din elementele rămase pe stivă de pe urma operațiilor anterioare, care va fi conținutul stivei după execuția următoarelor operații?

**PUSH G, PUSH H, PUSH I, PUSH J, POP, PUSH K, POP, POP, POP, PUSH L, POP, POP, PUSH M**

6. Răspundeți la întrebările:

- Care sunt cele mai uzuale operații cu stiva și care este modul lor de lucru ? Restricții ce pot să apară.
- Cum este utilizată stiva în mecanismul de întreruperi hardware ?

7. Cu ajutorul structurilor de date dinamice implementați următoarele operații asupra unei stive de date având elemente numere întregi:

- Creare\_stiva(); - creează o stivă nouă (vidă).
- Empty(stiva); – testează dacă stiva primită ca parametru este vidă, returnând 1 în caz afirmativ și 0 dacă stiva nu este vidă.
- Push(stiva, element); – depune elementul specificat ca al doilea parametru pe stiva specificată de către primul parametru.
- Pop(stiva); – extrage și returnează elementul din vârful stivei primită ca parametru.
- Top(stiva); – permite accesul la elementul din vârful stivei fără însă a-l *elimina* din stivă. Returnează respectivul element.
- Full(stiva); – testează dacă stiva este plină returnând 1 în caz afirmativ și 0 în caz contrar.

Atât funcțiile *Pop* cât și *Top* necesită testarea condiției ca stiva primită ca parametru să nu fie vidă.

8. Implementați o mașină virtuală bazată pe stivă (*zero-address machine*), folosind ca și arhitectură de bază (gazdă) LC-3 ISA: instrucțiuni,

reghetrii – cu nume și funcțiile stabilite (R6 – *stack pointer, etc.*). Instrucțiunile mașinii virtuale vor fi: *OpAdd*, *OpMult*, *OpNeg*, *Push M*, *Pop M*. Implementați toate aceste instrucțiuni și rulați programele din subcapitolul 9.2 și evaluați timpul de execuție (eventual număr de instrucțiuni aferente arhitecturii gazdă executate) în ambele situații.

9. Implementați într-un program de nivel înalt (C, C++, Java) următoarea cerință: Se citește dintr-un fișier o expresie aritmetică în care operanzele sunt simbolizați prin litere mici (de la „a” la „z”) iar operatorii sunt „+”, „-”, „\*”, „/” cu semnificația cunoscută. Se pot folosi și parantezele rotunde „(“ și „)”. Programul trebuie să verifice dacă expresia este corectă din punct de vedere sintactic (*parantezele trebuie să se închidă corect, să nu existe doi operatori sau operanzi unul după celălalt, expresia să nu se încheie cu un operator*). Se va ține cont de următoarele indicații: o expresie (S) este alcătuită din termeni (T), separați prin „+” sau „-”; un termen este alcătuit din factori (F) separați prin „\*” sau „/”; un factor este sau o literă mică sau o expresie cuprinsă între paranteze.
10. Implementați într-un program de nivel înalt (C, C++, Java) următoarea problemă: Se citește dintr-un fișier o expresie aritmetică în care operanzele sunt simbolizați prin litere mici (de la „a” la „z”) iar operatorii sunt „+”, „-”, „\*”, „/”, „(“ și „)” cu semnificația cunoscută. Se cere să se convertească această expresie într-o expresie în forma poloneză (postfixată) – vezi subcapitolul 9.2.
11. Implementați într-un program de nivel înalt (C, C++, Java) următoarea problemă: Dându-se o expresie în forma poloneză (postfixată), realizați programul care calculează expresia utilizând numai instrucțiuni de atribuire cu un singur operator. Se vor introduce variabilele auxiliare  $x_1$ ,  $x_2$ , ...,  $x_n$ , unde  $n$  reprezintă numărul operațiilor care apar în expresie. Să se verifice aplicația pentru diverse expresii și pentru diverse valori aferente fiecărui operand (simbol).

## **10. FACILITĂȚI ALE MAȘINII PENTRU IMPLEMENTAREA ÎN HARDWARE A FUNCTIILOR DIN PROGRAMELE DE NIVEL ÎNALT. STIVA DE DATE AFERENTĂ FUNCTIILOR**

### **10.1. OBȚINEREA CODULUI OBIECT PENTRU O ARHITECTURĂ DATĂ**

Limbajele de programare de nivel înalt sunt independente de mașina (microarhitectura hardware) pe care se procesează. Nivelul hardware este abstractizat din punct de vedere al limbajului (operațiile nu depind de arhitectura setului de instrucțiuni –ISA) [Patt03, Zah04]. C este primul limbaj de nivel mediu (considerat de nivel înalt de către alți cercetători) destinat creării de sisteme de operare (anterior acestuia sistemele de operare erau scrise în limbaje de asamblare). De asemenea, în C este permisă manipularea structurilor hardware ale calculatoarelor (reghistroare, memorie, porturi). C este un limbaj de programare standardizat, compilat, implementat pe marea majoritate a platformelor de calcul existente azi. Este apreciat pentru eficiența codului obiect pe care îl poate genera, și pentru portabilitatea sa. A fost dezvoltat la începutul anilor 1970 de Brian Kernighan și Dennis Ritchie, care aveau nevoie de un limbaj simplu și portabil pentru scrierea nucleului sistemului de operare UNIX. Sintaxa limbajului C a stat la baza multor limbaje create ulterior și încă populare azi: C++, Java, JavaScript, C#. C este un limbaj *case sensitive*<sup>14</sup>.

Instrucțiunile din C care rezolvă o problemă sunt mult mai puține decât cele ale limbajului asamblare aferent calculatorului LC-3 care rezolvă aceeași problemă [Patt03]. De asemenea, LC-3 nu asigură instrucțiuni de înmulțire și împărțire. Limbajele de nivel înalt sunt mai expresive decât cele de nivel mediu sau jos (asamblare). Sunt folosite simboluri pentru variabile

<sup>14</sup> Case sensitive – literele mari sunt diferite de cele mici în cadrul tuturor construcțiilor sintactice: variabile, expresii, etc.

și expresii simple pentru structuri de control (if-else, switch-case) sau repetitive (for, while, do-while). Permite compilarea condiționată. Deși limbajul C oferă o libertate foarte mare în scrierea codului, acceptând multe forme de scriere care în alte limbaje nu sunt permise, acest lucru poate fi și un dezavantaj, în special pentru programatorii fără experiență.

### **Compilare vs. Interpretare**

Programele de nivel înalt (*High Level Languages* – HLL) pot fi translătate în instrucțiuni mașină (ISA corespunzătoare arhitecturii hardware pe care se va procesa) prin două metode [Aho86, Gol97]:

✓ **Interpretare:**

Codul sursă HLL este „*interpretat*” de o mașină virtuală (cele mai cunoscute sunt mașinile virtuale Java – JVM) care translatează „secțiuni” din codul sursă în limbaj mașină și îl execută direct pe arhitectura gazdă, trecând apoi la următoarea *secțiune* de cod sursă. Dintre avantajele interpretării față de metodele tradiționale de compilare s-ar menționa simplitatea implementării hardware dar și faptul că nu necesită o zonă mare de memorie pentru stocarea programului compilat. Principalul dezavantaj îl reprezintă viteza scăzută de execuție a aplicației, dar și necesitatea existenței în momentul interpretării atât a codului sursă HLL cât și a mașinii virtuale care realizează interpretarea.

✓ **Compilare:**

Compilarea directă translatează codul sursă (poate fi Java, C, C++, Fortran, Pascal) în instrucțiuni mașină, direct executabile pe un procesor fizic, dar nu le execută ca în cazul interpretoarelor. Orice modificare a codului sursă necesită recompilare. Procesul este realizat static și poate îngloba tehnici de optimizare de tip analiza dependențelor de date dintre instrucțiuni, analiză interprocedurală. Se caracterizează printr-o lipsă de portabilitate.

#### **10.1.1. DESCRIEREA COMPONENTELOR UNUI COMPILATOR**

Compilatorul translatează un program sursă scris într-un limbaj de nivel înalt (C, Pascal) în același program - obiect, de regulă scris în limbaj de asamblare. În literatura de specialitate [Aho86, Gol97], este denumită *fază* a unui compilator o succesiune de operații prin care un program de la

intrare suferă anumite modificări. Prin *trecere* aparținând unui compilator se înțelege o citire a programului dintr-un fișier, transformarea lui conform unor faze și scrierea rezultatului în alt fișier(de ieșire).



**Figura 10.1.** Fazele procesului de compilare

Figura anterioară (10.1) ilustrează cele două faze majore ale procesului de compilare propriu-zisă:

- **analiza** (de tip “*front end*”) - în care se identifică partile constituente fundamentale ale programului (variabile, expresii, declarații, definiții, apeluri de funcții) și se construiește o reprezentare internă a programului original, numită „*cod intermediar*” (*analiza lexicală* produce un -> sir de atomi lexicali -> *analiza sintactică* generează -> arborele sintactic -> *analiză semantică* construiește o reprezentare a programului sursă în-> *cod intermediar*). Este dependentă de limbajul de nivel înalt și nu de mașina pe care se va procesa.
- **sinteză** (de tip “*back end*”) - generează cod mașină eventual optimizat. Se disting două etape:
  - optimizare cod intermediar (scheduling) pentru o anumită mașină;
  - generare de cod mașină (generare cod într-o gamă variată de formate: *limbaj mașină absolut*, *limbaj mașină relocabil* sau

*limbaj de asamblare* urmat de alocare de resurse). Această fază este puternic dependentă de mașina pe care se va executa codul obiect generat.

Înaintea primei faze din cadrul procesului de compilare trebuie realizată de cele mai multe ori o **preprocesare**. Preprocesorul translatează un program al cărui limbaj sursă este de nivel înalt (C, Pascal) într-un program destinație (obiect) scris tot într-un limbaj de nivel înalt C. Practic are loc interpretarea *directiveelor de preprocesare* (încep cu # - *include*, *define*, *if !defined(...)...endif*). De exemplu, preprocesorul trebuie să introducă conținutul fișierului *<stdio.h>* în codul sursă al aplicației create acolo unde apare respectiva directivă de preprocesare, sau, să înlocuiască anumite valori constante declarate ca șiruri de caractere cu valorile numerice aferente, dacă acest lucru se specifică printr-o directivă de tip *#define* în cadrul programului.

**Analiza lexicală** reprezintă prima fază a procesului de compilare, și care este responsabilă de transformarea programului sursă văzut ca o succesiune de caractere (text) într-o succesiune de atomi lexicali și de attribute ale lor. Conform definiției din [Gol97], un atom lexical este o entitate indivizibilă a unui program - identificatori de variabile/functii, constante de diverse tipuri, operatori, cuvinte cheie (if, else, switch/case...), delimitatori. Atributele atomilor lexicali sunt: clasă, tip, lungime, loc în tabela de simboluri, dacă a fost definit sau nu, etc. Clasa atributului se referă la faptul că este cuvânt-cheie, identificator de variabilă, constantă de tip întreg sau real etc.

În continuare sunt descrise câteva considerente care demonstrează utilitatea analizei lexicale ca fază separată a compilatorului:

1. Asigură o proiectare mai ușoară a compilatorului.
2. Faza necesită operații de nivel fizic: citiri de fișiere disc(programul sursă), comparări de șiruri de caractere, acces la nivel de bit, căutări în tabele consumând mult timp în raport cu celelalte faze. Este eficientă scrierea în limbaj de asamblare sau limbaj C a acestei faze urmând ca fazele următoare să poată fi scrise în orice limbaj de nivel înalt.
3. Procesul de analiză sintactică și semantică este simplificat textul fiind curățat de spații (blank-uri) și comentarii.
4. Asigurarea portabilității algoritmului de compilare pentru diverse versiuni ale același limbaj de programare.

Analizorul lexical (AL) constituie interfața dintre programul sursă și compilator (analizorul sintactic). Relația analizorului lexical (AL) față de analizorul sintactic (AS - cel care determină faptul că atomii lexicali aparțin sau nu limbajului de programare) este de două feluri:

- a) **independent** - AL este independent de AS. Analizorul lexical primește la intrare textul cu programul sursă și furnizează la ieșire un fișier sau o zonă de memorie cu succesiunea de atomi lexicali ce vor fi dați spre prelucrare analizorului sintactic (vezi 10.2).



**Figura 10.2.** Analizorul Lexical independent de Analizorul Sintactic (1)

- b) **comandat** - AL este lansat de către AS de câte ori are nevoie de un nou atom lexical (în compilatoare sub sistemul de operare DOS) sau AS și AL sunt corutine (două procese independente care se lansează reciproc - în sisteme multitasking UNIX, Windows).



**Figura 10.3.** Analizorul Lexical comandat de Analizorul Sintactic

**Analiza sintactică** grupează atomii lexicali generați de AL în structuri sintactice precum: expresii, liste, instrucțiuni, proceduri. Toate acestea le plasează într-un *arbore sintactic*-cu ajutorul căruia sunt descrise relațiile de inclusiune ale structurilor sintactice, furnizând în final informații privitoare la corectitudinea acestora.

**Analiza semantică** - (componenta compilatoarelor cel mai puțin dezvoltată teoretic), face delimitările din punct de vedere semantic (al înțelesului programului). Extragă informațiile privind aparițiile obiectelor purtătoare de date din program (variabile, tipuri de date, funcții, etc) pentru verificarea consistenței utilizării lor. Pe măsura parcurgerii arborelui, analiza semantică construiește o reprezentare a programului sursă în **cod intermediar** (șir de instrucțiuni simple cu format fix, foloseau operanți variabile de program și nu registri), reflectând structura programului sursă și înglobând toate informațiile necesare fazelor următoare : *optimizarea* și *generarea de cod obiect*. Generarea codului intermediar fiind legată de structura semantică se poate trata în cadrul analizei semantice.

Rezolvarea sarcinilor analizei semantice necesită de obicei mai multe treceri prin arborele de derivare ceea ce lungeste corespunzător durata

compilării. Numărul acestor treceri poate fi fix ori, în cazul unor limbaje mai complexe sau a celor defectuoase proiectate, variabil în funcție de structura programului analizat.

Toate fazele unui compilator dispun de **rutine de tratare a erorilor** și lucrează în comun cu una sau mai multe tabele de simboluri în care se păstrează informații despre cuvintele cheie ale limbajului, identificatorii de variabile (tip, lungime, adresă stocare în memorie etc.), etichete de instrucțiuni, identificatori de proceduri și funcții și alte informații utile despre programul în curs de compilare. **Tabela de simboluri** este creată în faza de analiză a programului sursă și folosită în scopul validării numelor simbolice facilitând generarea de cod [Gol97]. Tabela de simboluri realizează o asociere simbolică între numele (identificatorul) unei variabile și caracteristicile acesteia (tip, domeniu de vizibilitate, deplasament față de începutul zonei de date statice sau dinamice, stivă). Compilatorul folosește tabela de simboluri pentru a urmări domeniul de utilizare și valabilitatea a unui nume și de a adăuga informații despre un nume. Tabela de simboluri este cercetată de fiecare dată când un nume este întâlnit în textul sursă. Mecanismul asociat tabelei de simboluri trebuie să permită adăugarea a noi intrări și găsirea informațiilor existente în mod eficient. Tabela de simboluri este similară celei generate de asamblare, toți identificatorii (variabilele) erau etichete (*labels*) și informațiile reprezentate de acestea erau adrese. Tabela de simboluri conține informații legate de toate variabilele din program.

**Optimizarea de cod** intermediar (*scheduling*) [Vin00, Gol97], deși opțională, este extrem de importantă din punct de vedere al creșterii performanței în domeniul paralelismului la nivelul instrucțiunilor. Optimizarea poate fi tratată din două perspective: **locală** (în cadrul unităților secvențiale de program – basic-block-uri) și respectiv **globală** (a întregului program). Notiunea de *optimizare* este oarecum forțată întrucât nu există garanția că acel cod rezultat este optim, măsurat cu vreo metrică (formulă) matematică.

Optimizarea locală a basic-block-urilor se realizează folosind algoritmi cvasioptimali într-o singură trecere, de tip "List Scheduling". Deoarece majoritatea programelor HLL sunt scrise în limbaje imperative și pentru mașini secvențiale cu un număr limitat de registre în vederea stocării temporare a variabilelor, este de așteptat ca gradul de dependențe între instrucțiunile adiacente să fie ridicat (paralelism relativ scăzut (2-3 instrucțiuni) la nivelul basic-block-urilor). Așadar pentru creșterea nivelului de paralelism este necesară suprapunerea execuției unor instrucțiuni situate în basic-block-uri diferite (*software pipelining, loop unrolling*), ceea ce conduce la ideea optimizării globale.

Optimizarea globală a programului, de natură NP - completă, și care la ora actuală constituie încă o problemă deschisă, se bazează pe algoritmi determiniști de tip "Trace Scheduling" sau pe algoritmi euristici de tip "Enhanced Percolation", "Inlining" selectiv aplicat procedurilor [Vin00].

Dependențele cauzate de variabilele aflate în memorie reprezintă de asemenea o frână în calea creșterii performanței arhitecturilor de calcul. Procesarea «*Out of Order*» a instrucțiunilor cu referire la memorie într-un program este dificilă datorită accesării aceleiași adrese de memorie de către o instrucțiune care citește respectiv una care scrie. Există motive însă, ca o instrucțiune *Load* amplasată după o instrucțiune *Store* să se execute înaintea acesteia din motive de eficiență a execuției (mascare latență, reducerea necesarului de lărgime de bandă a memoriei prin **bypassing**). Acest lucru este posibil numai dacă cele 2 adrese de memorie sunt întotdeauna diferite. Este evident că dacă la un anumit moment ele sunt identice, semantica secvenței se modifică inacceptabil. Atunci când acest lucru este posibil, problema se rezolvă static, de către compilator. Rutina de **analiză anti-alias** (*disambiguation routine*) [Win00], componentă a compilatorului, compară cele 2 adrese de memorie și returnează una dintre următoarele 3 posibilități:

- adrese întotdeauna distincte;
- adrese întotdeauna identice;
- cel puțin 2 adrese identice sau nu se poate determina.

Doar în primul caz putem fi siguri că execuția anterioară a instrucțiunii *Load* față de instrucțiunea *Store* (sau simultană în cazul procesoarelor cu execuție multiplă) îmbunătățește performanța fără a cauza alterarea semantică a programului. Din păcate, nu se poate decide întotdeauna acest lucru în momentul compilării.

**Analiza anti-alias statică** dă rezultate bune în cazul unor adresări liniare și predictibile ale memoriei (accesări de tablouri uni sau bidimensionale). Prin urmare un reorganizator de program bazat pe analiza anti-alias statică va fi deosebit de conservativ în acțiunile sale. Când compararea adreselor de memorie se face pe parcursul procesării programului prin hardware, se realizează o dezambiguizare dinamică. Aceasta este mai performantă decât cea statică dar necesită resurse hardware suplimentare și implicit costuri sporite.

Pe lângă dezambiguizarea statică mai există și alte transformări de cod în vederea optimizării [Gol97]:

- Eliminarea instrucțiunilor redundante sau a celor de neatins (*unreachable code*) din program. De exemplu, o instrucțiune neeticată care urmează imediat după un salt necondiționat poate fi eliminată.

- Optimizări ale fluxului de control. De exemplu, cazul instrucțiunilor de salt condiționate sau nu, care au ca destinație tot o instrucțiune de salt, sau salt condiționat.
- Simplificări algebrice.
- Reduceri în forță. De exemplu, înmulțirea sau împărțirea întregilor (în virgulă fixă) printr-o putere a lui 2 este mai ieftin de implementat ca o deplasare (shift) de biți. Împărțirea în virgulă flotantă printr-o constantă poate fi implementată (aproximată) ca și multiplicare a constantei, ceea ce poate fi ieftin.

**Generatorul de cod** constituie faza finală a unui compilator. Primește la intrare reprezentarea intermedieră a programului sursă împreună cu informația din tabela de simboluri - folosită la determinarea run-time a adresei obiectelor de date, desemnate de nume în reprezentarea intermedieră, și produce la ieșire un program obiect echivalent. Codul de ieșire trebuie să fie corect și de înaltă calitate, aceasta însemnând că el trebuie să folosească eficient resursele mașinii pentru a putea fi procesat cât mai rapid.

Ieșirile generatorului de cod se găsesc într-o gamă variată de forme: *limbaj de asamblare*, *limbaj mașină relocabil* sau *limbaj mașină absolut*. Producând un program într-un limbaj de asamblare, caracterizat de o mai mare lizibilitate, generarea codului se realizează mult mai ușor. Pot fi generate instrucțiuni simbolice precum și utilizate facilitățile de macro-asamblare ajutătoare la generarea de cod. Producând un program în limbaj mașină absolut, există avantajul că programul poate fi plasat într-o locație fixă a memoriei și poate fi imediat executat. Producând un program în limbaj mașină relocabil, acesta permite subprogramelor să fie compilate separat (similar cu fișierul *Makefile* din cadrul setului de instrumente SimpleScalar 3.0 [Flo05]). O mulțime de module-obiect relocate pot fi *legate (linked)* împreună și apoi încărcate pentru execuție de către un *loader*. Câștigul de flexibilitate care dă posibilitatea compilării separate a subruteinilor și apelarea altor programe compilate anterior dintre-un modul obiect este tributar costurilor suplimentare pentru legare și încărcare.

Dintre problemele inerente care apar la generatoarele de cod se amintesc: managementul de memorie (mai ales în cazul instrucțiunilor de salt condiționat), selecția instrucțiunilor mașină, alocarea registrelor și ordinea de evaluare.

Natura setului de instrucțiuni al mașinii destinație (viteza instrucțiunilor și limbajul mașinii) determină dificultatea în selectarea instrucțiunilor ce vor fi folosite pentru generarea de cod obiect. Uniformitatea și completitudinea setului de instrucțiuni constituie de asemenea, factori importanți. Dacă mașina destinație nu suportă toate

tipurile de date într-o maniera uniformă, atunci fiecare excepție are nevoie de o tratare deosebită.

Este cunoscut faptul că instrucțiunile cu operanții registru (la nivelul procesorului) sunt de obicei mai scurte și mai rapide decât cele cu operanții în memorie. Astfel, utilizarea eficientă a regisrelor este importantă în generarea de cod corect. Utilizarea regisrelor este adesea subdivizată în două subprobleme [Pat05, Gol97]:

În timpul generării de cod, într-un anumit punct al programului, sunt alocate regisrelle, adică selectată mulțimea de variabile care va fi rezidentă în registriei.

2. Din acel punct, în timpul următoarei faze de asignare a regisrelor (la variabile) se va selecta regiszrul specific ce conține variabila rezidentă în el.

Găsirea unei asignări optime a regisrelor la variabile este dificilă, hardware-ul și software-ul mașinii destinație putând solicita anumite convenții în utilizarea anumitor registriei - folosirea specializată a unora dintre acesteia. De exemplu, regiszrul \$29 reprezintă *stack pointer*-ul, \$31 - constituie adresa de revenire, sau registriei flotanți dublă precizie sunt alcătuiți din registriei par:impar flotanți simplă precizie, în cazul procesorului MIPS.

De asemenea, ordinea în care sunt efectuate calculele poate afecta eficiența codului generat, unele calcule necesitând mai puține registre pentru rezultate intermediare, față de altele. Cu toate aceste probleme, compilatoarele sunt astfel proiectate încât să respecte principiile de calitate (corectitudine) și eficiență.

În finalul acestui paragraf este exemplificat modul de alocare al spațiului de memorie (pentru variabile) de către compilator în cazul calculatorului LC-3. Zona de memorie utilizator (vezi figura 10.4) este compusă din trei mari regiuni:

- Instrucțiunile (zona de *cod*) la care regiszrul PC (*program counter*) indică spre adresa următoarei instrucțiuni de executat la fiecare moment de timp.
- Zona de *date globală* – unde sunt stocate toate variabilele declarate global în codul sursă. R5 (similar cu regiszrul \$gp de la procesorul MIPS) va indica spre începutul acestei zone, cunoscută și sub numele de zonă de date statice. Această zonă se caracterizează prin faptul că, în momentul compilării, se cunoaște numele, adresa și spațiul ocupat de fiecare variabilă declarată aici (static).
- Stiva de date (aferentă fiecărei funcții din programul sursă HLL). Aici sunt stocate variabilele locale, parametrii funcțiilor. R6 (similar cu

registru \$sp de la MIPS) indică spre vârful stivei. Este o zonă de date dinamică, alocată la fiecare apel de funcție și care este dealocată în momentul ieșirii din respectiva funcție. În subcapitolul 10.2 se prezintă cum este implementat în hardware mecanismul de gestiune a stivelor de date asociate funcțiilor din programele C.

Un singur lucru ar mai fi de menționat aici și anume că variabilele globale sunt salvate în zona de date statice începând cu deplasamentul (*offset*) 0, iar în stiva de date aferentă fiecărei funcții variabilele și ceilalți parametrii (dacă există) sunt salvați începând cu offset-ul 3. Preluarea conținutului variabilelor stocate poate fi făcută cu instrucțiunile de citire din memorie de tip LDR, ca în exemplul de mai jos.

- Pentru prima variabilă globală din program: LDR R1, R5, #0
- Pentru primul parametru al unei funcții: LDR R2, R6, #3



**Figura 10.4.** Organizarea memoriei la calculatorul LC-3

### 10.1.2. ETAPELE PARCURSE PENTRU RECOMPILEAREA INSTRUMENTELOR SIMPLESCALAR 3.0 [Flo05]

Creșterea în performanță și complexitate a microprocesoarelor moderne datorate tehnicielor avansate gen *pipelining*, execuție *out-of-order*, predicție și execuție speculativă, presupune un efort suplimentar de

proiectare și verificare pentru dezvoltarea și implementarea de produse viabile. Pentru depășirea acestor probleme, proiectanții de microarhitecturi au explorat diverse modalități de *transfer de funcționalitate* la nivelul compilatorului. Începând cu procesoarele RISC<sup>15</sup> VLIW<sup>16</sup> și continuând cu cele EPIC<sup>17</sup> – versiunile 1 și 2 de procesoare Intel Itanium, compilatorul a jucat un rol important în simplificarea arhitecturii la nivel hardware menținând totodată tendințele curente de creștere a performanței. În acest paragraf sunt prezentate fazele principale care trebuie parcursă pentru compilarea și execuția programelor de test scrise în C (sau C++) sub sistemul de operare Linux folosind utilitarele GNU. Etapele parcuse pornind de la sursa HLL a programelor de test și până la simularea de tip *execution driven* sunt evidențiate în figura următoare.



**Figura 10.5.** Interacțiunea instrumentelor în cadrul setului SimpleScalar

<sup>15</sup> RISC – calculatoare cu set redus (optimizat) de instrucțiuni

<sup>16</sup> VLIW – procesoare cu execuție multiplă (Very Long Instruction Word). Din punct de vedere hardware un procesor VLIW este foarte simplu și constă dintr-o colecție de unități funcționale de execuție (sumatoare, circuite multiplicative, unități de execuția branch-urilor, etc) conectate printr-o magistrală, plus regiștri și memorii cache. În cazul procesoarelor VLIW compilatorul are un rol decisiv în gruparea mai multor instrucțiuni independente într-o singură instrucțiune multiplă astfel încât să poată fi folosite eficient toate unitățile de execuție pe perioada fiecărui impuls de tact.

<sup>17</sup> EPIC – calculatoare care exploatează paralelismul în mod explicit. Procesorul nu trebuie să asigure paralelismul instrucțiunilor. Compilatorul este responsabil pentru determinarea instrucțiunilor care pot fi executate în paralel și codifică aceste informații direct în codul obiect obținut după compilare).

Sursele FORTRAN ale programelor de test proprii (*benchmark-uri*) sunt convertite în C folosind translatorul *f2c*. Atât benchmark-urile C cât și cele convertite din FORTRAN sunt compilate cu ajutorul compilatorului GNU *gcc* (dedicat arhitecturii SimpleScalar) rezultând cod în format de asamblare pentru respectiva arhitectură. Arhitectura SimpleScalar este derivată din arhitectura procesorului MIPS-IV ISA. Organizarea memoriei în sistemele bazate pe arhitectura SimpleScalar este convențională. Spațiul de adrese utilizator (pe 31 de biți) este compus din trei părți: cod, date și stivă program. Instrucțiunile sunt pe 64 de biți iar setul de regiștri generali pentru numere întregi conține 32 de regiștri pe 32 de biți fiecare.

Codul (în format asamblare) rezultat este trecut prin asamblorul SimpleScalar *as* care generează un format foarte asemănător cu codul obiect dar nu identic (cuprinde simboluri + cod obiect; nu este generat codul obiect pentru funcțiile de bibliotecă și directivele de asamblare). Formatul final de cod obiect se obține cu ajutorul utilitarului SimpleScalar *ld* care link-edită codul rezultat la pasul anterior (*pseudo-obiect*) cu bibliotecile proprii arhitecturii SimpleScalar (SS *libc.a*, SS *libm.a*, SS *libF77.a*). Codul obiect se constituie ca parametru de intrare pentru simulatoarele arhitecturii SimpleScalar. Setul standardizat de instrumente destinat cercetătorilor în microarhitecturi – SimpleScalar (o colecție de compilatoare, asamblăre, link-editoare, simulatoare), disponibil gratuit [Flo05], pune la dispoziție și câteva din benchmark-urile SPEC '95 în același format cod obiect (precompilate pentru arhitectura SimpleScalar).

## Compilarea și Link-editarea programelor

La ora actuală există pe piață o varietate de compilatoare disponibile, atât pentru platformă Windows cât și pentru platformă Linux. Cele mai utilizate sunt: *bcc* (*Borland C Compiler* – sub Windows), *gcc* (*GNU C Compiler* – sub Linux), *xgcc* (*gcc* recompilat pentru a genera cod mașină specific arhitecturii SimpleScalar). Pe lângă compilator, furnizorul acestuia oferă și unele suplimentare necesare: preprocesoare, asamblăre și link-editoare. Compilatoarele oferă o mulțime de opțiuni de compilare, preprocesare, link-editare cu biblioteci (matematice, grafice, etc) și inclusiv facilități de depanare (*gdb* – *GNU debugger*). Pentru compilarea programelor se recomandă specificarea opțiunilor **-Wall** pentru afișarea tuturor avertismentelor generate de compilator. Prin opțiunea **-c** este evitată link-editarea iar **-g** invocă opțiunea de depanare, impunând compilatorului generarea unei tabele de simboluri.

Ex: **gcc -c -g -O nume\_fis1.c nume\_fis2.c =>** Sunt generate doar codurile pseudo-obiect ale tuturor

fișierelor sursă respective fără a efectua legăturile cu bibliotecile funcțiilor apelate.

Link-editarea se poate realiza ulterior cu comanda:

`gcc nume_fis1.o nume_fis2.o ..... -o nume_fis_executabil` => determină codul mașină (.exe pentru Intel, .ss pentru SimpleScalar) care poate fi executat pe arhitectura gazdă (pentru care s-a generat).

Se reamintește că opțiunea de compilare `-S` realizează preprocesarea și compilarea codului sursă, iar opțiunea `-s` generează doar codul asamblare fără faza de preprocesare. De asemenea, în cazul în care fișierele sursă c și `cpp` nu există în directorul unde se găsește compilatorul `gcc`, `xgcc`, etc atunci se va tasta odată cu numele și calea spre acest fișier.

`./xgcc nume_fisier.c -S` => fișier asamblare MIPS (s-a folosit xgcc)  
`./xgcc nume_fisier_sursa.c -o nume_fisier_destinatie.ss` => fișier executabil MIPS

## 10.2. IMPLEMENTAREA GESTIUNII STIVELOR DE DATE ASOCIAȚE FUNCTIILOR C

### 10.2.1. SUBPROGRAME. GENERALITĂȚI. FUNCȚII C

Prin definiție un *subprogram* (ex. *funcție C*, funcție sau procedură în Pascal) reprezintă un ansamblu de date, variabile și instrucțiuni scrise în vederea unor prelucrări (calcule, citiri, scrieri) și care poate fi utilizat (rulat) doar dacă este apelat de un program sau de alt subprogram. Cu alte cuvinte, reprezintă un program mai mic, mai simplu decât cel principal, creat cu scopul apelării lui cel puțin o dată. Prin realizarea de subprograme se stabilesc premisele programării structurate conform ecuației programării structurate enunțată de Niklaus Wirth: „**Structuri de date + Algoritmi = Program**”. Caracterul generic (se operează asupra unei varietăți de date de

intrare) și concis (subprograme, structurile repetitive și cele de tip recursiv) de scriere a programelor conduce la unele avantaje:

- *Reutilizarea codului*: - o dată scris un subprogram poate fi utilizat de mai multe programe și chiar de același program de mai multe ori.
- Noțiunea de subprogram stă la baza mecanismului de recursivitate și a tehnicii de *divide et impera*.
- Facilitează elaborarea algoritmilor prin descompunerea problemei de rezolvat în altele mai simple, fluxul de execuție al programului putând fi urmat cu o mai mare ușurință.
- Permite dezvoltarea modulară a codului (separat și independent) de către programatori independenți.
- Reducerea numărului de erori care pot apărea la scrierea programelor.

## **FUNCTII C** [Zah04, Neg97, Sto98]

*Funcția* este un concept important în matematică și în programare. În limbajul C prelucrările sunt organizate ca o ierarhie de apeluri de funcții. Orice program trebuie să conțină cel puțin o funcție, funcția *main*. Funcțiile încapsulează prelucrări bine precizate și pot fi reutilizate în mai multe programe.

În esență, o funcție este alcătuită din:

- **Antet** – conține numele funcției, lista parametrilor formali, tipul rezultatului.

### **Tip\_returnat nume\_funcție (lista\_parametrilor\_formali)**

Identic ca și în matematică o funcție nu poate întoarce mai mult de un rezultat. Există situații (efectuarea unor acțiuni, etc.) când o funcție nu întoarce nimic (în aceste cazuri tip\_returnat este *void*). Funcțiile care nu returnează nimic se numesc în alte limbaje de programare *proceduri*. Tipul returnat de funcție poate fi orice tip de date cu excepția masivelor. Dacă se dorește ca o funcție să returneze un masiv atunci acesta trebuie înglobat în structuri de date declarate ca *struct*. Rezultatul funcției este returnat la întâlnirea instrucțiunii *return* din corpul funcției (*return* expresie). Trebuie ca tipul expresiei să coincidă cu tipul funcției. La întâlnirea instrucțiunii *return*, după atribuirea valorii, execuția funcției se încheie și se revine la funcția care a apelat-o. În absența instrucțiunii *return*, execuția funcției se încheie după execuția ultimei instrucțiuni. În acest caz funcția nu întoarce nici o valoare.

Cu toate că uneori poate fi vidă, de cele mai multe ori lista parametrilor formali (*Parameters* – în engleză) are următoarea formă:

Tip\_1 Parametru<sub>1</sub>, Tip\_2 Parametru<sub>2</sub>, ..., Tip\_n Parametru<sub>n</sub>

- **O instrucțiune compusă** – aceasta cuprinde declarațiile variabilelor locale și instrucțiunile propriu-zise.

## Transmiterea parametrilor

Parametrii care se găsesc în antetul funcției se numesc formali (declarați în funcția apelată), iar cei care se găsesc în instrucțiunea de apel se numesc efectivi (*Arguments* – în engleză) și sunt declarați în (sub)programul apelant. Între parametrii formali și cei efectivi trebuie să existe o anumită concordanță, descrisă prin regulile următoare:

- Numărul parametrilor formali (și ordinea acestora) trebuie să coincidă cu numărul (și ordinea) parametrilor efectivi. Există și excepții însă: funcții cu număr variabil de parametrii. În cazul acestora este obligatoriu ca cel puțin primul parametru să apară în lista parametrilor formali. Pentru parametrii variabili antetul funcției va conține „...” după primul parametru formal.
- Tipul parametrilor formali trebuie să coincidă cu tipul parametrilor efectivi sau tipul parametrilor efectivi să poată fi convertit implicit către tipul parametrilor formali, la fel ca în cazul atribuirii.

Există două mecanisme de transmitere a parametrilor: prin **valoare** și prin **referință**. Transmiterea parametrilor prin valoare se utilizează atunci când nu ne interesează ca, la întoarcerea din subprogram (funcție), parametrul efectiv să rețină valoarea modificată acolo (în subprogram). În cazul transmiterii prin valoare parametrii efectivi trebuie să fie valori reținute de variabile sau expresii. Transmiterea parametrilor prin referință se utilizează atunci când se dorește ca, la întoarcerea din subprogram, variabila transmisă să rețină valoarea stabilită în timpul execuției subprogramului. În cazul transmiterii prin referință parametrii efectivi trebuie să fie referințe la variabile. Dacă în cazul transmiterii parametrilor prin valoare în stivă este reținută valoarea parametrilor efectivi, în cazul transmiterii prin referință, în stivă este salvată adresa variabilelor.

## Funcția main()

Un program C este compus dintr-o ierarhie de funcții, orice program trebuind să conțină cel puțin funcția *main()*, prima care se execută la lansarea programului C. Codul funcției se găsește între accolade.

```
void main(void){
    /* programul principal aferent fiecărui program C */
}
```

### Definirea și declararea unei funcții

Pentru a putea fi utilizată într-un program, o funcție trebuie să fie definită (sau declarată) și apelată. **A defini** un subprogram, înseamnă a scrie efectiv corpul funcției. Trebuie avut grijă de alegerea locului unde se definește subprogramul (dacă el nu a fost anterior declarat atunci definiția trebuie să aibă loc înainte de apelul acestuia). **A declara** un subprogram înseamnă să-l anunță. Un subprogram nedeclarat nu poate fi folosit. Definiția unui subprogram tine loc și de declarație.

**Definiția unei funcții** are următoarea formă:

```
tip_rezultat_returnat nume_funcție (lista_parametri_formali){//antetul
    funcției
    definirea variabilelor locale
    prelucrări // instrucțiuni
    întoarcere rezultat
} // intre { } este implementat corpul funcției
```

Funcțiile nu pot fi definite imbricat (ca în Pascal). Definiția unei funcții trebuie să corespundă declarației funcției. Fiecare argument al funcției (matematice) capătă un nume, devine un parametru formal, chiar dacă în declarația funcției făcută înaintea (și distinct de) definiției funcției numărul acestora a fost declarat variabil (prin construcția sintactică „...”).

Dacă funcția nu returnează nici un rezultat (se mai numește funcție *void*) și nu primește parametri, definitia va fi:

```
void nume_funcție (void){//antetul funcției
    definirea variabilelor locale
    prelucrări // instrucțiuni
} // intre { } este implementat corpul funcției
```

O funcție void fără parametri poate prelucra variabilele globale și cele locale. Dacă mai multe funcții void fără parametrii trebuie să aibă acces la aceleași date, acestea trebuie să fie variabile globale.

Exemplul următor conține definiția funcției Factorial care calculează iterativ factorialul unui număr.

```
long Factorial(int n)
{
    int i;
    long result = 1;
    for (i = 1; i <= n; i++)
        result *= i;
    return result;
}
```

**Declarația unei funcții** se face prin precizarea **prototipului funcției** (antetul acesteia): *tip rezultat returnat nume\_funcție (lista\_parametri\_formali);*

Prototipul (*declarația funcției*) implicit este:

```
int nume_funcție(void);
```

Prototipul unei funcții trebuie să apară în afara tuturor funcțiilor și înaintea oricărui apel al său. Prin intermediul prototipului compilatorul știe cum trebuie apelată funcția. Compilatorul află detalii referitoare la tipul returnat de funcție, numărul și tipul parametriilor de intrare (efectivi), numele funcției folosite ca și parametru (în cazul apelurilor indirecte de funcții prin pointer). Informațiile sunt extrem de utile mai ales atunci când compilatorul trebuie să genereze cod pentru o funcție care a fost apelată înaintea definirii sale în codul sursă. De asemenea, se poate întâmpla ca, în cazul proiectelor de aplicații care conțin mai multe fișiere sursă și biblioteci (fișiere *header* și sursă *C*), o funcție să fie apelată într-un fișier sursă (scris de un programator) și să fie definită într-altul (scrisă de alt programator). În aceste situații, fișierul în care este făcut apelul funcției trebuie să „*includă*” fișierul header cu declarația funcției și este compilat separat de fișierul care conține definiția funcției, în final după faza de link-editare rezultând fișierul executabil ca un „tot unitar”.

### Apelul unei funcții:

*nume\_funcție(lista\_parametri\_efectivi) /\*poate apărea ca operand într-o expresie, dacă funcția returnează un rezultat\*/*

La apelul unei funcții (subprogram), se realizează transferul controlului din (sub)programul apelant către subprogramul apelat și se execută corpul acestuia, după care se revine în funcția apelantă, la instrucțiunea următoare apelului. O funcție poate fi apelată, dacă în fața apelului există definiția sau cel puțin declarația funcției. Pentru a realiza acest lucru, compilatorul

păstrează pe stiva de date aferentă funcției apelate adresa de revenire în (sub)programul apelant (vezi subcapitolul 10.2.2). În cazul funcțiilor *void* fără parametri, apelul se face prin:

*nume\_funcție();* //instrucțiune care efectuează o acțiune



**Figura 10.6.** Exemplu de declarație și apel a funcției *Factorial*

În continuare este prezentat un exemplu de program C care efectuează operații aritmetico-logice asupra unor variabile locale și globale și afișează pe ecran rezultatul. Acest program C este translatat în cod asamblare LC-3, arătându-se și tabela de simboluri generată de compilator [Patt03].

### Codul sursă C

```
#include <stdio.h>
int inGlobal;

main()
{
    int inLocal; /* variabile locale funcției main */
    int outLocalA;
    int outLocalB;

    /* inițializare */
    inLocal = 5;
    inGlobal = 3;
```

```

/* efectuarea operațiilor */
outLocalA = inLocal++ & ~inGlobal;
outLocalB = (inLocal + inGlobal) - (inLocal - inGlobal);

/* afișare rezultate */
printf("The results are: outLocalA = %d outLocalB = %d \n",
outLocalA, outLocalB);
}

```

**Tabelă de simboluri**

| Name      | Type | Offset | Scope  |
|-----------|------|--------|--------|
| inGlobal  | int  | 0      | global |
| inLocal   | int  | 3      | main   |
| outLocalA | int  | 4      | main   |
| outLocalB | int  | 5      | main   |

Variabilele globale startează la offset 0

Variabilele locale startează la offset 3

#### Generarea codului asamblare (C → LC-3)

; funcția **main** și inițializarea variabilelor

AND R0, R0, #0

ADD R0, R0, #5 ; inLocal = 5

STR R0, R6, #3 ; (offset = 3)

AND R0, R0, #0

ADD R0, R0, #3 ; inGlobal = 3

STR R0, R5, #0 ; (offset = 0)

; calculul primei expresii

; outLocalA = inLocal++ & ~inGlobal;

LDR R0, R6, #3 ; get inLocal

ADD R1, R0, #1 ; increment

STR R1, R6, #3 ; store

LDR R1, R5, #0 ; get inGlobal

NOT R1, R1 ; ~inGlobal

AND R2, R0, R1 ; inLocal & ~inGlobal

STR R2, R6, #4 ; store in outLocalA ; (offset = 4)

```

; calculul celei de-a doua expresii
; outLocalB = (inLocal + inGlobal)
    LDR R0, R6, #3          ; - (inLocal - inGlobal);
    LDR R1, R5, #0          ; inLocal
    ADD R0, R0, R1          ; inGlobal
    LDR R2, R6, #3          ; R0 este suma
    LDR R3, R5, #0          ; inLocal
    NOT R3, R3              ; inGlobal
    ADD R3, R3, #1          ; R2 este diferența (calculată
    ADD R2, R2, R3          ; ca o adunare în complement
                           ; față de 2)
    NOT R2, R2              ; negație
    ADD R2, R2, #1          ; R0 = R0 - R2
    ADD R0, R0, R2          ; outLocalB (offset = 5)
    STR R0, R6, #5

```

### 10.2.2. STIVA DE DATE AFERENTĂ FUNCȚIILOR [Patt03, Vin03]

După cum se știe, stiva de date asociată unei funcții scrise în limbajul C reprezintă o zonă de memorie unde sunt stocate toate variabilele locale și parametrii aferenți respectivei funcții ("activation record"). Fiecare funcție C are propriul context păstrat în această structură de date specială. Stiva de date se asociază în mod dinamic fiecărei funcții în curs. Așadar, o funcție poate avea la un moment dat mai multe stive (instanțe), doar una fiind însă activă. Spre exemplu, recursivitatea se poate implementa facil în C tocmai datorită acestei caracteristici.

Structura stivei de date asociate unei funcții C este prezentată în figura următoare, corespunzător secvenței de program de mai jos.

```

int NoName (int a, int b){
    int w,x,z;
    /* Corpul funcției */

    .
    .
    return y;
}

```

Using just for study purposes



Figura. 10.7. Structura stivei de date asociate funcției NoName

**RETURN VALUE:** aici se plasează valoarea variabilei y, chiar înainte de revenirea din funcție. Acest câmp există și dacă funcția nu ar returna practic nici o valoare.

**RETURN ADDRESS (PC):** reprezintă PC-ul de revenire în funcția apelantă.

**DYNAMIC LINK:** memorează adresa de început a stivei de date aferente funcției apelante. În continuare, se va considera că registrul R6 va conține adresa de început a stivei de date asociată funcției respective.

Așadar funcția *NoName* procesează asupra parametrilor trimiși de către funcția apelantă (a,b) respectiv asupra variabilelor locale ale acesteia (w,x,y). Firește, ea trimit rezultatele (y) către funcția apelantă prin stiva de date curentă. În continuare se consideră că atunci când funcția *NoName* este apelată, pointerul la stivele de date (R6, aici) va pointa la începutul stivei de date aferente funcției.

Pentru a înțelege implementarea apelurilor/revenirilor funcțiilor, se consideră următorul exemplu de program:

```
main()
{
    int a;
    int b;
```

```

b=NoName(a,10);

}

int NoName(int a, int b)
{
    int w,x,y;
    /* Corpul funcției */

    return y;
}

```

Stiva de date începe la o locație de memorie determinată de către proiectanții sistemului de operare și crește înspre adrese crescătoare. Execuția programului începe cu un apel al sistemului de operare către funcția "main". În acest punct, stiva datelor funcției "main" se structurează în memorie, iar registrul R6 pointează la începutul ei. În translatarea apelului unei funcții, compilatorul generează automat cod mașină pentru a înscrie o stivă de date în memorie. În translatarea revenirii dintr-o funcție apelată în funcția apelantă, compilatorul generează automat cod pentru preluarea stivei de date din memorie.

Apelul și revenirea se fac în 4 pași, aşa cum se prezintă în continuare :

### **1) Apelul funcției NoName**

Se face prin asignarea `b=NoName(a,10);` Stiva de date a funcției `main()` respectiv a funcției `NoName(a,10)` sunt prezentate în figura următoare.



**Figura 10.8.** Stivele de date asociate funcțiilor main() și NoName(a,10)

Secvența compilată a apelului funcției NoName este următoarea:

|                      |                                                                    |
|----------------------|--------------------------------------------------------------------|
| ld R8, (R6)3;        | R8 $\leftarrow$ a                                                  |
| st R8, (R6)8;        | a $\rightarrow$ Stiva NoName                                       |
| and R8, (R8), #0     | ;R8 $\leftarrow$ 0                                                 |
| add R8, R8, #10;     | R8 $\leftarrow$ 10                                                 |
| st R8, (R6)9;        | (b=10) $\rightarrow$ Stiva NoName                                  |
| st R6, (R6)7;        | (R6)main $\rightarrow$ Stiva NoName (Dynamic Link)                 |
| add R6, R6, #5;      | R6 $\leftarrow$ (R6) +5, actualizare nou început al stivei de date |
| jsr NoName;          | apel funcție, R7 $\leftarrow$ PCnext și PC $\leftarrow$ (NoName)   |
| PCnext: ld R8, (R6)5 |                                                                    |
| st R8, (R6)4         |                                                                    |

## 2) Startarea functiei apelate (NoName)

Începe cu instrucțiunea care salvează în stiva de date a funcției NoName adresa de revenire în funcția principală main(). Adresa de revenire

se află stocată în registrul R7 (conține adresa următoare a instrucțiunii JSR NoName)

st R7, (R6)1

### **3) Sfârșitul functiei apelate (NoName)**

ld R8, (R6)7

st R8, (R6)0;

Se memorează valoarea lui y în RET VALUE din stiva de date

ld R7, (R6)1;

ld R6, (R6)2;

R7  $\leftarrow$  RET ADDRESS

R6  $\leftarrow$  adresa de început a stivei de date aferente funcției main().

RET;

PC  $\leftarrow$  adresa de revenire în funcția main().

### **4) Revenirea în funcția apelantă (main)**

JSR NoName; pe această instrucțiune se face revenirea (la finele execuției acesteia)

PCnext: ld R8, (R6)5; R8  $\leftarrow$  valoarea lui y din funcția NoName  
st R8, (R6)4; se face asignarea : b=NoName(a,10).

**Obs.**: Stivele de date asociate funcțiilor C sunt structuri de tip tablou, având o adresă de bază stocată în registrul R6 și un număr (variabil) de elemente. Având în vedere frecvența deosebită a accesării acestor structuri de date, modul de adresare indexat ( $R_{bază} + offset$ ) este esențial în facilitarea manipulării datelor prin aceste structuri de tip tablou [Vin06].

## **10.3. EXERCIȚII ȘI PROBLEME**

1. Completați cu instrucțiunile C corespunzătoare în tabelele din partea dreaptă astfel încât din punct de vedere logic să se realizeze același lucru ca și în stânga (cel descris de secvența asamblare LC-3).

a)

|                                                                      |                                                     |
|----------------------------------------------------------------------|-----------------------------------------------------|
| LDR R0, R6, #3<br>LDR R1, R6, #4<br>STR R0, R6, #4<br>STR R1, R6, #3 | main()<br>{<br>int v1;<br>int v2;<br>int temp;<br>} |
|----------------------------------------------------------------------|-----------------------------------------------------|

b)

|                                                                                                                |                                                   |
|----------------------------------------------------------------------------------------------------------------|---------------------------------------------------|
| LDR R0, R6, #3<br>NOT R0, R0<br>LDR R1, R6, #4<br>NOT R1, R1<br>AND R2, R0, R1<br>NOT R2, R2<br>STR R2, R6, #5 | main()<br>{<br>int v3;<br>int v4;<br>int v5;<br>} |
|----------------------------------------------------------------------------------------------------------------|---------------------------------------------------|

c)

|                                                     |                                           |
|-----------------------------------------------------|-------------------------------------------|
| AND R0, R0, #0<br>ADD R0, R0, #15<br>STR R0, R6, #4 | main()<br>{<br>int i;<br>int j;<br>int k; |
| FL1      AND R0, R0, #0<br>STR R0, R6, #3           |                                           |
| FL1_2     LDR R0, R6, #3                            |                                           |

|                                                                                                                                                                                                                                                  |   |
|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---|
| LDR R1, R6, #4<br>NOT R1, R1<br>ADD R1, R1, #1<br>ADD R0, R0, R1<br>BRzp DONE<br><br>F        LDR R0, R6, #5<br>ADD R0, R0, #1<br>STR R0, R6, #5<br><br>LDR R0, R6, #3<br>ADD R0, R0, #2<br>STR R0, R6, #3<br>BRnzp FL1_2<br><br>DONE ...<br>... | } |
|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---|

2. Referitor la sintaxa limbajului C răspundeți la următoarele întrebări legate de funcții:

- a) Ce reprezintă declarația unei funcții? Care este scopul declarării?
- b) Ce este prototipul unei funcții?
- c) Ce reprezintă definiția unei funcții?
- d) Ce sunt parametrii efectivi ai unei funcții? Dar parametrii formali ai funcției?

3. Ce valori sunt afișate pe ecran în urma execuției programului de mai jos? Ce modificări trebuie aduse codului sursă pentru a afișa pe ecran valorile: 2 3?

```
#include <stdio.h>
void MyFunc(int z);
main()
{
    int z=2;
    MyFunc(z);
    MyFunc(z);
}

void MyFunc(int z)
{
```

```
printf("%d ", z);  
z++;  
}
```

4. Cele două secțiuni de cod de mai jos (una în C, cealaltă în asamblare LC-2) trebuie să realizeze același lucru. Completați cele trei spații goale cu câte o instrucțiune fiecare.

|               |                                        |
|---------------|----------------------------------------|
| int x;        |                                        |
| int *y;       |                                        |
| int z;        |                                        |
| x = 0;        | LD R0, X<br>AND R0, R0, #0<br>ST R0, X |
| .             | .                                      |
| x++;          | LD R0, X<br>ADD R0, R0, #1             |
| _____         | LEA R0, X<br>ST R0, Y                  |
| z = (*y) + 1; | _____<br>ADD R0, R0, #1<br>ST R0, Z    |

5. Se consideră următorul program care citește de la tastatură două caractere și afișează maximul dintre ele prin intermediul funcției Max.

```
#include <stdio.h>  
char Max ( char, char ); /* prototype */  
int main ( ) /* main returns an int */  
{  
    char ch1, ch2, answer;  
  
    printf ("Welcome to Max of 2 Chars!\n");  
    printf ("Enter 2 characters:\n");  
    scanf ("%c%c", &ch1, &ch2);  
    answer = Max(ch1, ch2);  
    printf ("Max is : %c", answer);  
    return 0;  
} /* end of main function */
```

```
char Max (char ch1, char ch2)
{
    char higher;
    if ( ch1 > ch2 )
        higher = ch1;
    else
        higher = ch2;
    return higher;
}
```

- a) Realizați tabela de simboluri generată de compilator pentru programul dat.
- b) Presupunând că de la tastatură se introduc caracterele ‘A’ și ‘Q’ și că valoarea inițială a registrului R6 (*stack pointer*) este 0x4000, descrieți stiva de date aferentă funcțiilor *main()* și *Max()* în câteva momente importante: (inițial când doar funcția *main* este activă, după citirea celor două caractere de la tastatură când și funcția *Max* devine activă – la apel, când funcția *Max* este activă înainte de revenire când există rezultatul disponibil, după predarea rezultatului de către *Max* când doar funcția *main* a mai rămas activă, înainte de terminarea programului).
- c) Realizați translatarea în cod asamblare LC-3 a funcției *Max* din C.

## **11. INTRODUCERE ÎN RECURSIVITATE. COMPARAȚIA DINTRE RECURSIV ȘI ITERATIV ÎN ALEGEREA ALGORITMULUI DE REZOLVARE A PROBLEMELOR. AVANTAJE / DEZAVANTAJE**

### **11.1. SCOP ȘI COMPETENȚE NECESARE**

Capitolul de față își propune o introducere în mecanismul recursivității, bazându-se pe noțiunile anterioare de funcție (subprogram, subrutină, etc) și stivă de date aferentă funcției. Competențele generale care trebuie dovedite de către cei care citesc acest curs se referă la capacitatea de a descompune o problemă în subprobleme, de prelucrare a datelor utilizând subprograme și respectiv de a aplica anumiți algoritmi în prelucrarea structurilor de date. Scopul lucrării este de cunoaștere și înțelegere a mecanismului recursivității (după unii autori recursivitatea pare „magică”, dincolo de înțelegere). Se va analiza comparativ modul de rezolvare recursiv și iterativ al unor probleme. Se va lămuri folosind diferite exemple necesitatea aplicării condiției de consistență și în ce situații este utilă rezolvarea recursivă a unor probleme.

### **11.2. RECURSIVITATEA**

Reprezintă o **noțiune fundamentală a informaticii** și face parte din domeniul general al algoritmilor și structurilor de date. Constituie o tehnică de programare care permite o **exprimare extrem de concisă și clară** a algoritmilor de rezolvare a unor probleme complexe. Recursivitatea din programare este derivată în mod natural (din necesități practice) din noțiunea matematică [Cor90, Sto98]. Astfel, **în matematică o noțiune este**

**definită recurrent (recursiv) dacă în cadrul definiției apare însăși noțiunea care se definește.** La scrierea unui algoritm recursiv este suficient să gândim ce se întâmplă la un anumit nivel, pentru că la orice nivel se întâmplă exact același lucru. Recursivitatea în programare – a apărut după anii '80 odată cu limbajele de nivel înalt moderne Algol, Pascal, C. Fortran și Cobol **nu** permiteau scrierea programelor recursive. Un motiv poate fi de natură istorică. **Capacitatea redusă a memoriei sistemelor din anii 70 – 80** a condus la constrângeri privind execuția programelor procedurale într-un spațiu mic de adrese (de memorie) și alocări reduse pe stivă sau în “heap”. Recursivitatea reprezintă un mecanism general de elaborare a programelor constând în **posibilitatea ca un subprogram să se autoapeleze**. Există două tipuri de recursivitate:

- **directă**: dacă apelul subprogramului apare chiar în corpul său. Ex: *factorial*, *fibonacci*, *fractali* precum și alte probleme din medicină – informația genetică conținută în nucleul unei celule se repetă la diferite scări.
- **indirectă**: dacă apelul subprogramului recursiv apare în instrucțiunea (compusă) a unui alt subprogram care se apelează direct sau indirect din subprogramul recursiv. Ex: *evaluarea unei expresii*, *forma poloneză prefixată a unei expresii*.

### 11.2.1. STIVA DE DATE ASOCIAȚĂ UNEI FUNCȚII [Patt03]

- Stă la baza recursivității.
- Zonă a memorie de date care funcționează după principiul LIFO.
- Este gestionată implicit de către compilator.
  - Stiva de date începe la o locație de memorie determinată de către proiectanții sistemului de operare și crește înspre adrese descrescătoare. În limbajul C, execuția programului începe cu un apel al sistemului de operare către funcția “main”. În acest punct, stiva datelor funcției “main” se structurează în memorie, fără un registru pointează la începutul ei.
  - În translatarea **apelului unei funcții**, compilatorul generează automat cod mașină pentru a înscrie o stivă de date în memorie. În translatarea revenirii **dintr-o funcție apelată în funcția apelantă**, compilatorul generează automat cod pentru **preluarea stivei de date din memorie**.

- Pentru fiecare (auto)apel se creează un alt nivel pe stiva de date, în care se depun noile valori – parametrii noului apel.
- La fiecare apel de funcție (procedură) sunt salvate automat în stivă (nu neapărat în această ordine, în funcție de ISA-ul fiecărui procesor):
  - Valorile parametrilor de tip valoare;
  - Adresele parametrilor de tip referință;
  - Variabilele locale ale subprogramului;
  - Adresa de revenire în (sub)programul apelant;

*Exemplu:*

Structura stivei de date asociate unei funcții C este prezentată în figura următoare, corespunzător secvenței de program de mai jos.

```
int NoName (int a, int b){  
    int w,x,y;  
    /* Corpul funcției */  
    .  
    return w;  
}
```



**Figura 11.1.** Structura stivei de date asociate funcției *NoName* în cadrul arhitecturii DE-3

**RETURN VALUE:** aici se plasează valoarea variabilei *w*, chiar înainte de revenirea din funcție. Acest câmp există și dacă funcția nu ar returna practic nici o valoare.

**RETURN ADDRESS (PC):** reprezintă PC-ul de revenire în funcția apelantă.

**DYNAMIC LINK:** memorează adresa de început a stivei de date aferente funcției apelante.

- Orice subprogram recursiv trebuie să satisfacă o **condiție de consistență** (procesul de autoapelare trebuie să se opreasă după un număr finit de pași. Altfel va apărea eroarea „**Stack Overflow!**”).

■ Exemplu de funcție **inconsistentă**:

$$\text{incons}(n) = \begin{cases} 1, & \text{dacă } n = 0 \\ n \cdot \text{incons}(n+1), & \text{dacă } n > 0 \end{cases}$$

întrucât nu pot fi calculate valorile funcției pentru  $n > 0$ .

Pentru a înțelege implementarea apelurilor / revenirilor funcțiilor, se consideră cel mai simplu și reprezentativ exemplu de subprogram recursiv factorialul unui număr natural  $n$ .

$$\text{fact}(n) = n! = n \cdot (n-1)!$$

Implementare **iterativă**

```
long factorial(int n){
    int i;
    long f=1;

    for(i=1;i<=n;i++)
        f=f*i;
    return f;
}
```

Implementare **recursivă**

```
long fact(int n){
    if(n<=1)
        return 1;
    else
        return n*fact(n-1);
}
```

|                                     |         |
|-------------------------------------|---------|
| Return Value                        | Main    |
| Return Address                      |         |
| Dynamic Link                        |         |
| Return Value ( <i>fact(n)</i> )     |         |
| Return Address                      |         |
| Dynamic Link                        |         |
| <b>n (4)</b>                        |         |
| Return Value ( <i>fact(n-1)</i> )   | fact(4) |
| Return Address                      |         |
| Dynamic Link                        |         |
| <b>n-1 (3)</b>                      |         |
| Return Value ( <i>fact(n-2)</i> )   | fact(3) |
| Return Address                      |         |
| Dynamic Link                        |         |
| <b>n-2 (2)</b>                      |         |
| Return Value ( <i>fact(1) = 1</i> ) | fact(2) |
| Return Address                      |         |
| Dynamic Link                        |         |
| <b>n-3 (1)</b>                      | fact(1) |

Creșterea stivei

**Figura 11.2.** Imaginea stivei pentru calculul valorii  $\text{fact}(4)$  în implementarea recursivă

În continuare sunt ilustrate două exemple în care se impune rezolvarea recursivă a problemei (algoritmul de *căutare binară* și respectiv problema *turnurilor din Hanoi*). Avantajul, în cazul primului exemplu îl reprezintă și timpul logaritmic de execuție față de cel polinomial (liniar) dacă rezolvarea problemei ar fi fost iterativă (căutare directă – parcursere tablou și comparare cu fiecare element).

### **Căutare Binară**

Considerându-se o grupă de studenți ordonată alfabetic se cere ca printr-un număr cât mai mic de căutări să se determine dacă un anumit student se află în listă sau nu. Algoritmul de rezolvare presupune următorii pași:

0. Dacă lista are cel puțin 2 studenți atunci se execută pașii, altfel înseamnă că nu s-a găsit studentul căutat în listă:
1. Se verifică dacă studentul căutat este cel din mijlocul listei.
2. Dacă rezultatul căutării este cu succes algoritmul se încheie, dacă nu atunci urmează:
- 3a. Dacă numele studentului căutat este mai mare (alfabetic) decât al studentului din mijlocul listei atunci algoritmul de căutare se reaplică pe jumătatea superioară a listei (de la mijloc spre sfârșitul alfabetului).
- 3b. Dacă numele studentului căutat este mai mic (alfabetic) decât al studentului din mijlocul listei atunci algoritmul de căutare se reaplică pe jumătatea inferioară a listei (de la începutul alfabetului spre mijloc).

#### **Căutare Binară - Pseudocod**

```
FindExam(studentName, start, end){  
    halfwayPoint = (end + start)/2;  
    if (end < start)  
        ExamNotFound(); /* nu mai am decât cel mult un  
                         student în listă */  
    else if (studentName == NameOfExam(halfwayPoint))  
        ExamFound(halfwayPoint); /* Student găsit! */  
    else if (studentName < NameOfExam(halfwayPoint))  
        /*caută în jumătatea  
         inferioară*/  
        FindExam(studentName, start, halfwayPoint - 1);  
    else /* caută în jumătatea superioară */  
        FindExam(studentName, halfwayPoint + 1, end);  
}
```

## Turnurile din Hanoi

Se dau trei tije simbolizate prin A (sursă), C (destinație) și B (manevră). Pe tija A se găsesc  $n$  discuri de diametre diferite, așezate în ordine descrescătoare a diametrelor privite de jos în sus (discul 1 se află în vârf iar  $n$  este la bază). Se cere să se mute discurile de pe tija A pe tija C, folosind tija B ca tijă de manevră, respectându-se următoarele reguli:

- ❖ La fiecare pas se mută un singur disc.
- ❖ Nu este permis să se așeze un disc cu diametrul mai mare peste un disc cu diametrul mai mic.



**Figura 11.3.** Turnurile din Hanoi – Configurația inițială

**Mută primele  $n-1$  discuri de pe A pe B**



**Mută discul cu diametru cel mai mare pe C**



**Mută cele  $n-1$  discuri de pe B pe C**



**Figura 11.4.** Turnurile din Hanoi – Descompunerea problemei în subprobleme

De fapt, prima subproblemă este identică cu problema inițială, cu deosebirea că sunt mai puține discuri de mutat și tijele și-au schimbat ordinea (A este sursă, B este destinație și C manevră).

- "Mută primele n-1 discuri de pe A pe B."

A doua subproblemă, și ea coincide în mare parte cu problema inițială, deosebirea reprezentând-o numărul mai mic de discuri de mutat și ordinea tijelor (B este sursă, C este destinație și A manevră).

- "Mută cele n-1 discuri de pe B pe C."

Se observă astfel caracterul recursiv al problemei. Condiția de ieșire din recursivitate este atunci când  $n=1$  (un singur disc care se va muta de pe sursă pe destinație). Pentru această operație nu este nevoie de tijă de manevră.

- "Mută discul cu diametrul cel mai mare de pe A pe C."

```
MoveDisk(diskNumber, startPost, endPost, midPost){  
    if (diskNumber > 1){  
        /* Mută primele n-1 discuri de pe startPost pe midPost */  
        MoveDisk(diskNumber-1, startPost, midPost, endPost);  
        printf("Muta discul %d de pe %d pe %d.\n", diskNumber,  
              startPost, endPost);  
        /* Mută cele n-1 discuri de pe midPost pe endPost.*/  
        MoveDisk(diskNumber-1, midPost, endPost, startPost);  
    }  
    else  
        printf("Muta discul 1 de pe %d pe %d.\n", startPost, endPost);  
}
```

### Observații:

- Pentru orice algoritm *recursiv* există unul *iterativ* care rezolvă aceeași problemă.
- Rezolvarea *recursivă* a problemelor simplifică munca programatorului dar complică lucrurile la nivelul codului obiect deoarece operațiile cu stiva presupun un consum suplimentar de timp și memorie, timpul necesar de calcul pentru algoritmul iterativ fiind mult mai mic.
- **Consecință:** Nu întotdeauna alegerea unui algoritm *recursiv* reprezintă un avantaj.

- Exemplificare: Sirul lui Fibonacci – sir recurrent de ordinul 2.

$$fib(n) = \begin{cases} 1, & \text{dacă } n=0 \text{ sau } n=1 \\ fib(n-2)+fib(n-1), & \text{dacă } n>1 \end{cases}$$

O implementare C **recursivă** a calcului elementului  $fib(n)$  din cadrul acestui sir recurrent este prezentată mai jos (stânga):

```
#include<stdio.h>
int fib(int n);
main (){
    int in;
    int numar;
    printf("Care termen din sir?"); 
    scanf("%d", &in);
    numar = fib(in);
    printf("Termenul are valoarea %d\n", numar);
}

int fib(int n)
{
    if (n == 0 || n == 1)
        return 1;
    else
        return (fib(n-1) + fib(n-2));
}
```

**Implementare iterativă**

```
#include<iostream.h>
main (){
    int n, f0=0,f1=1,f2;
    cout<<"n=";cin>>n;
    if(!n)
        cout<<f0;
    else
        if(n==1)
            cout<<f1;
        else{
            for(i=2;i<=n;i++){
                f2=f0+f1;
                f0=f1;
                f1=f2;
            }
            cout<<f2;
        }
}
```

#### ■ Avantaje:

- Sirul Fibonacci este utilizat în probleme de sortare, căutare și strategii de joc (IA).
- A fost folosit în matematică de Edmond Lucas pentru a arăta că  $2^{127}-1$  este număr prim [Cor90].



**Figura 11.5.** Ineficiența recursivității în cascadă – calculul unor termeni de foarte multe ori

▪ **Dezavantaje (recursivitate în cascadă):**

- Pentru calculul lui  $fib(n)$  este necesar să se cunoască  $fib(n-1)$  și  $fib(n-2)$ . Parametrii acestor funcții sunt depuși în stivă. Procedeul continuă până este calculat  $fib(n-1)$ , apoi se reia calculul lui  $fib(n-2)$ . Acest lucru este extrem de ineficient pentru valori mari ale lui  $n$  ( $n > 100$ ). În figura următoare 11.6 se poate observa *trace-ul apelurilor funcției fib(3)* – modul de transmitere al argumentelor și ordinea de calcul a termenilor.
- Varianta de calcul recursiv presupune recalcularea unei valori de mai multe ori, **varianta iterativă fiind liniară**. Astfel, pentru calculul lui  $fib(5)$  termenul  $fib(3)$  a fost calculat de 2 ori iar termenul  $fib(2)$  a fost calculat de 3 ori determinând **creșterea stivei** prin faptul că există instanțe dinamice multiple ale funcției apelate. Dezavantajul este mult mai acutizat pentru valori foarte mari ale lui  $n$  – „*De câte ori este calculat și folosit fib(2) în calculul lui fib(100)?*” În aceste situații (recursivitate în cascadă), o soluție posibilă (neimplementată încă hardware în microprocesoarele comerciale) ar reprezenta reutilizarea dinamică a instrucțiunilor (rezultatul acestora) atât la nivel de funcție – *coarse grain* cât și la nivel de instrucțiune masină – *fine grain*.



**Figura 11.6.** Trace-ul apelurilor funcției fib(3)



**Figura 11.7.** Variația stivei (și a indicatorului de stivă – R6) în cazul apelurilor funcției fib(3)

### 11.3. IMPLEMENTAREA RECURSIVITĂȚII LA NIVELUL STIVEI DE DATE

Esența implementării recursivității constă în manipularea stivelor de date asociate funcțiilor dinamice (adică funcțiilor în curs de execuție la un moment dat). La implementarea algoritmilor este ușual să asociem obiecte locale funcțiilor, precum variabile, constante, tipuri, obiecte care nu au semnificație în afara funcției respective. **Definițiile parametrilor funcțiilor recursive, a variabilelor locale și globale sunt fundamentale pentru execuția programului** [Patt03]. Astfel, variabilele folosite pentru a parcurge valorile permise componentelor unei soluții trebuie să fie locale funcției, altfel nu se generează corect soluția. Definițiile bine alese pot optimiza spațiul de memorie alocat pe stivă și timpul de execuție. De fiecare dată când o funcție este apelată recursiv, pe stiva sistemului se crează un nou set de variabile locale. Deși noile variabile locale au același nume cu cele existente înainte de activarea funcției, valorile lor sunt distincte, și orice conflict de nume este evitat de aplicarea regulilor domeniilor de vizibilitate a identificatorilor. Aceste reguli spun că identificatorii se referă întotdeauna la ultimul set de variabile creat.

În continuare se prezintă, la nivel de cod obiect, implementarea funcției Fib(int n), cu referire la stivele de date accesate [Vin03, Patt03].



Figura 11.8. Stiva de date asociată funcției Fib(n)

Fib:

```
STR R7, R6, #1;
LDR R0, R6, #3;
BRz Fib_end;

ADD R0,R0, # -1
BRz Fib_end;
```

salvează PC revenire în stiva de date  
R0  $\leftarrow$  valoare "n"  
dacă  $n=0$  atunci se încheie recursivitatea,  
 $fib(0)=1$

și dacă  $n=1$  se încheie recursivitatea,  $fib(1)=1$

```
; temp = fib(n-1)
LDR R0,R6, #3;
ADD R0,R0, # -1;
STR R0, R6, #8;

STR R6, R6, #7;

ADD R6, R6,#5;

JSR Fib;
LDR R0, R6, #5;
```

se calculează  $n-1$  R0  $\leftarrow n$   
R0  $\leftarrow n-1$   
pune  $(n-1)$  ca parametru în stiva funcției  
 $fib(n-1)$

pune adresa de început a stivei funcției  $fib(n)$   
în stiva funcției  $fib(n-1)$

pune în R6 noua adresă de început aferentă  
stivei de date a lui  $fib(n-1)$

apel funcție fib (recursiv)  
R0  $\leftarrow$  valoarea returnată de  $fib(n-1)$

Using just for  
standalone-commercial purposes

|                           |                                                                 |
|---------------------------|-----------------------------------------------------------------|
| STR R0, R6, #4;           | memorează variabila locală aferentă stivei de date a lui fib(n) |
| <b>; R0 = fib(n-2)</b>    |                                                                 |
| LDR R0, R6, #3;           | R0 $\leftarrow$ (n-1)                                           |
| ADD R0, R0, #-1;          | R0 $\leftarrow$ (n-2)                                           |
| STR R0, R6, #8            |                                                                 |
| STR R6, R6, #7            |                                                                 |
| ADD R6, R6, #5;           | pregătește stiva de date a lui fib(n-2)                         |
| JSR Fib;                  | apel recursiv                                                   |
| LDR R0, R6, #5;           | R0 $\leftarrow$ fib(n-2)                                        |
| <b>; return R0 + temp</b> |                                                                 |
| LDR R1, R6, #4;           | R1 $\leftarrow$ fib(n-1)                                        |
| ADD R0, R0, R1;           | R0 $\leftarrow$ fib(n-1) + fib(n-2)                             |
| STR R0, R6, #0;           | fib(n) $\rightarrow$ RET VALUE                                  |
| LDR R7, R6, #1;           | reface R7 (adresa de revenire în programul apelant)             |
| LDR R6, R6, #2;           | revenire în stiva precedentă                                    |
| RET                       |                                                                 |
| Fib_end:                  |                                                                 |
| AND R0, R0, #0            | ; set R0 = 1                                                    |
| ADD R0, R0, #1            | ; store 1 to <i>return value</i>                                |
| STR R0, R6, #0            | reface R7, R6 ( <i>return address</i> și <i>stack pointer</i> ) |
| LDR R7, R6, #1;           |                                                                 |
| LDR R6, R6, #2            |                                                                 |
| RET                       |                                                                 |

**Obs:** Legătura între arhitectura unui microprocesor și aplicațiile scrise în limbaje de nivel înalt este una complexă și extrem de subtilă. Există microarhitecturi de calcul optimizează în mod special în vederea rulării eficiente a unor clase de aplicații bine precizate scrise în anumite limbaje de nivel înalt (ex. micropresoare Java) [Patt03].

- **Concluzie:** Este necesară o comparație între cele două moduri (*iterativ* și *recursiv*) de rezolvare a problemei date, nu doar văzut avantajul introdus de simplitatea și compactitatea codului din punct de vedere al programatorului.

## 11.4. TIPURI DE FUNCȚII RECURSIVE. ELIMINAREA RECURSIVITĂȚII

### Recursivitate liniară

Se caracterizează prin faptul că două apeluri recursive ale lui  $f$  pot apărea numai în ramificații diferite ale aceleiași alternative.

### Recursivitatea liniar repetitivă

Este un exemplu de recursivitate liniară. Apelul unei funcții de numește simplu, dacă este ultima acțiune din corpul unei funcții. O funcție sau un sistem de funcții având numai apeluri simple, este liniar recursiv repetitiv. Exemplu: factorialul. Codul de mai jos reprezintă prototipul unei recursivități liniar repetitive.

```
Tip2 r(Tip1 x) {  
    if (b(x)) r((k(x));  
    else h(x);  
}
```

unde  $r$  este funcția recursiv liniar repetitivă,  $b$  este o funcție booleană de parametru  $x$ , reprezentând condiția de continuare a recursivității, iar  $k$  și  $h$  reprezintă funcții de parametru  $x$ .

### Recursivitate neliniară

În funcțiile recursiv neliniare, două sau mai multe apeluri recursive pot apărea în aceeași ramificație a unei alternative.

### Recursivitate cascadată

În corpul funcției  $f$  pot apărea alte apeluri ale lui  $f$ , rezultatele acestor apeluri fiind legate de operatori. Exemplu: calcularea numerelor lui Fibonacci.

```
int fibonacci(int n) {  
    if (n<=1) return n;  
    else return fibonacci(n-2) + fibonacci(n-1);  
}
```

### Eliminarea recursivității liniare

Forma nerecursivă a unui algoritm este de preferat formei recursive, din punct de vedere al timpului de execuție și al memoriei ocupate. Avantajul formei recursive îl constituie în primul rând facilitatea și eleganța

scrierii programelor (de exemplu, comparați programul care rezolvă *problema turnurilor din Hanoi* în cele două variante – iterativ și recursiv). În alegerea căii recursive sau nerecursive (iterative) de rezolvare a unei probleme, programatorul trebuie să stabilească prioritățile în realizarea programului, analizând complexitatea problemei, naturalețea exprimării, ușurința proiectării și testării programului, eficiența în execuție. Astfel, dacă problema e de complexitate redusă, însă se cere eficiență maximă, se va alege varianta nerecursivă. Varianta recursivă este preferată acolo unde înlocuirea complexității presupune tehnici de programare speciale, algoritmul pierzându-și naturalețea.

Algoritmul general de eliminare a recursivității liniare este următorul:

- i. Se declară o stivă, care se inițializează ca fiind vidă. Pe acestă stivă urmează să se salveze parametrii formali, și variabilele locale funcției recursive.
- ii. Cât timp condiția de continuare a recursivității e îndeplinită, se efectuează urmatoarele:
  - iii. Se salvează pe stivă valorile actuale pentru argumentele funcției recursive și variabilele locale.
  - iv. Se execută instrucțiunile funcției recursive.
  - v. Se modifică valorile argumentelor funcției recursive.
- vi. Când condiția de continuare nu mai e îndeplinită, dacă stiva nu e goală, se aduce un set de variabile de pe stivă și se calculează valoarea dorită (după apelul funcției recursive) – eventual se execută instrucțiunile de după apelul funcției recursive, apoi se trece la pasul ii.

## 11.5. EXERCIȚII ȘI PROBLEME

1. La fiecare apel recursiv al unui subprogram, în memoria stivă sunt salvate:
  - a) adresa de revenire, valorile variabilelor locale și a parametrilor transmiși prin referință.
  - b) adresa de revenire și valorile variabilelor globale.

- c) adresa de revenire, valorile variabilelor locale și a parametrilor transmiși prin valoare și adresele parametrilor transmiși prin referință.
- d) adresa de revenire, valorile variabilelor locale și globale.

2. Care dintre următoarele afirmații sunt corecte ?

- a) Programul principal / funcția *main()* (Pascal / C) nu poate conține un autoapel.
- b) Un subprogram este recursiv dacă și numai dacă nu conține mai mult de un autoapel.
- c) Orice subprogram recursiv se poate implementa și iterativ.
- d) Un subprogram recursiv trebuie să aibă cel puțin un parametru transmis prin valoare.

3. Se consideră urmatorul subprogram recursiv:

```
int p(int n, int x)
{
    if(x==n)          return;
    else
        if(n%x==0)   return 0;
        else
            return p(n, x+1);
}
```

În urma apelului *p(n,2)* funcția va returna valoarea 1 dacă și numai dacă:

- a) numărul natural *n* nu este prim.
- b) numărul natural *n* este prim.
- c) numărul natural *n* este par.
- d) numărul natural *n* este impar.

4. Să se realizeze un subprogram recursiv, care primind ca parametru un număr întreg *n*, să întoarcă printr-un alt parametru cifra sa maximă.

5. Scrieți o funcție recursivă care să calculeze suma *S*, unde *n* va fi transmis ca și parametru:

$$S = 1 - 2^2 + 3^2 - 4^2 + \dots \pm n^2$$

6. a) Adresa de revenire dintr-o funcție recursivă este întotdeauna aceeași ?

De ce DA sau de ce NU ? Argumentați.

b) Pe durata execuției unui program principal o subrutină (nerecursivă) este apelată **exclusiv** printr-o instrucțiune JSR (apel de subrutină –

JAL la MIPS sau CALL la Intel) situată la o anumită adresă în acest program, de 723 de ori. De ce este dificil de predicționat în acest caz instrucțiunea RET (revenirea în programul apelant) de la finele subrutinei apelate?

7. Se consideră următoarea secvență de program C:

```
#include <stdio.h>
int Power(int a, int b);

int main(void)
{
    int x, y, z;
    printf("Introduceti doua numere: ");
    scanf("%d %d", &x, &y);
    if (x>0 && y>0)
        z = Power(x,y);
    else
        z = 0;
    printf("Rezultatul este %d", z);
}

int Power(int a, int b)
{
    if (a<b)
        return 0;
    else
        return 1 + Power(a/b,b);
}
```

Se cere:

- Ce afișează programul dacă se citesc de la tastatură perechile:
  - 4 9
  - 27 5
  - 1 3
- Ce calculează funcția Power() ?
- Descrieți un instantaneu (o imagine a zonei de activare a stivei de date aferentă funcției Power) în cazul apelului Power(11,7).



8. Se consideră următoarea secvență de program C:

```
int Sigma (int k)
{
    int t;
    t = k-1;
    if(k==0)
        return 0;
    else
        return (k + Sigma(t));
}
```

Se cere:

- Transformați funcția recursivă într-o iterativă care să realizeze același lucru. Se presupune că sigma este apelată doar cu parametri pozitivi.
- Considerând exact 1 KB de memorie contiguă disponibilă exclusiv pentru stiva de date aferentă apelului recursiv al funcție Sigma, și știind că adresele și numerele întregi sunt pe 16 biți, determinați câte apeluri ale funcției pot fi făcute (valoarea maximă a lui k) pentru a nu obține mesajul *Stack Overflow*. Se consideră că alte variabile temporare nu ocupă spațiul pe stiva de date.

## **12. POINTERI ȘI TABLOURI. TRANSFERUL PARAMETRILOR PRIN REFERINȚĂ. POINTERI SPRE FUNCȚII**

### **12.1. INTRODUCERE**

În acest capitol sunt introduse două construcții de programare simple dar (foarte puternice) extrem de importante în manipularea de către limbajul de nivel înalt (C, C++, Java, Pascal) a conținutului locațiilor de memorie – **pointerii și tablourile**. Pentru început se reamintește (vezi capitolul 10) că o variabilă reprezintă o locație de memorie caracterizată prin adresă și conținut. **Pointerul<sup>18</sup> reprezintă adresa unei zone de memorie; el face posibil accesul indirect la conținutul respectivei locații.** Din punct de vedere al conținutului memoriei indicate, se disting următoarele categorii de pointeri:

- **Pointeri către (adrese de) date** – conțin adresa unei variabile.
- **Pointerii către (adrese de) funcții** – conțin adresa codului executabil a unei funcții. Deși în C, o funcție nu este o variabilă este posibil a se referi pointeri la funcții. Aceștia pot fi atribuiți, plasați în tablouri, transmiși ca parametrii altor funcții.
- **Pointeri generici (pointeri void \*)** – conțin adresa unui obiect oarecare, de orice tip. Prin declararea **void \*** este anunțat compilatorul să nu verifice tipul datei spre care se pointează. Se utilizează atunci când nu se cunoaște exact tipul de date (adresa și conținutul) care va fi instantiat în mod dinamic la execuție.

Înțelegerea și utilizarea corectă a pointerilor este esențială pentru acuratețea și eficiența aplicațiilor scrise în limbajele de nivel înalt (C, C++, Java). Trei motive justifică acest lucru:

- **Pointerii oferă posibilitatea de a modifica argumentele de apelare a funcțiilor (transferul parametrilor prin referință).**

---

<sup>18</sup> Termenul de *pointer* a fost preluat în limba română și poate fi folosit cu sensul de referință, indicator de adresă, localizator.

- **Pointerii permit** (facilitează) rezervarea (allocarea) **dinamică a memoriei** (doar în momentul execuției se cunoaște adresa reală și conținutul unei variabile și nu în etapa de compilare). Acest lucru este foarte important mai ales atunci când anumite variabile alocate static (în faza de compilare) nu sunt utilizate decât pentru foarte scurt timp sau chiar de loc pe parcursul execuției aplicației – vezi cazul tablourilor de dimensiuni foarte mari. Allocarea de zone de memorie și eliberarea lor în timpul execuției programelor permite gestionarea optimă a memoriei de către programe. Cu ajutorul pointerilor pot fi create diferite modalități de organizare a datelor în structuri, care cresc sau descresc pe durata execuției programelor (un exemplu ar fi stiva de date aferentă funcțiilor) [Patt03].

- **Pointerii pot îmbunătăți eficiența anumitor rutine.**

Pe lângă aceste facilități, pointerii impun însă și responsabilitate atunci când sunt folosiți. Pointerii neinițializați dar utilizați în operații (sau care conțin valori neadecvate) pot determina blocarea sistemului de operare. De asemenea, pointerii folosiți în mod incorrect implică erori greu de depistat.

Întrucât pointerul reprezintă adresa unei zone de memorie rezultă că orice operație cu pointeri presupune citirea / scrierea în memorie (iar în cazul celor neinițializați – într-o zonă de memorie necunoscută) [Zah04]. Efectul operației de citire nu este atât de grav din punct de vedere al funcționalității sistemului ci doar strict din punct de vedere al aplicației, care va folosi astfel o valoare eronată. Problema cea mai neplăcută la folosirea pointerilor neinițializați poate apărea la atribuirea (asignarea) unei valori conținutului acestora. Scrierea într-o zonă de memorie necunoscută poate distruge (altera) chiar codul sau datele proprii, sau mai rău, zone necesare sistemului de operare (apeluri sistem, rutine de tratare a diverselor întârzieri hardware, etc). Efectul se va vedea doar mai târziu în timpul execuției programului. Exemplul următor ilustrează un caz de pointer neinițializat.

```
void main(void)
{
    int x, *p;
    x = 12;
    *p = x;
    ...
}
```

Această secvență de cod ilustrează o eroare destul de frecventă și greu de sesizat, care atribuie valoarea 12 unei locații de memorie necunoscute, deoarece pointerul *p* nu a fost inițializat în momentul în care s-a executat instrucțiunea *\*p = x;*. Pentru aplicații de dimensiuni reduse, deși pointerul nu este inițializat este probabil ca el să indice spre o adresă „sigură” (una care nu intră în zona de cod, date sau aferentă sistemului de operare). Însă, cu cât aplicația este mai mare și mai complexă (folosirea tablourilor de pointeri sau liste înlăncuite), efectul acestei greșeli poate deveni „*neplăcut*” și chiar dezastroz. O convenție uzuală în cazul aplicațiilor cu pointeri, respectată de majoritatea programatorilor în C/C++, sugerează ca: „*unui pointer care nu indică efectiv o locație de memorie validă i se dă valoarea NULL (0)*”. Astfel, un pointer NULL se consideră că nu indică spre nimic și nu ar trebui folosit.

O ultimă observație legată de inițializarea pointerilor se referă la cazul în care un pointer ia valoarea altui pointer (de exemplu, int \*p, int \*q; p=q;). În această situație se pierde legătura cu locația spre care indicase *p*, iar locația spre care referise *q* este acum partajată atât de *p* cât și de *q*, orice modificare la respectiva locație din partea uneia dintre ei afectându-i pe ambiii pointeri (vezi exemplul din figura 12.1).

## 12.2. SEMNIFICATIE ȘI DECLARARE

De regulă, pointerii sunt utilizați pentru a face referire la date cunoscute prin adresele lor. Declarația unui pointer este asemănătoare cu declarația oricărei variabile, singura deosebire fiind aici că, numele pointerului este precedat de caracterul \* [Neg97].

*Tip \*nume\_pointer; /\* unde nume este un pointer care referă spre o zonă de memorie care conține date de tipul Tip.\*/*

În construcția *\*nume\_pointer* indicată mai sus, caracterul \* se consideră ca fiind un operator unar care furnizează valoarea din zona de memorie a cărei adresă este conținută de *nume\_pointer*. Operatorul unar \* are aceeași prioritate ca toți ceilalți operatori unari din C.

În declarația *int \*p;* tipul *int* stabilește faptul că *p* conține adrese de zone de memorie alocate datelor de tip *int*. Declarația lui *p* poate fi

interpretată astfel:  $*p$  reprezintă conținutul zonei de memorie spre care indică  $p$ , iar acest conținut este de tip int. De exemplu, dacă  $p$  este un pointer care are ca valoare adresa zonei de memorie alocată variabilei întregi  $a$ , atunci  $*p$  reprezintă chiar valoarea variabilei  $a$ . Pentru atribuirea unui pointer  $p$  la adresa unei variabile (*inițializarea pointerului*) se va folosi operatorul unar  $\&$ . De exemplu, declarațiile **int a; int \*p = &a;** exprimă de fapt trei operații: o declarație a variabilei  $a$  (alocare statică a memoriei – **int a;**) o declarație a unui pointer spre tipul int (**int \*p;**) și o inițializare a lui  $p$  cu adresa variabilei  $a$  ( **$p = \&a;$** ).

În continuare sunt prezentate câteva echivalențe de construcții de limbaj folosind pointeri.

| Se consideră declarațiile: |                          |
|----------------------------|--------------------------|
| int x, y;                  |                          |
| int *p;                    |                          |
| y = x + 100;               | p = &x;<br>y = *p + 100; |
| x = y;                     | p = &x;<br>*p = y;       |
| x++;                       | p = &x;<br>(*p)++;       |

Exemplul următor ilustrează (și grafic) instrucțiunile prin care un pointer este inițializat și cum se modifică referințele la variabile pe parcursul unei secvențe de program.

```
void Exemplu_cu_Pointer(){
    int a = 1;
    int b = 2;
    int c = 3;
    int* p;
    int* q;
```

// Conținutul memoriei în acest punct (T1) este următorul (pointerii  $p$  și  $q$  nu au fost încă inițializați).



```
p = &a; // este inițializat p să indice spre variabila a, adresa lui a fiind cunoscută în momentul compilării
q = &b; // este inițializat q să indice spre variabila b, adresa lui b fiind cunoscută și ea în momentul compilării
```

// Conținutul memoriei în acest punct (T2) este următorul:



```
c = *p;
p = q; // se pierde referința anterioară a lui p (care era spre a) și va partaja împreună cu q aceeași referință spre b.
*p = 13; // prin modificarea efectuată asupra valorii de la locația spre care pointează p se modifică și *q.
```

// Conținutul memoriei în acest punct (T3) este următorul:



}

**Figura 12.1.** Aplicație C folosind pointeri

### 12.3. ALOCAREA ȘI ACCESAREA DE VARIABILE. LEGĂTURA DINTRE NIVELUL HIGH ȘI LOW VĂZUTĂ PRIN INTERMEDIUL MODURILOR DE ADRESARE

În cadrul LC-3 ISA [Patt03] accesul la conținutul unei locații de memorie corespunzătoare unei variabile alocate static poate fi făcut prin intermediul instrucțiunii  $LD R_{dest}, Adresă$  (**mod de adresare direct**) – dacă se află într-un spațiu de (+255 / -256) locații față de adresa instrucțiunii curente și respectiv, folosind succesiunea de instrucțiuni (1)  $LEA R_{bază}, Adresă$  și (2)  $LDR R_{dest}, R_{bază}, \#0$  – cu mod de adresare indexat, mai ales atunci când locația de memorie se află într-un spațiu îndepărtat cu cel puțin 256 de locații față de PC-ul instrucțiunii curente. Accesul la conținutul unei locații spre care indică o variabilă de tip **pointer** (alocare dinamică a memoriei) se face folosind o instrucțiune de acces la memorie în **mod de adresare indirect**  $LDI R_{dest}, Adresă$  sau, după cum poate fi observat și în exemplul următor, printr-o succesiune de trei instrucțiuni: (1)  $LEA R_{bază}, Adresă$ , (2)  $LDR R_{cont}, R_{bază}, \#0$  și (3)  $LDR R_{dest}, R_{cont}, \#0$ .

**Aplicație 1:** Accesul la conținutul unei locații spre care indică o variabilă de tip **pointer**.

Se consideră următoarea configurație arhitecturală:

| Adresă memorie | Conținut locație |
|----------------|------------------|
| x3050          | x70A2            |
| x70A2          | x70A3            |
| x70A3          | xFFFF            |
| x70A4          | x123B            |

Registrul PC indică valoarea x3010 iar instrucțiunile de la adresele x3010 la x3012 sunt ilustrate mai jos. Să se determine valoarea stocată în R6 după execuția celor 3 instrucțiuni. Pot fi înlocuite cele trei instrucțiuni cu una singură care să rezolve aceeași problemă? Care este aceasta?

| Adresă memorie | Codificare instrucțiune |
|----------------|-------------------------|
| x3010          | LEA R3, x3050           |
| x3011          | LDR R4, R3, #0          |
| x3012          | LDR R6, R4, #0          |

|                | Conținut regiștrii după execuția instrucțiunii |       |       |
|----------------|------------------------------------------------|-------|-------|
| Instrucțiune   | R3                                             | R4    | R6    |
| LEA R3, x3050  | x3050                                          |       |       |
| LDR R4, R3, #0 | x3050                                          | x70A2 |       |
| LDR R6, R4, #0 | x3050                                          | x70A2 | x70A3 |

Practic secvența de 3 instrucțiuni realizează: **R6 ← Mem[Mem[x3050]]** care poate fi codificată mai simplu printr-o singură instrucțiune: **LDI R6, x3050**, execuția însă presupunând același număr de pași (3 – determinare adresa, determinare conținut locație de la adresa respectivă care va reprezenta adresa finală de la care se va aduce operandul sau valoarea dorită).

**Aplicație 2.1:** Corespondența limbaj de nivel înalt –C și limbaj asamblare LC-3 folosind pointeri [Patt03].

Cele două secțiuni de cod de mai jos (una în C, cealaltă în asamblare LC-3) trebuie să realizeze același lucru. Se consideră variabilele x, p și z declarate global. Instrucțiunile scrise cu litere aldine și subliniate au fost adăugate pentru a crea corespondență corectă Q – LC-3.

|                    |                                                        |
|--------------------|--------------------------------------------------------|
| int x;             | .ORIG x3000                                            |
| int *p;            |                                                        |
| int z;             |                                                        |
| main()             | LD R0, X<br>AND R0, R0, #0<br><u>ST R0, X</u>          |
| {<br>x = 0;<br>}   | .                                                      |
| x++;               | LD R0, X<br>ADD R0, R0, #1<br><u>ST R0, X</u>          |
| <u>p = &amp;x;</u> | LEA R0, X<br>ST R0, P                                  |
| z = (*p) + 1;      | <u>LDI R0, P</u><br>ADD R0, R0, #1<br>ST R0, Z<br>HALT |
| }                  | X .BLKW 1                                              |

|  |           |
|--|-----------|
|  | P .BLKW 1 |
|  | Z .BLKW 1 |
|  | .END      |

**Aplicație 2.2:** Corespondența limbaj de nivel înalt –C și limbaj asamblare LC-3 folosind pointeri. Se consideră de această dată că cele două variabile sunt declarate local funcției main().

```

int i;
int *ptr;
i = 4;           stocheaza valoarea 4 in memorie la locatia
ptr = &i;          retine adresa variabilei i in locatia de
                   memorie asociata variabilei ptr
*ptr = *ptr + 1; citeste continutul locatiei de
                  memorie spre care indica ptr
                   stocheaza o noua valoare la
                   adresa indicata de ptr
  
```

; *i* este prima variabilă declarată local (offset-ul 3 față de începutul stivei de date aferentă funcției *main()*); *ptr* este a doua variabilă (offset 4).

```

; i=4;
AND R0, R0, #0    ; inițializare R0
ADD R0, R0, #4     ; stochează valoarea 4 în R0
STR R0, R6, #3     ; scrie conținutul lui R0 în stiva de date aferentă
                    ; funcției main() la locația corespunzătoare
                    ; variabilei i
; ptr = &i;
ADD R0, R6, #3     ; R0 = R6 + 3 (R0 reține adresa variabilei i)
STR R0, R6, #4     ; memorează adresa lui i în ptr

; *ptr = *ptr + 1;
LDR R0, R6, #4     ; R0 = ptr (valoarea adresei)
  
```

|                                                    |                                                                                                                                                                              |
|----------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| LDR R1, R0, #0<br>ADD R1, R1, #1<br>STR R1, R0, #0 | ; încarcă de la <i>ptr</i> (* <i>ptr</i> ) în R1<br>;incrementează valoarea lui R1<br>;stochează rezultatul la adresa specificată de<br><i>ptr</i> (acolo unde R0 pointează) |
|----------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|

## **12.4. TRANSFERUL PARAMETRILOR PRIN REFERINȚĂ LA APELUL FUNCȚIILOR**

Pentru a demonstra necesitatea transferului parametrilor prin adresă în cazul apelurilor de funcții se va folosi următoarea secvență de cod C, în care, funcția *Swap()* dorește să interschimbe valorile celor două argumente. Funcția *Swap()* este des apelată în cazul aplicațiilor de sortare.

```
#include <stdio.h>
void Swap(int firstVal, int secondVal);

int main()
{
    int valueA = 13;
    int valueB = 333;

    printf("Inaintea apelului functiei Swap ");
    printf("valueA = %d and valueB = %d\n", valueA, valueB);
    Swap(valueA, valueB);
    printf("Dupa apelul functiei Swap ");
    printf("valueA = %d and valueB = %d\n", valueA, valueB);
}

void Swap(int firstVal, int secondVal)
{
    int tempVal; /* Retine valoarea primului parametru – firstVal la
                   interschimbare */

    tempVal = firstVal;
    firstVal = secondVal;
    secondVal = tempVal;
}
```

Funcția Swap() este apelată din programul principal main() cu argumentele valueA egal cu 13 și valueB egal cu 333. Rezultatul dorit în urma apelului este ca valueA să fie egal cu 333 iar valueB cu 13. Cu toate acestea, argumentele transmise funcției Swap() rămân nemodificate în urma compilării și execuției codului.



**Figura 12.2.** Execuția funcției Swap – imaginea zonei de activare înainte și după apel

Examinând stiva de date aferentă funcțiilor *main()* și *Swap()* pe durata execuției programului (vezi figura 12.2) se observă cum interschimbarea operează doar asupra copiilor locale ale parametrilor *firstVal* și *secondVal*, iar la revenirea din *Swap()* în *main()* valorile modificate sunt pierdute odată cu descărcarea de pe stivă a zonei de activare aferentă funcției *Swap()*. „Vinovat” de acest fapt este limbajul C care *transmite argumentele de la nivelul funcției apelante la cel al funcției apelate prin valoare*. „C”-ul evaluează fiecare argument care apare în apelul de funcție ca o expresie și plasează **valoarea** acesteia în locația corespunzătoare din zona de activare aferentă funcției apelate. Pentru ca funcția *Swap()* să poată modifica argumentele actuale – parametri efectivi pe care funcția apelantă *main()* îi transmite, ea (*Swap*) trebuie să aibă acces la zona de activare a funcției apelante (trebuie să acceseze locațiile la care sunt stocate argumentele pentru a modifica valorile acestora). Rezultă, în mod evident că, funcția *Swap* are nevoie de adresele variabilelor *valueA* și *valueB* din *main()* pentru a modifica valorile reținute de acestea. După cum poate fi observat din

secvența de cod de mai jos dar și din figura 12.3, acest lucru poate fi realizat folosind pointerii și operatorii asociati de indirectare – \* respectiv adresa – &.

```
#include <stdio.h>
void NewSwap(int *firstVal, int *secondVal);

int main()
{
    int valueA = 13;
    int valueB = 333;

    printf("Înaintea apelului functiei NewSwap ");
    printf("valueA = %d and valueB = %d\n", valueA, valueB);
    NewSwap(&valueA, &valueB);
    printf("Dupa apelul functiei NewSwap ");
    printf("valueA = %d and valueB = %d\n", valueA, valueB);
}

void NewSwap(int *firstVal, int *secondVal)
{
    /* Parametri formalii sunt pointeri la numere întregi. Funcția
     * apelantă transmite adresele variabilelor pe care funcția vrea să le
     * interschimbe. */
    int tempVal;      /* Retine valoarea primului parametru – firstVal
                        la interschimbare */

    tempVal = *firstVal;
    *firstVal = *secondVal;
    *secondVal = tempVal;
}
```



**Figura 12.3.** Execuția funcției *NewSwap* – imaginea zonei de activare înainte și după apel

În continuare, sunt ilustrate schimbările intervenite la nivelul funcției `Swap()`, de la începutul acestui paragraf (12.4) și din figura 12.2, pentru a realiza obiectivul inițial, cel de interschimbare a argumentelor primite. Noua variantă (revizuită) a funcției `Swap()` se va numi `NewSwap()`. Prima modificare constă în faptul că parametrii formali ai funcției `NewSwap` nu mai sunt de tip întreg (`int`) ci pointeri la întregi (`int *`). În noua funcție, cei doi parametri sunt adresele de memorie a celor două variabile care se vor inversa (interschimbate). Operatorul de indirectare folosit în prototipul funcției `NewSwap` semnifică faptul că variabilele spre care se pointează vor fi interschimbată. Întrucât aceste valori se regăsesc în zona de activare a funcției apelante (`main`), la apelul funcției `NewSwap` se va folosi operatorul adresă (vezi figura 12.3).

**Echivalență C – LC-3** la nivelul funcției apelante `main()` și la nivelul funcției apelate `NewSwap()` [Patt03].

Funcția `main()` urmărește interschimbarea valorilor variabilelor locale `valueA` și `valueB`, motiv pentru care transmite funcției `NewSwap()` adresele celor două variabile.

**NewSwap(&valueA, & valueB);**

Codul asamblare LC-3 care realizează acest lucru este următorul:

ADD R0, R6, #3; în R0 se calculează adresa variabilei *valueA* – unde R6 indică spre adresa primei locații din stiva de date aferentă funcției main().

STR R0, R6, #8 ; se memorează această adresă (R0) în locația corespunzătoare primului parametru efectiv transmis funcției NewSwap() – (vezi figura 12.3).

ADD R0, R6, #4; în R0 se calculează adresa variabilei *valueB*.

STR R0, R6, #9 ; se memorează această adresă (R0) în locația corespunzătoare celui de-al doilea parametru efectiv transmis funcției NewSwap() – (vezi figura 12.3).

Secvența de cod asamblare la nivelul funcției apelate NewSwap() este următorul:

**; int tempVal = \*firstVal;**

LDR R0, R6, #3;

în R0 se încarcă valoarea parametrului formal, care reprezintă **adresa variabilei valueA** din funcția apelantă ( $R0 \leftarrow x4103$ ). În acest moment, R6 indică spre adresa primei locații din stiva de date aferentă funcției NewSwap().

LDR R1, R0, #0 ;

în R1 se încarcă **valoarea variabilei valueA** ( $R1 \leftarrow 13$ ).

STR R1, R6, #5;

se salvează în variabila tempVal conținutul lui R1 ( $tempVal \leftarrow 13$ ).

**; \*firstVal = \*secondVal;**

LDR R1, R6, #4;

în R1 se încarcă valoarea parametrului formal, care reprezintă **adresa variabilei valueB** din funcția apelantă ( $R1 \leftarrow x4104$ ). De asemenea, R6 indică spre adresa primei locații din stiva de date aferentă funcției NewSwap().

LDR R2, R1, #0 ;

în R2 se încarcă **valoarea variabilei valueB**

( $R1 \leftarrow 333$ ).

STR R2, R0, #0 ;

Se modifică prima variabilă cu valoarea finală

(valueA=333)

**; \*secondVal = tempVal;**

LDR R2, R6, #5

în R2 se încarcă **valoarea variabilei locale tempVal** din funcția apelată ( $R2 \leftarrow 13$ ).

STR R2, R1, #0 ;  
finală (valueB=13).

Se modifică a doua variabilă cu valoarea

Diferența esențială între cele două tipuri de apeluri, prin valoare respectiv prin referință, este următoarea: **funcția apelată prin valoare nu poate modifica parametrii efectivi (actuali) din funcția care a făcut apelul neavând acces la ei, în schimb, în cazul apelului prin referință, funcția apelată, disponând de adresa parametrilor efectivi, îi poate modifica pe aceștia** [Patt03, Neg97].

## 12.5. POINTERI SPRE FUNCȚII

O caracteristică generatoare de confuzii dar performantă a limbajului C este *pointerul către o funcție*. Deși o funcție nu este o variabilă, ea are o localizare în memorie care poate fi atribuită unui pointer. Adresa unei funcții este punctul de intrare în funcție. Astfel, un pointer către funcție poate fi utilizat pentru a apela respectiva funcție.

În continuare se reamintește pe scurt modul în care o funcție este compilată și apelată (vezi capitolul 10). Codul sursă este transformat în cod obiect (tabela de simboluri, analiză și sinteză) și se stabilește un punct de intrare – vezi directiva .ORIG (la LC-3) [Patt03] care stabilește valoarea cu care se încarcă PC-ul primei instrucțiuni din funcție. În timpul rulării programului, atunci când este apelată o funcție, acest punct de inserare este apelat de limbajul mașină (inserat pe stiva de date aferentă programului apelant – vezi figura 11.8. Stiva de date asociată funcției Fib(n)). Dacă un pointer conține adresa punctului de intrare, poate fi folosit pentru a apela acea funcție. Adresa unei funcții se obține utilizând numele unei funcții fără nici o paranteză sau argumente.

Pentru a declara o variabilă pointer către o funcție, numele pointerului trebuie precedat de simbolul \*; de exemplu, **int (\*pf)(long)** este un pointer către o funcție care are un parametru de tip long și întoarce un întreg. Practic, se declară o variabilă de tip pointer, care este capabilă să rețină un pointer către o funcție ce returnează un întreg. Considerând o funcție care determină numărul de cifre al unui număr întreg primit ca parametru – **int cif\_control(long)**; rezultă următoarea asignare corectă [Zah04, Neg97]:

**pf = cif\_control;**

Programul principal va conține următoarele linii de cod:

```
int rez, n;  
cin>>n;  
pf = cif_control;
```

```
rez = (*pf)(n);
```

Pot apărea însă și următoarele erori:

- a) ***pf = cif\_control(n);***; unde pf este pointer la funcție iar cif\_control(n) este un întreg. Mesajul de eroare este următorul: „*Cannot convert ,int' to ,int (\*)(long)*“.
- b) ***pf = &cif\_control(n);***; nu se poate obține adresa rezultatului unei funcții deoarece transferul rezultatului se face prin stivă. Mesajul de eroare este următorul: „*Must take address of a memory location*“.

```
#include<iostream.h>
int cif_control(long);
int (*pf)(long);
void main()
{
    long n;
    int rez;

    cout<<"n=";
    cin>>n;
    pf = cif_control;
    rez = (*pf)(n);
    cout<<rez;
}

int cif_control(long a)
{
    int z=0;
    while (a!=0)
    {
        z++;
        a=a/10;
    }
    return z;
}
```

Întrucât numele unei funcții este un pointer spre funcția respectivă el poate fi folosit ca parametru efectiv la apelurile de funcții. Un exemplu larg răspândit în care este nevoie de un astfel de transfer este cel privitor la calculul aproximativ al integralelor definite prin metoda dreptunghiului sau

cea a *trapezului*. În continuare se reamintește pe scurt aparatul matematic utilizat [Neg97].

Dându-se o funcție continuă pe un interval închis  $[a, b]$ ,  $f: [a, b] \rightarrow \mathbb{R}$ , atunci, integrala definită  $\int_a^b f(x)dx$  este aria trapezului curbiliniu, determinat de axa Ox, dreptele  $y=a$  și  $y=b$  și graficul funcției  $f(x)$  pe intervalul  $[a, b]$ . Aproximarea ariei unui trapez curbiliniu este mult mai eficientă în cazul când pe fiecare din segmentele elementare este aproximată printr-un trapez și nu printr-un dreptunghi. Intervalul de calcul al integralei  $[a, b]$  este divizat în  $n$  intervale de lungime egale  $h = \frac{b-a}{n}$ . Rezultă astfel un set de puncte elementare ( $x_i = a + i*h$ , cu  $i = 0, \dots, n$ ) în care se va calcula valoarea funcției. Pe un segment elementar  $[x_i, x_{i+1}]$  trapezul este determinat de extremitățile segmentului pe axa Ox – punctele  $(x_i, 0)$  și  $(x_{i+1}, 0)$  și de valoarea funcției  $f(x)$  în extremități – punctele  $(x_i, f(x_i))$  și  $(x_{i+1}, f(x_{i+1}))$ . Reamintind că aria unui trapez (dreptunghic în cazul nostru) este egală cu semi-suma bazelor înmulțită cu înălțimea trapezului rezultă:

$$\int_a^b f(x)dx \approx \sum_{i=0}^{n-1} h \cdot \frac{f(x_{i+1}) + f(x_i)}{2} = h \cdot \sum_{i=0}^{n-1} \frac{f(x_{i+1}) + f(x_i)}{2} \quad (= \text{notata de autor } I_n)$$

Pentru a calcula integrala definită dintr-o anumită funcție (în exemplul nostru am considerat  $\frac{1}{1+x^2}$  și respectiv  $\frac{1}{1+x}$ ) cu o precizie de  $10^{-7}$  se vor urma pașii algoritmului.

**Pasul 1:** Se alege o valoare inițială pentru  $n$  (numărul de diviziuni). Cu cât  $n$  este mai mare va avea loc o divizare mai fină a intervalului  $[a,b]$  – o apropiere mai mare de valoarea reală a integralei.

**Pasul 2:** Se calculează  $I_n$  (valoarea integralei pentru  $n$  subintervale).

**Pasul 3:** Se calculează  $I_{2n}$  (valoarea integralei pentru  $2*n$  subintervale).

**Pasul 4:** Dacă  $|I_n - I_{2n}| < 10^{-7}$ , algoritmul se întrerupe și valoarea integralei, cu precizia solicitată, este  $I_{2n}$ , altfel se dublează  $n$ , se păstrează ultima valoare a integralei  $I_n = I_{2n}$  și se reia pasul 3.

În continuare se construiește o funcție care calculează valoarea lui  $I_n$  – numită **integrala\_trapez** [Neg97]. Se impun însă unele observații:

- Funcția  $f(x)$  trebuie să figureze printre parametrii funcției **integrala\_trapez** deoarece calculul integral definit poate fi aplicat oricărei funcții. De asemenea, limitele de integrare și numărul de diviziuni în care se împarte intervalul trebuie transmiși ca și parametrii.

- Funcția **integrala\_trapez** returnează valoarea aproximativă a integralei și se va apela printr-o expresie de atribuire de genul:  $i\_n = integrala\_trapez(a,b,n,f)$ ; în exemplul nostru s-a considerat  $f$  fiind funcția *arctan\_deriv* (derivata funcției arctgx).
- Întrucât funcția  $f(x)$  returnează o valoare flotantă în dublă precizie rezultă că și integrala (funcția **integrala\_trapez**) va returna același tip de date. Așadar, prototipul funcției **integrala\_trapez** este următorul: *double integrala\_trapez(double, double, long , double (\* )(double))*;
- Evident că, înaintea apelului funcției **integrala\_trapez** funcția  $f(x)$  trebuie să fie definită sau să fie prezent prototipul ei.
- Construcția sintactică *double (\*p)(double)* din antetul funcției **integrala\_trapez** se interpretează astfel:
  - ☞  $*p$  – semnifică faptul că  $p$  este un pointer.
  - ☞  $(*p)(double)$  – înseamnă că  $p$  este un pointer spre o funcție cu parametru de tip *double*.
  - ☞ *double (\*p)(double)* – specifică faptul că  $p$  este un pointer spre o funcție care returnează o valoare flotantă în dublă precizie.
- Este necesară includerea lui  $*p$  între paranteze rotunde, deoarece construcția *double \*p(double)* este corectă din punct de vedere sintactic, dar înseamnă altceva, parantezele rotunde fiind prioritare operatorului *\**. În acest caz, se declară  $p$  ca o funcție cu parametru *double* și care returnează un pointer spre o valoare flotantă în dublă precizie. Astfel de declarații se întâlnesc des în aplicații cu structuri de date cu legături (sau autoreferire) – liste, arbori, etc.
- În momentul definirii funcției **integrala\_trapez**, necunoscându-se numele concret al funcției  $f(x)$ , ci doar pointerul spre ea, în apelurile  $f(a)$ ,  $f(a+h)$ , etc, se va înlocui numele funcției  $f(x)$  prin  $*p$  astfel:  $(*p)(a)$ ,  $(*p)(a+h)$ , etc.

```
#define a 0.0          /* capătul stâng al intervalului pe care se
                           calculează integrala */
#define b 1.0          /* capătul drept al intervalului */
#define N 10           /* numărul de subdiviziuni al intervalului [a,b]
                           utilizat în calculul integralei */
#define EPSILON 1e-7/*   precizia de calcul a integralei */
#include <math.h>
#include <stdio.h>
#include <conio.h>
double arctan_deriv(double);      /*      1/(1+x_patrat) */
double integrala_trapez(double, double, long , double (* )(double));
```

```
void main(void)      /* calculeaza integrala din arctan_deriv(x)=1/(1+x*x)
                        in intervalul [a,b] cu o eroare mai mica decat
                        EPSILON */
{
    clrscr();
    long n = N;
    double i_n, i_2n, vabs;
    i_n = integrala_trapez(a,b,n,arctan_deriv);
    do{
        n = 2*n;
        i_2n = integrala_trapez(a,b,n,arctan_deriv);
        if((vabs=i_n - i_2n)<0)
            vabs = - vabs;
        i_n = i_2n;
    }while(vabs>EPSILON);
    printf("Valoarea integralei este: %.10g\n",i_2n);
    printf("Integrala se obtine cu precizia %g dupa %ld
           iteratii!\n",EPSILON,n);
    getch();
}

double integrala_trapez(double x, double y, long m, double (*p)(double))
{
    /* calculul integralei prin metoda trapezelor - divizarea intervalului
       [a,b] in m subintervale si calculul ariei folosind formula trapezului
       dreptunghic */
    double h,s;
    int i;
    h = (y-x)/m;
    for(i=1,s=0.0;i<m;i++)
        s+=(*p)(x+i*h);
    s+=((*p)(x)+(*p)(y))/2;
    s=s*h;
    return s;
}

double arctan_deriv(double x)
{
    return 1/(1+x*x);
//    return 1/(x+1);
}
```

În ciuda multiplelor avantaje la nivelul limbajului *high*, pointerii introduc un nivel de indirectare (acces suplimentar la memorie) iar la nivel *low*, apelurile de funcții indirect prin pointer generează salturi / apeluri indirecte, foarte dificil de prezis, cu implicații defavorabile asupra performanței globale de procesare [Flo05].

În continuare este ilustrat un exemplu care justifică afirmația că “**funcțiile de bibliotecă determină la nivelul procesorului salturi / apeluri indirecte** (*new*, *qsort*, *scan*, *printf*)”. Este vorba de programul de test *qsort.c,,s*, preluat din help-ul oferit de mediul BorlandC și care sortează un tablou de siruri de caractere prin intermediul funcției de bibliotecă *qsort* care primește ca parametri adresa tabloului, numărul de elemente, dimensiunea fiecărui element și o funcție de comparare de două siruri de caractere. Practic o sursă a celor 11 apeluri indirecte o constituie și **apelul indirect prin pointer la funcția de comparare** – pas realizat în cadrul funcției *qsort* (*precompilate*) [Flo05].

În continuare se exemplifică pe baza descrierii funcției din fișierul ...\\BorlandC\\Crtl\\Clib\\qsort.cas.

*Nume funcție* ***qsort*** – sortează un tablou de elemente pe baza metodei de sortare rapidă "selecția elementului median din trei", prin apelul repetat al unui pointer la o funcție definită de utilizator ((**\*fcmp()**)).

*Utilizare*      **void qsort(void \*base, int nelem, int width, int (\*fcmp)());**

*Prototipul funcției* se află în **stdlib.h**.

**\*fcmp**      *funcție de comparare* care acceptă două argumente: *elem1* și *elem2*, adresele a două elemente ale tabloului de sortat. Rezultatul returnat este următorul:

Dacă elementele sunt în relația      ***fcmp*** returnează

**\*elem1 < \*elem2**      Un      întreg

negativ (*elem1*

se va afla în

tabloul      sortat

înaintea      lui

*elem2*)

**0**      0

Un      întreg

pozitiv (>0)

**\*elem1 == \*elem2**

**\*elem1 > \*elem2**

*Qsort* nu returnează nimic.

În continuare se vor prezenta comparativ, exemplificându-se la nivel de instrucțiune, secvențe din codul sursă **.c** (de nivel înalt) versus **.s** (asamblare) al aplicației **qsort.[c,s]**.

\*\*\*\*\*Secvență de cod din **qsort.c**\*\*\*\*\*

```
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
```

```
char list[5][4] = { "cat", "car", "cab",
"cap", "can"};
int sort_function(const void *a,
const void *b)
{
    return( strcmp((char *)a,(char *)b));
}
```

\*\*\*\*\*Secvență de cod din **qsort.s**\*\*\*\*\*

```
.globl    list
.data
.align   2
list:
.ascii   "cat\000"          # stocarea în zona de date a adreselor de mesaje:
                           # elementele de tablou care vor fi sortate.
.ascii   "car\000"
.ascii   "cab\000"
.ascii   "cap\000"
.ascii   "can\000"
...
.text
.align   2
.globl   main
.align   2
.globl   sort_function__FPCvT0      # adresa funcției de sortare
.text
.ent     main
main:
subu    $sp,$sp,32           # alocare spațiu pe stivă
sw      $31,28($sp)         # salvare # adresa de revenire în programul apelant -
                           # $31 (sistemul de operare)
sw      $fp,24($sp)
move   $fp,$sp
jal    _main
la     $4, list              # pregătire parametrii de apel $4 – adresa tabloului de
                           # sortat
li     $5,0x00000005          # $5 <- 5 = numărul de elemente al tabloului
li     $6,0x00000004          # $6 <- 4 = dimensiunea în octeți a fiecărui element de
                           # tablou
la     $7,sort_function__FPCvT0 # $7 <- adresa funcției folosită de către qsort în apelul său
```

```

jal      qsort          # la apelul unei funcții primii 4 parametrii de apel sunt
                    # salvați în regiștri $4 ÷ $7 restul, dacă e
                    # cazul sunt depuși pe stivă [Flor03]. Funcția qsort este
                    # precompilată.

sw      $0,16($fp)
...
$L36:
move   $sp,$fp          # sp not trusted here
lw      $31,28($sp)
lw      $fp,24($sp)
addu   $sp,$sp,32
j      $31
.end
.main
.ent   sort_function__FPCvT0

sort_function__FPCvT0:
subu   $sp,$sp,24
sw      $31,20($sp)
sw      $fp,16($sp)
move   $fp,$sp
sw      $4,24($sp)
sw      $5,28($sp)
lw      $4,24($fp)
lw      $5,28($fp)
jal    strcmp           # salvare pe stivă a parametrilor de apel în cadrul rutinei
                    # apelate indirect prin qsort – adresa și
                    # numărul de elemente al tabloului

                    # apel funcție de bibliotecă pentru compararea a două
                    # siruri de caractere
move   $3,$2
move   $2,$3
...
$L41:
move   $sp,$fp
lw      $31,20($sp)
lw      $fp,16($sp)
addu   $sp,$sp,24
j      $31
.end   sort_function__FPCvT0

```

Codul asamblare nu prezintă nici un apel indirect de funcții de bibliotecă (*jal qsort, jal strcmp*). La analiza codului obiect însă (după link-editarea sursei cu bibliotecile în cauză) au rezultat 11 apeluri statice indirekte care au generat **61** apeluri dinamice indirekte.

## 12.6. TABLOURI. RELAȚIA DINTRE POINTERI ȘI TABLOURI

**Tabloul unidimensional** reprezintă o zonă **contiguă** de memorie care stochează elemente de același tip și este alocată static în zona (segmentul la procesoarele Intel) de date, fapt ce implică necesitatea cunoașterii numărului

de elemente al tabloului în momentul compilării. Spațiul alocat pentru tablou este egal cu produsul dintre numărul de elemente și dimensiunea tipului de dată corespunzător fiecărui element component. Datorită faptului că în C/C++ numele tabloului reține chiar adresa primului element, indicii tabloului vor începe de la zero (spre deosebire de limbajul Pascal unde indicii încep de la unu). Exemple de tablouri: lista numerelor de telefon, alfabetul, etc. Expresia  $a[4]$  referă al 5-lea element al tabloului  $a$ .

În C, există o strânsă legătură între pointeri și tablouri. Când se folosesc numele unui tablou (fără indicii), el reprezintă un pointer către primul element al tabloului. Astfel, în C se pot transmite tablouri ca parametri în funcții (se transmite adresa de început a tabloului). Alt avantaj al tratării unitare pointer-tablou este aplicarea aritmeticăi pointerelor pentru accesarea elementelor unui tablou. Identitatea pointer-tablou se observă cel mai bine în operațiile cu siruri de caractere, unde sirul de caractere este un tablou de caractere sau un pointer la caracter.

În continuare sunt prezentate aspecte ale echivalenței pointer – tablou. Se consideră declarațiile:

```
char cuvant[5];
char *tablou_ptr;
```

De exemplu atribuirea  $tablou\_ptr = cuvant$  este corectă din punct de vedere sintactic întrucât  $tablou\_ptr$  pointează la  $cuvant[0]$ , deci spre începutul zonei de memorie unde este stocat tabloul de caractere (echivalentă de asemenea cu  $tablou\_ptr = &cuvant[0]$ ). Pornind de la declarațiile de mai sus, în tabelul următor, pe fiecare linie, expresiile date sunt echivalente:

| Echivalențe pointer – tablou |                 |               |
|------------------------------|-----------------|---------------|
| tablou_ptr                   | cuvant          | $\&cuvant[0]$ |
| $(tablou\_ptr + n)$          | $cuvant + n$    | $\&cuvant[n]$ |
| $*tablou\_ptr$               | $*cuvant$       | $cuvant[0]$   |
| $*(tablou\_ptr + n)$         | $*(cuvant + n)$ | $cuvant[n]$   |

Pentru a accesa elementele tabloului  $cuvant[5]$  (sirul de caractere), se incrementează valoarea pointerului, astfel dacă  $tablou\_ptr = cuvant$ ; atunci  $*(tablou\_ptr++)$  va returna valoarea lui  $cuvant[0]$ , după care  $tablou\_ptr$  va indica spre  $cuvant[1]$ . Trebuie avut în vedere că expresia  $*(tablou\_ptr++)$  este diferită de  $(*tablou\_ptr)++$ , care va incrementa valoarea spre care indică  $tablou\_ptr$ , returnând astfel caracterul de cod ASCII ( $tablou[0]+1$ ).

Există însă și diferențe între pointeri și tablouri. Dacă un pointer poate fi incrementat, el indicând spre altă locație, nu același lucru se poate face cu un tablou (adresa sa este cunoscută la compilare și nu se poate modifica pe parcursul execuției programului). Astfel, este posibilă expresia *tablou\_ptr=tablou\_ptr+1*, dar *cuvant* va fi tot timpul un pointer constant pe durata execuției programului.

### **Aplicație 3:** Relația dintre pointeri și tablouri.

```
#include <stdio.h>
void main(void)
{
    int t[4]={0, 1, 2, 3};
    int *p=&t[1];           /* se declară p de tip pointer la int și apoi se
                           initializează cu adresa lui t[1] – al doilea
                           element al tabloului t */

    printf("%d\n", *p++);
    /* Operatorulunar * are prioritate în fața
       operatorului de postincrementare ++ => se
       afiseaza valoarea lui t[1] și adresa lui p este
       incrementată pentru a indica pe următorul
       element al tabloului, adică pe t[2] */

    printf("%d\n", *++p);
    /* Este incrementată adresa, deci p va pointa pe
       t[3] => se va afisa valoarea lui t[3] */

    printf("%d\n", ++*p);
    /* afiseaza valoarea incrementată a lui t[3].
       Incrementarea are loc asupra continutului
       locației de memorie și nu asupra adresei */
}
```

### **Aplicație 4:** Echivalența C – LC-3 în cazul aplicațiilor cu tablouri.

```
int main()
{
    int x, grid[10];
    x=grid[3]+1;
    grid[6]=5;
}

, x=grid[3]+1;
```

|                                                                  |                                                                                                                                                                                                                                  |
|------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| ADD R0, R6, #4 ;                                                 | Adresa de bază a tabloului (numele acestuia) de pe stiva de date aferentă funcției main() este scrisă în R0                                                                                                                      |
| ADD R1, R0, #3 ;                                                 | Se calculează adresa elementului grid[3] și se depune în R1                                                                                                                                                                      |
| LDR R2, R1, #0 ;<br>ADD R2,R2,#1;<br>STR R2,R6,#3;               | Se introduce în R2 valoarea elementului grid[3]<br>Se incrementează valoarea lui R2 (grid[3] + 1);<br>Se introduce noua valoare a lui R2 în locația corespunzătoare lui x pe stiva de date aferentă funcției main (x=grid[3]+1); |
| ; grid[6]=5;<br>AND R2,R2,#0;<br>ADD R2,R2,#5;<br>ADD R0,R6,#4 ; | Inițializare R2=0<br>R2=5<br>Adresa de bază a tabloului (numele acestuia) de pe stiva de date aferentă funcției main() este scrisă în R0                                                                                         |
| ADD R1,R0,#6 ;                                                   | Se calculează adresa elementului grid[6] și se depune în R1                                                                                                                                                                      |
| STR R2,R1,#0 ;                                                   | Se scrie valoarea 5 din R2 la locația grid[6]                                                                                                                                                                                    |

### 12.6.1. FUNCȚII CU PARAMETRI DE TIP TABLOU (VECTOR)

Întrucât transmiterea tablourilor (vectorilor) ca parametrii funcțiilor este un lucru extrem de util în aplicații, există două posibilități de a-l realiza [Patt03]:

- a) transferul fiecărui element al vectorului (dezavantajos din punct de vedere al spațiului ocupat pe stiva de date aferentă funcției apelate, dar și din punct de vedere al timpului de execuție – mai ales în cazul tablourilor cu număr foarte mare de elemente).
- b) transmiterea unei referințe la tablou (numele acestuia).

În cazul apelurilor de funcție în care parametrul efectiv este numele unui tablou, apelul se face prin referință. În acest caz, se transferă valoarea numelui tabloului, adică adresa primului său element. Dispunând de adresa de început a tabloului utilizat ca parametru, funcția apelată poate modifica elementele tabloului respectiv.

În continuare se prezintă un exemplu de funcție având ca parametru un tablou. Programul principal citește de la tastatură un tablou de numere întregi și apelează o funcție care, având ca argument numele respectivului tablou, determină media aritmetică a elementelor din tablou.

```
#include <stdio.h>
#define MAX_NUMS 10

int Average(int input_values[]);

int main()
{
    int index; /* Variabilă contor folosită în bucla for */
    int mean; /* media aritmetică a numerelor */
    int numbers[MAX_NUMS]; /* Declarația inițială a tabloului de numere */

    /* Introducerea numerelor de la tastatură */
    printf("Enter %d numbers.\n", MAX_NUMS);
    for (index = 0; index < MAX_NUMS; index++) {
        printf("Input number %d : ", index);
        scanf("%d", &numbers[index]);
    }
    mean = Average(numbers);
    printf("The average of these numbers is %d\n", mean);
}

int Average(int inputValues[])
{
    int index;
    int sum = 0;
    for (index = 0; index < MAX_NUMS; index++) {
        sum = sum + inputValues[index];
    }
    return (sum / MAX_NUMS);
}
```



Figura 12.4. Imaginea zonei de activare imediat după apelul funcției `Average()`

## 12.7. EXERCIȚII ȘI PROBLEME

1. Ce tipărește următoarea secvență:

```
int m[7]={3,6,4,2,8,9,0}, *p, *q; p=&m[3]; q=++p-2;
cout<<*q<<" "<<*(p+2)<<" "<<*p<<" "<<p-q;
```

- a. 4 0 8 2      b. 2 2 3 -2      c. 8 4 3 0      d. 4 0 8 -2      e. 2 4 3 4

2. Fie declarațiile `int x[10], *p;` Care din următoarele atribuiri este corectă ?

- a. `x=p;`      b. `x[10]=p;`      c. `p=x[10];`      d. `p=*x[10];`      e. `p=x;`

3. Cunoscând codul ASCII a literei 'A'=65, ce afișează secvența:

int x=2; char c='A'; c=c+x; cout<<c;

- a. 67      b. C    c. nici o variantă corectă      d. c    e. eroare: în C nu se poate aduna un caracter cu un număr.

4. Fie declarațiile void f(int a, float &b){a++;b=b+1;} Ce va afișa următorul program:

void main() {int x=1; float y=1.1; f(x,y); cout<<x<<' '<<y;}

- a. 2 2.1    b. 1 2.1    c. apel eronat    d. sintaxă greșită    e. 1 1.1

5. Ce va afișa programul următor:

```
#include<stdio.h>
void main(void)
{
    int *p,*q;

    p = new (int);
    q = new (int);
    *p = 7;
    *q = *p;
    if(p==q)
        (*p)++;
    else
        (*q)++;
    printf("%d , %d",*p,*q);
}
```

Care este rezultatul afișat de programul anterior dacă instrucțiunea if se înlocuiește cu if (\*p== \*q)?

6. Se consideră următoarea secvență de cod:

```
#include<stdio.h>
int z,t,*p;
void main(void)
{
    z = 7;
    p = &z;
    p++;
    *p = 19;
    *--p = 24;
```

```

printf("z= %d p= 0x%x continutul locatiei spre care pointeaza p
(*p)=%d t=%d",z,p,*p,t);
}

```

Considerând că registrul R5 (pointerul spre începutul zonei de date globale are valoarea x4000) să se ilustreze conținutul locațiilor x4000, x4001, x4002 și x4003 după execuția fiecărei instrucțiuni din program. Determinați ce se afișează pe ecran la finalul execuției programului ?

| Adresă memorie | Conținut |
|----------------|----------|
| x4000          |          |
| x4001          |          |
| x4002          |          |
| x4003          |          |

7. Ce afișează următoarele secvențe de cod C++:

a)  

```
#include<iostream.h>
```

```

void main()
{
    char v[]={'a','b','c','\0'};
    char *p=&v[0];
    while (*p)
    {
        cout<<p<<" ";
        p++;
    }
}
```

b)  

```
#include<iostream.h>
```

```

int a=1,c=8,*p;
void main()
{
    p=&a;
    a=*p++;
    cout<<a<<' '<<*p<<endl;
    a=(*p)++;
    cout<<a<<' '<<*p;
}
```

Ce va afișa programul în cazul secvenței *b* dacă declarațiile variabilelor se fac local funcției main() și nu global ? Ce modificări trebuie să adușe programului pentru a afișa același lucru ca în cazul inițial (cu declarațiile globale). Indicație: pe un sistem cu procesor Intel, organizarea memoriei presupune că stiva de date aferentă funcțiilor crește (în conținut și capacitate) de la adrese mari spre adrese mici (variabilele succese sunt stocate la adrese care descresc).

8. Translați din C în limbaj de asamblare LC-3 codul sursă al funcției main() de mai jos.

```
main()
{
    int a[5], i;
    i=4;
    while(i>=0){
        a[i]=i;
        i--;
    }
}
```

9. În secvența de cod următoare funcția main() apelează funcția *triple()*. Care este necesarul minim de memorie pentru zona de activare aferentă funcției *triple*? Dar pentru zona de activare aferentă funcției *main*?

```
main()
{
    int array[3];
    array[0]=1;
    array[1]=2;
    array[2]=3;
    triple(array);
}
```



## BIBLIOGRAFIE

[Ack89] Ackoff, R. L., *From Data to Wisdom*, Journal of Applies Systems Analysis, Volume 16, 1989 p 3-9.

[Aho86] Aho A., Sethi R., Ullman J. – *Compilers, Principles, Techniques and Tools*, Adison Wesley Publishing Comp. 1986.

[Bel04] Bellinger G., Castro D., Mills A., *Data, Information, Knowledge, and Wisdom*, 2004, <http://www.systems-thinking.org/dikw/dikw.htm>.

[Bud99] Budiu M., *Teoria complexității*, <http://www.cs.cmu.edu/~mihai/>

[Chi04] Chitoșca M., *Internetul ca agent de socializare al „Generației M”*, <http://www.ris.uvt.ro/numarul52006/mariuschitosca.pdf>.

[Clc04] *Circuite logice combinaționale*, 2004, <http://cid2004.3x.ro/>

[Cor90] Cormen, T. H., Leiserson, C. E., Rivest, R. L. – *Introduction to Algorithms*. McGraw-Hill, New York, 1990.

[Fil97] Filipescu V., Garaiman D., *Circuite electronice digitale. Îndrumar de laborator*, Reprografia Universității din Craiova, 1997.

[Flo03] Florea A., Vințan L. – *Simularea și optimizarea arhitecturilor de calcul în aplicații practice*, Editura MatrixROM, București, 2003.

[Flo05] Florea A. – *Predicția dinamică a valorilor în microprocesoarele generației următoare*, Editura MatrixROM, București, 2005.

[Gol97] Golomety A. – *Proiectarea Translatoarelor*, Editura Universității "Lucian Blaga", Sibiu, 1997.

[Gor05] **Gorgan D., Sebestyen-Pal Gh.**, *Computer Design*, Editura albastra, Cluj-Napoca, ISBN 973-650-123-X, 2005.

[Katz05] **Katz R. H., Borriello G.**, *Contemporary Logic Design (2nd Edition)*, Prentice Hall, 2005.

[LC-3] Little Computer v.3. –  
[www.ece.utexas.edu/~ambler/ee306/Software&Doc/LC3WinGuide.pdf](http://www.ece.utexas.edu/~ambler/ee306/Software&Doc/LC3WinGuide.pdf)

[Lica06] **Lica D. s.a.** – *Fundamentele programării*, Editura L&S Soft, București, 2006.

[Log06] **Logofătu D.** – *Bazele programării în C. Aplicații*, Editura Polirom, Iași, 2006.

[Lun05] **Lungu V.** *Procesoare INTEL, Programare în limbaj de asamblare*, Ediția a II-a, Editura Teora, București, 2005.

[Mâr96] **Mărșanu Radu** – *Sisteme de calcul*, Manual pentru licee de informatică, cls. IX-a, Editura Didactică și Pedagogică, București, 1996.

[Min82] **Minsky M.**, *Why People Think Computers Can't*, AI Magazine, vol. 3, no. 4, Fall 1982,  
<http://web.media.mit.edu/~minsky/papers/ComputersCanThink.txt>.

[Mus97] **Muscă Gh.**, *Programare în limbaj de asamblare*, Editura Teora, București, 1997.

[Neg97] **Negrescu L.** – „*Limbajul C. Manual pentru clasa a XI-a*”, Editura Computer Libris Agora, 1997.

[Nic04] **Niculae C.M.**, *Componente fundamentale*, 2004,  
[http://fpce9.fizica.unibuc.ro/telecom/componente\\_fundamentale.htm](http://fpce9.fizica.unibuc.ro/telecom/componente_fundamentale.htm)

[Pal07] **Palsetia D.**, *Digital Systems Organization and Design*, 2007  
<http://www.cis.upenn.edu/~palsetia/cit595s07/>

[Pat05] **Patterson D., Hennessy J.** – *Computer Organisation and Design: The Hardware/Software Interface*, Third Edition, Elsevier, 2005, ISBN: 1-55860-604.

- [Patt03] **Patt Y., Patel S.** – *Introduction to Computing Systems: from bits & gates to C & beyond*, McGraw-Hill Higher Education, 2<sup>nd</sup> edition, 2003.
- [Pop86] **Pop V.** – *Analiza și sinteza dispozitivelor numerice*. Curs litografiat, Institutul Politehnic Timișoara, 1986, vol. I și II.
- [Sch95] **Schildt H.** – *C++ – manual complet*, McGraw-Hill Higher Education, 1995.
- [Seb] **Sebestyen-Pal Gh.**, *Arhitectura calculatoarelor*,  
[http://users.utcluj.ro/~sebestyen/\\_Word\\_docs/Cursuri/](http://users.utcluj.ro/~sebestyen/_Word_docs/Cursuri/)
- [Sha48] **Shannon C.E.**, *A Mathematical Theory of Communication*, Bell System Technical Journal, vol. 27, pp. 379-423, 623-656, July, October, 1948.
- [Sto98] **Stoilescu D.** – „*Colegere de C / C++*. Fișe de probleme”, Editura Radial, Galați, 1998.
- [Vin00] **Vințan N. L., Florea A.** – *Microarhitecturi de procesare a informației*, Editura Tehnică, București, ISBN 973-31-1551-7, 2000.
- [Vin03] **Vințan L.** – *Organizarea și proiectarea microarhitecturilor*, 2003,  
<http://webspace.ulbsibiu.ro/lucian.vintan/html/Organizarea.pdf>
- [Wik] <http://en.wikipedia.org/wiki/>
- [Zah04] **Zaharia M.H., Leon F.** – *Limbajul C de la Zero la Student*, Editura Politehnium Iasi, 2004.