

## Sommario

|                                                        |           |
|--------------------------------------------------------|-----------|
| <b>Teorema di Böhm-Jacopini</b>                        | <b>2</b>  |
| <b>Diagrammi Nassi-Shneiderman</b>                     | <b>3</b>  |
| Sequenza                                               | 3         |
| Selezione                                              | 3         |
| Iterazione                                             | 3         |
| <b>ARM</b>                                             | <b>4</b>  |
| cos'è ARM?                                             | 4         |
| Struttura ARM                                          | 4         |
| I registri ARM                                         | 5         |
| <b>Particolarità ARM</b>                               | <b>9</b>  |
| <b>Big endian e LittleEndian</b>                       | <b>9</b>  |
| <b>Modalità di indirizzamento</b>                      | <b>9</b>  |
| Modalità base                                          | 9         |
| Indirizzamento per le istruzioni load/store:           | 10        |
| Mod Indicizzate                                        | 12        |
| <b>Istruzioni di elaborazione e trasferimento dati</b> | <b>13</b> |
| <b>barrel shifter o switch</b>                         | <b>13</b> |
| Logical shift left (LSL)                               | 14        |
| Logical shift right (LSR)                              | 15        |
| Arithmetic shift right (ASR)                           | 16        |
| Rotate right (ROR)                                     | 17        |
| Rotate right with extend (RRX)                         | 18        |
| Rotate left con estensione                             | 19        |
| <b>Istruzioni aritmetiche e logiche</b>                | <b>19</b> |
| Codici Mnemonici:                                      | 20        |
| Esempi istruzioni aritmetico-logiche                   | 21        |
| Indirizzamento Immediato                               | 21        |
| Indirizzamento con shift immediato e shift a registro  | 23        |
| Indirizzamento a registro                              | 23        |
| <b>Istruzioni aritmetiche con saturazione</b>          | <b>23</b> |
| <b>Istruzioni di confronto</b>                         | <b>24</b> |
| <b>Istruzioni di moltiplicazione</b>                   | <b>24</b> |
| Moltiplicazione a due operandi                         | 24        |
| Moltiplicazione a tre operandi                         | 25        |
| Moltiplicazione con risultato doubleword               | 26        |
| <b>Istruzioni di trasferimento dati</b>                | <b>27</b> |
| <b>Istruzioni SIMD</b>                                 | <b>27</b> |

|                                                         |           |
|---------------------------------------------------------|-----------|
| <b>Istruzioni di branch</b>                             | <b>32</b> |
| <b>Istruzione di Load e Store</b>                       | <b>32</b> |
| Esempi istruzioni di load e store                       | 33        |
| istruzione di load e store su byte, word o doubleword   | 34        |
| istruzioni di load e store su registro multipli         | 34        |
| istruzioni di accesso esclusivo alla memoria            | 35        |
| <b>Istruzioni di accesso ai registri di stato</b>       | <b>35</b> |
| <b>Istruzioni verso i coprocessori</b>                  | <b>36</b> |
| Istruzioni di elaborazione dati                         | 36        |
| Istruzioni di trasferimento dati in memoria             | 36        |
| Istruzioni di trasferimento dati tra registri           | 37        |
| <b>Istruzioni per generare eccezioni</b>                | <b>38</b> |
| software interrupt                                      | 38        |
| breakpoint software                                     | 38        |
| <b>Istruzioni per il packing e l'unpacking dei dati</b> | <b>38</b> |
| packing                                                 | 38        |
| unpacking                                               | 39        |
| <b>istruzioni di saturazione</b>                        | <b>39</b> |
| <b>istruzione di conteggio degli zeri finali</b>        | <b>39</b> |
| <b>istruzioni di inversione di byte</b>                 | <b>39</b> |
| <b>pseudo-istruzioni</b>                                | <b>40</b> |
| No Operation                                            | 40        |
| Shifting e rotazione                                    | 41        |
| Copia registro                                          | 41        |
| <b>Change Processor State</b>                           | <b>41</b> |
| <b>Store Return State onto a Stack</b>                  | <b>42</b> |
| <b>Return From Exception</b>                            | <b>43</b> |
| <b>Set Endianess</b>                                    | <b>43</b> |

## Teorema di Böhm-Jacopini

Il teorema di Böhm-Jacopini, enunciato nel 1966 da due informatici italiani dai quale prende il nome, afferma che:

«qualunque algoritmo può essere implementato utilizzando tre sole strutture, **la sequenza, la selezione e l'iterazione**, che possono essere tra loro innestati fino a giungere ad un qualsivoglia livello di profondità finito (come le scatole cinesi)».

Questo serve per evitare la **programmazione a spaghetti (spaghetti code)** che è un termine dispregiativo per il codice sorgente di quei programmi per computer che hanno una struttura di controllo del flusso complessa e/o incomprensibile, con uso esagerato ed errato di go to, eccezioni, thread e altri costrutti di branching (diramazione del controllo) non strutturati.

## Diagrammi Nassi-Shneiderman

I *Diagrammi di Nassi-Shneiderman*, anche detti **DNS**, sono strumenti semplici che si usano per scrivere algoritmi intrinsecamente strutturati e complessi.

Si collegano al TH Bohm-Jacopini., associando infatti questo teorema al formalismo ideato da Isaac Nassi e Ben Shneiderman, si ottengono appunto i DNS

I concetti di sequenza, iterazione, selezione possono essere espressi, all'interno del diagramma, in blocchi che possono essere innestati e composti a piacere fino a giungere ad un qualsiasi livello di profondità.

### Sequenza

Si esprime il concetto che ogni procedimento risolutivo si può comporre attraverso un insieme finito di passaggi, o di blocchi, che verranno eseguiti nell'ordine dall'alto verso il basso, senza la possibilità di saltare la valutazione di un passaggio intermedio.

### Selezione

è il concetto attraverso il quale il percorso del flusso di esecuzione può prendere differenti cammini a seconda della condizione espressa in testa al blocco.

Può essere:

1. *Singola* : se la condizione è verificata viene eseguito un blocco, altrimenti si esce e si prosegue il flusso di esecuzione(**if-then** o **if-else**)
2. *Binaria* : se la condizione è verificata viene eseguito il blocco **then**, altrimenti il blocco **else(if-then-else)**
3. *Multipla* : controlla il valore di una variabile all'interno di un intervallo di valori predefiniti. Quando la variabile corrisponde a uno dei valori della selezione, viene seguito il blocco ad esso associato, altrimenti viene eseguito il blocco di default(**switch**)

### Iterazione

Si esprime la possibilità di ripetere l'esecuzione di un blocco interno fino a quando non si verificherà la condizione di uscita, per questa ragione è di uso comune denominarlo anche "ciclo". Esistono tre tipologie: **for**, **while**, **do-while**

Quando si sa a priori il numero di ripetizioni da eseguire, si usa il **for**

Quando c'è la possibilità che il blocco non venga mai eseguito, o l'iterazione è funzione di un evento non noto, si usa il **while**

Quando l'iterazione dipende da un evento non noto, ma il blocco deve essere eseguito almeno una volta, si usa il **do-while**

## ARM

### cos'è ARM?

- l'architettura ARM definisce una famiglia di microprocessori di tipo RISC (Poche e semplici istruzioni per massimizzare il throughput delle istruzioni).
- dal punto di vista circuitale è estremamente semplice rispetto a un CPU tradizionale e quindi richiede un numero minore di transistor e di silicio questo porta ad essere più economico sul mercato ed ha un basso consumo energetico rispetto alle sue prestazioni. (questa architettura si trova diffusa su cellulari, tablet, console, portatili, elettrodomestici e televisori)
- inoltre deve eseguire l'elaborazione dei dati direttamente nel processore senza intervento della memoria e quindi accede in memoria solo per operazioni di lettura e scrittura.

### Struttura ARM

- è una architettura RISC a 32 bit con uno spazio di indirizzamento di 32 bit e la memoria è indirizzabile al singolo byte, a 16 bit (halfword) o 32 bit (word) dove il ARM può indirizzare fino a  $2^{32}$  bit



- l'organizzazione interna di ARM prevede l'utilizzo di 3 registri:
  1. **RD**: registro destinazione dove verrà scritto il risultato
  2. **RN**: registro sorgente che contiene il primo operando ed è utilizzato direttamente
  3. **RM**: registro sorgente che contiene il secondo operando ed è utilizzato dopo il passaggio nel **barrel shift** (è un circuito che può shiftare una word di numero specificato di bit in un solo ciclo di clock)



## I registri ARM

- l'architettura ARM prevede la seguente organizzazione:
  - 16 registri denominati da **R0** a **R15**
    - R0 - R12** di uso generale utilizzabili dal programmatore per realizzare applicazioni
    - R13** è lo stack pointer (**SP**) contiene l'indirizzo della locazione di memoria occupata dal inizio dello stack.
    - R14** è il subroutine link register (**LR**) cioè quel registro utilizzato per ripristinare il **PC** alla istruzione successiva alla chiamata ad una subroutine, quando quest'ultima ha terminato la sua esecuzione.
    - R15** è il program counter (**PC**) conserva l'indirizzo di memoria della successiva istruzione da eseguire.

|     |       |
|-----|-------|
| R0  | A1    |
| R1  | A2    |
| R2  | A3    |
| R3  | A4    |
| R4  | V1    |
| R5  | V2    |
| R6  | V3    |
| R7  | V4 WR |
| R8  | V5    |
| R9  | V6 SB |
| R10 | V7 SL |
| R11 | V8 FP |
| R12 | IP    |
| R13 | SP    |
| R14 | LR    |
| R15 | PC    |

- un registro di stato denominato current program status register (**CPSR**).



- il quale tiene traccia dello stato del programma. Molto utili sono i 5 bit principali di stato (detti flags di stato) i quali esprimono le seguenti condizioni aritmetiche:
  - Bit N negativo
  - Bit Z zero;
  - Bit C carry/overflow riporto
  - Bit V overflow.
  - Bit Q saturazione - impostato a 1 quando nel risultato è stato inserito un valore limite (estremo superiore o inferiore).

Sono presenti inoltre altri flag di stato cioè:

- Bit E Endian - se E=0 little-endian altrimenti se E=1 big-endian (modo di indirizzamento dei byte).
- Bit Do Not Modify, per futuri utilizzi.
- Bit Greater Than or Equal, vengono usati come flag di di maggiore di o uguale (GE).
- Bit Imprecise Data Abort enable/disable, abilita/disabilita ogni richiesta di abort dati imprecisi.
- Bit Interrupt enable/disable, abilita/disabilita ogni richiesta di interrupt a bassa priorità IRQ.
- Bit Fast Interrupt enable/disable, abilita/disabilita ogni richiesta di interrupt ad alta priorità FIQ.
- Bit di stato Thumb, il processore entra nello stato thumb e le istruzioni vengono allineate a 16 bit e il valore del PC è memorizzato nei 31 bit più significativi.

- M. Bit di stato Jazelle, il processore entra nello stato jazelle e permette il riconoscimento del byte code (Java) utilizzando un set di istruzioni a 8 bit, mantiene la modalità di accesso alla memoria a 32 bit quindi è in grado di leggere 4 istruzioni alla volta.
- N. Bit M0-M4 definiscono la mod di funzionamento del processore ARM:
- Utente - mod standard
  - Supervisor - si attiva al reset o quando il processore riceve un'istruzione di interrupt software (SWI)
  - Fast Interrupt Request - si attiva quando il bit FIQ viene asserito
  - Interrupt Request si attiva quando il bit IRQ viene asserito
  - Abort - si attiva in risposta ad una eccezione di abort
  - Undefined - si attiva quando si verifica un'eccezione dopo l'esecuzione di un'istruzione non supportata
  - System - Mod privilegiata



- 20 registri non accessibili nel modo utente/sistema e organizzati come segue:
  1. 5 registri da **R8\_FIQ** a **R12\_FIQ** attivi solo nella modalità di risposta ad una eccezione causata da un interrupt ad alta priorità
  2. 10 registri (**SP\_FIQ**, **LR\_FIQ**, **SP\_IRQ**, **LR\_IRQ**, **SP\_SVC**, **LR\_SVC**, **SP\_ABТ**, **LR\_ABТ**, **SP\_UND** e **LR\_UND**) attivi soltanto due per volta (**stack pointer** e **linker registri**) nella modalità di risposta ad un'eccezione
  3. 5 registri (**SPSR\_FIQ**, **SPSR\_SVC**, **SPSR\_ABТ**, **SPSR\_IRQ**, **SPSR\_UND**) attivo uno per volta nella modalità di risposta ad un'eccezione e che permette di salvare il contenuto del registro di stato corrente **CPSR** nel corrispondente registro sved program status register (**SPSR**)

#### Tabella delle condizioni aritmetico-logiche

| Suffisso       | Descrizione                     | Flag testato    | Condition Code |
|----------------|---------------------------------|-----------------|----------------|
| <b>EQ</b>      | Equal ( == )                    | Z = 1           | 0000           |
| <b>NE</b>      | Not Equal ( != )                | Z = 0           | 0001           |
| <b>CS / HS</b> | Unsigned maggiore uguale ( >= ) | C = 1           | 0010           |
| <b>CC / LO</b> | Unisgned minore stretto ( < )   | C = 0           | 0011           |
| <b>MI</b>      | Negativo ( < 0 )                | N = 1           | 0100           |
| <b>PL</b>      | Positivo o 0 ( >= 0 )           | N = 0           | 0101           |
| <b>VS</b>      | Overflow                        | V = 1           | 0110           |
| <b>VC</b>      | No overflow                     | V = 0           | 0111           |
| <b>HI</b>      | Unsigned maggiore stretto ( > ) | C = 1 AND Z = 0 | 1000           |
| <b>LS</b>      | Unsigned minore uguale ( <= )   | C = 0 OR Z = 1  | 1001           |
| <b>GE</b>      | Maggiore uguale ( >= )          | N = V           | 1010           |
| <b>LT</b>      | Minore stretto ( < )            | N != V          | 1011           |
| <b>GT</b>      | Maggiore stretto ( > )          | Z = 0 AND N = V | 1100           |
| <b>LE</b>      | Minore uguale ( <= )            | Z = 1 OR N != V | 1101           |
| <b>AL</b>      | Always                          | ----            | 1110           |

### Esempio registro di stato più tabella delle condizioni aritmetiche logiche



l'istruzione **ADD** verrà eseguita solo se la condizione **GT** (maggiorre stretto) sarà verificata. La condizione **GT** è identificata dal **codice 1100** nella sezione del registro chiamata **condition code**.

Esempio:

In questo esempio la condizione **LE** è verificata in quanto nel **registro di stato CPSR** i flags NZCV rispettano almeno una delle condizioni in tabella (Z = 1 OR N != V).



### Eccezioni ARM

| Priorità | Livello | Eccezione | Causa                                                       |
|----------|---------|-----------|-------------------------------------------------------------|
| Max      | 1       | Reset     | Reset hardware o software                                   |
|          | 2       | Abort     | Abort dati durante l'accesso in memoria                     |
|          | 3       | FIQ       | Interrupt ad alta priorità, <i>Fast Interrupt reQuest</i>   |
|          | 4       | IRQ       | Interrupt a bassa priorità, <i>Interrupt ReQuest</i>        |
|          | 5       | Abort     | Prefetch Abort durante la fase di fetch dell'istruzione     |
| Min      | 6       | Undefined | Istruzione non definita e software interrupt ( <b>SWI</b> ) |

## Particolarità ARM

- non esistono istruzioni di shift o rotazione di bit se non innestate all'interno di altre istruzioni di elaborazione (aritmetica, logica...) e possono essere applicate ad un solo operando
- riesce ad applicare una operazione aritmetica o logica e lo shift o di rotazione in una sola istruzione
- non esiste una istruzione per eseguire l'operazione di divisione questo viene delegato a un coprocessore che avendo un ambito di applicazione più specifico
- le istruzioni normalmente non scrivono il registro **CPSR** ma è possibile farlo tramite un suffisso **S** (forza la scrittura nel registro CPSR) aggiungendolo al codice mnemonico dell'istruzione.

## Big endian e LittleEndian

sono 2 tipi di ordinamento dei bit e dei byte.

1. Big Endian imposta i bit della word partendo da quello più significativo a quello meno significativo
2. Little Endian imposta i bit della word partendo da quello meno significativo a quello più significativo

## Modalità di indirizzamento

### Modalità base

- **a registro** - l'operando è contenuto nel registro
- **a registro con shift** - l'operando è contenuto nel registro, ma subirà un'operazione di shift o rotazione
- **immediato** - operando contenuto nella codifica dell'istruzione  
sintassi:  
[<Rn>]
- **indiretto** -  
sintassi:

$[<Rn>, \{+|-}\{<Rm>]$

esempio:

MOV R0, [R1]

Indirizzamento per le istruzioni load/store:

- **con offset immediato**

l'offset è un valore senza segno specificato nell'istruzione  
sintassi:

$[<Rn>, \#{}{+|-}{}{offset}_{12}]$

esempio:

MOV R0, #0x00000208

- **con offset a registro**

l'offset è un valore contenuto in un registro generico (con esclusione del PC o R15)  
esempio di sintassi:

$[<Rn>, \{+|-}\{<Rm>]$

esempio:

MOV R0, R1

- **con offset a registro scalato**

l'offset è un valore calcolato per traslazione o rotazione del contenuto in un registro  
generico (con esclusione del PC)

sintassi:

$[<Rn>, \{+|-}\{<Rm>, <SHIFT>]$

MOV R0, R1, LSL #4

- **assoluto**

è l'unico metodo che ha una sintassi unica:

LDR Rn, =#numero

Esempi:

|         |   |   |   |                                      |
|---------|---|---|---|--------------------------------------|
|         | 0 | v |   |                                      |
| 0 0 0 0 | x | 0 | 1 | Rm LSR #<val>                        |
| X X X X |   |   |   | Rm Logical Shift Right #<val>        |
| 0 0 0 0 | 0 | 1 | 0 | Rm ASR #0                            |
| X X X X | x | 1 | 0 | 0 oppure 0xFFFFFFFF in base a Rm[31] |
| 0 0 0 0 | 0 | 1 | 1 | Rm ASR #<val>                        |
| X X X X | 1 | 1 | 1 | Rm ARX                               |
| 0 0 0 0 | 0 | 1 | 1 | Rm Rotate Right eXtended             |
| X X X X |   |   |   | Rm ROR #<val>                        |
|         |   |   |   | Rm Rotate Right #<val>               |

Tabella 3.33: Tipologie di indirizzamento a registro con scorrimento

*Esempi*

```

; * Offset immediato
LDR R0, [R1, #2] ; R0<-memoria[R1+2]

; * Offset a registro
STR R0, [R1, R2] ; R0->memoria[R1+R2]

; * Offset a registro scalato
LDR R0, [R1, R2, LSL #3] ; R0<-memoria[R1+R2*8]

; * Pre-indiciz. immediato
STR R0, [R1, #2]! ; R0->memoria[R1+2]
; R1=R1+2

; * Pre-indiciz. a registro
LDR R0, [R1, R2]! ; R0<-memoria[R1+R2]
; R1=R1+R2

; * Pre-indiciz. a registro scalato
STR R0, [R1, R2, LSL #3]! ; R0->memoria[R1+R2*8]
; R1=R1+R2*8

; * Post-indiciz. immediato
LDR R0, [R1], #2 ; R0<-memoria[R1]
; R1=R1+2

; * Post-indiciz. a registro
STR R0, [R1], R2 ; R0->memoria[R1]
; R1=R1+R2

```



```
; * Post-indiciz. a reg. scalato
LDR R0,[R1],R2,LSL #3 ; R0<-memoria[R1]
; R1=R1+R2*8

; * ALTRI ESEMPI *****
LDREQB R2,[R5,#5] ; Se EQ allora
; R2<-primo byte memoria[R5+#5]
; azzerà altri 3 byte
; MSB di R2

STR R3, ROUTINE ; R3<-indirizzo(ROUTINE)
; per eseguire ROUTINE
; PC<-R3

ROUTINE
```

### 3.3.2 Load/store su byte, word o doubleword

inoltre per favorire l'accesso a blocchi di memoria o a strutture complesse, sono state aggiunte le modalità indicizzate (istruzioni di accesso in memoria - LOAD/STORE):

## Mod Indicizzate

- **Pre-indicizzata**

prima si calcola l'indirizzo e successivamente si scrive a registri base  
esempio di sintassi:

[<Rn>, {+|-}<Rm>]  
(! indica la pre-indicizzazione)

- **Post-indicizzata**

prima si utilizza il registro base come riferimento di memoria e dopo si aggiorna con il nuovo valore

esempio di sintassi:

[<Rn>], {+|-}<Rm>]

(come sopra spiegato qui viene utilizzato il registro base come riferimento il registro in questione è evidenziato dal essere tra parentesi quadre [ ])

- **NB:** non tutte le istruzioni di load/store possono sfruttare queste combinazioni in quanto dipende dallo spazio disponibile nei 32 bit di codifica delle istruzioni stesse

| Modo          |                  | Sintassi                                  | Semantica                                                              |
|---------------|------------------|-------------------------------------------|------------------------------------------------------------------------|
| Offset        | immediato        | [<Rn>]                                    | $indirizzo \leftarrow Rn$                                              |
|               |                  | [<Rn>, #{}{+ -}<offset <sub>12</sub> >]   | $indirizzo \leftarrow Rn \pm offset_{12}$                              |
|               | registro         | [<Rn>, {}{+ -}<Rm>]                       | $indirizzo \leftarrow Rn \pm Rm$                                       |
|               | regis. scal.     | [<Rn>, {}{+ -}<Rm>, <SHIFT>]              | $indirizzo \leftarrow Rn \pm Rm <SHIFT>$                               |
| Pre-indiciz.  | immediato        | [<Rn>, #{}{+ -}<offset <sub>12</sub> >] ! | $indirizzo \leftarrow Rn \pm offset_{12}$<br>$Rn \leftarrow indirizzo$ |
|               | registro         | [<Rn>, {}{+ -}<Rm>] !                     | $indirizzo \leftarrow Rn \pm Rm$<br>$Rn \leftarrow indirizzo$          |
|               | registro scalato | [<Rn>, {}{+ -}<Rm>, <SHIFT>] !            | $indirizzo \leftarrow Rn \pm Rm <SHIFT>$<br>$Rn \leftarrow indirizzo$  |
| Post-indiciz. | immediato        | [<Rn>], #{}{+ -}<offset <sub>12</sub> >   | $indirizzo \leftarrow Rn$<br>$Rn \leftarrow Rn \pm offset_{12}$        |
|               | registro         | [<Rn>], {}{+ -}<Rm>                       | $indirizzo \leftarrow Rn$<br>$Rn \leftarrow Rn \pm Rm$                 |
|               | registro scalato | [<Rn>], {}{+ -}<Rm>, <SHIFT>              | $indirizzo \leftarrow Rn$<br>$Rn \leftarrow Rn \pm Rm <SHIFT>$         |

## Istruzioni di elaborazione e trasferimento dati

- le istruzioni di trasferimento dati si occupano di trasferire i valori nei registri o tra registri
- presentano sintassi differenti a seconda che si tratti di un trasferimento tra registri di uso generale o che invece coinvolgono i registri di stato
- Le istruzioni di elaborazione e trasferimento dati si classificano così:
  - Istruzioni aritmetico logiche
  - Istruzioni aritmetiche con saturazione
  - Istruzioni di confronto
  - Istruzioni SIMD(Single Instruction Multiple Data)
  - Istruzioni di selezione dei byte
  - Istruzioni di moltiplicazione
  - Istruzioni di trasferimento dati

## barrel shifter o switch

è un circuito digitale che esegue lo shift di una parola binaria di un numero specificato di bit in un solo ciclo di clock. questo è possibile con una sequenza di multiplex disposti in parallelo in cui le uscite di un livello sono collegate agli ingressi dei mux adiacenti nel livello successivo



- Logical shift left (LSL)

- L'operazione **LSL** si applica a un registro sorgente e richiede un valore che determina il numero di volte in cui eseguire lo scorrimento a sinistra dei bit del registro
- a ogni passaggio viene inserito il valore zero nel bit meno significativo del registro (**LSB** least significant bit)
- lo shift a sinistra coincide col moltiplicare il valore del registro per la base (nel caso di ARM 2)
- viene ripetuta **n** volte dove permette di moltiplicare il valore del registro per  $2^n$
- l'ultimo bit più significativo che esce dal registro sorgente ovvero il bit in posizione **32-n** finisce nel flag **C** del registro **CPSR**



### LSL : Logical Left Shift



### LSL di 4 bit



- Logical shift right (LSR)
  - L'operazione **LSR** si applica a un registro sorgente e richiede un valore che determina il numero di volte in cui eseguire lo scorrimento a destra dei bit del registro
  - a ogni passaggio viene inserito il valore zero nel bit più significativo del registro (**MSB** most significant bit)
  - lo shift a sinistra coincide col dividere il valore del registro per la base (nel caso di ARM 2)
  - viene ripetuta **n** volte dove permette di dividere il valore del registro per  $2^n$
  - l'ultimo bit meno significativo che esce dal registro sorgente ovvero il bit in posizione **n-1** finisce nel flag **C** del registro **CPSR**



### LSR : Logical Shift Right



Division by a power of 2

### LSL di 4 bit



- Arithmetic shift right (ASR)

- L'operazione **ASR** si applica a un registro sorgente e richiede un valore che determina il numero di volte in cui eseguire lo scorrimento a destra dei bit del registro
- a ogni passaggio viene mantenuto il valore presente nel bit più significativo del registro (**MSB** most significant bit).
- l'operazione di shift a destra coincide col dividere per la base preservando il segno del contenuto
- viene ripetuta **n** volte dove permette di dividere il valore del registro per  $2^n$
- l'ultimo bit meno significativo che esce dal registro sorgente ovvero il bit in posizione **n-1** finisce nel flag **C** del registro **CPSR**



### ASR: Arithmetic Right Shift



Division by a power of 2,  
preserving the sign bit

ASR di 4 bit,  
valore positivo



- Rotate right (ROR)

- L'operazione **ROR** si applica a un registro sorgente e richiede un valore che determina il numero di volte in cui eseguire lo scorrimento a destra dei bit del registro
- ad ogni passaggio **LSB** finisce in posizione **MSB** senza che nessun bit si perda.
- l'ultimo bit meno significativo che esce dal registro sorgente per girare ovvero il bit in posizione **n-1** finisce nel flag **C** del registro **CPSR**



### ROR: Rotate Right



Bit rotate with wrap around  
from LSB to MSB

### ROR di 4 bit



- Rotate right with extend (RRX)
  - l'operazione **RRX** (rotate right with extend) funziona esattamente come la **ROR** ad eccezione del fatto che considera il flag **C** come estensione del registro sorgente
  - ad ogni passaggio **LSB** finisce nel flag **C** il vecchio valore del flag **C** in posizione **MSB** e tutti gli altri si spostano verso destra senza che nessun bit venga perso.



- Rotate left con estensione

- Nel barrel shifter non esiste una operazione analoga alla **RRX** che sia in grado di eseguire la rotazione di bit verso sinistra (rotate left with extend)
- si può utilizzare l'istruzione **ADCS** che produce lo stesso effetto
- **ADCS R0, R0, R0 //RLX R0**



## Istruzioni aritmetiche e logiche

- implementano le operazioni matematiche. Queste possono essere di tipo **aritmetiche** (somma, differenza, prodotto), **logiche** (operazioni booleane) o **relazionali** (comparazioni tra due valori).

- le istruzioni aritmetiche logiche operano al massimo su due operandi, possono aggiornare i flag del registro di stato

$\langle \text{MNEM} \rangle \{ \langle \text{PreCond} \rangle \} \{ \langle S \rangle \} \langle \text{Rd} \rangle, \langle \text{Rn} \rangle, \text{OP}_2$

- $\langle \text{MNEM} \rangle$  è il codice mnemonico dell'operazione (ADD per somma, SUB per sottrazione,...)
- $\langle \text{PreCond} \rangle$  è la pre-condizione (opzionale) che consente l'esecuzione dell'istruzione quando risulta verificata, altrimenti, se falsa, l'istruzione verrà semplicemente ignorata,
- $S$  (opzionale) forzare la scrittura nel registro di stato CPSR,
- $\langle \text{Rd} \rangle$  è il registro destinazione nel quale verrà salvato il risultato dell'operazione,
- $\langle \text{Rn} \rangle$  è il registro sorgente nel quale è presente il valore del primo operando,
- $\text{OP}_2$  è il secondo operando, il quale può essere un valore immediato, un altro registro oppure il risultato di una operazione di shift su un valore o un altro registro.

### Codici Mnemonici:

| OPCODE | MNEM | Descrizione                       | Semantica                                                |
|--------|------|-----------------------------------|----------------------------------------------------------|
| 0000   | AND  | Congiunzione logica               | $\text{Rd} \leftarrow \text{Rn} \cdot \text{OP}_2$       |
| 0001   | EOR  | OR esclusivo                      | $\text{Rd} \leftarrow \text{Rn} \oplus \text{OP}_2$      |
| 0010   | SUB  | Sottrazione                       | $\text{Rd} \leftarrow \text{Rn} - \text{OP}_2$           |
| 0011   | RSB  | Sottrazione invertita             | $\text{Rd} \leftarrow \text{OP}_2 - \text{Rn}$           |
| 0100   | ADD  | Somma                             | $\text{Rd} \leftarrow \text{Rn} + \text{OP}_2$           |
| 0101   | ADC  | Somma con riporto                 | $\text{Rd} \leftarrow \text{Rn} + \text{OP}_2 + C$       |
| 0110   | SBC  | Sottrazione con riporto           | $\text{Rd} \leftarrow \text{Rn} - \text{OP}_2 - \bar{C}$ |
| 0111   | RSC  | Sottrazione invertita con riporto | $\text{Rd} \leftarrow \text{OP}_2 - \text{Rn} - \bar{C}$ |
| 1110   | BIC  | Azzera bit                        | $\text{Rd} \leftarrow \text{Rn} \cdot \bar{\text{OP}}_2$ |
| 1100   | ORR  | Disgiunzione logica               | $\text{Rd} \leftarrow \text{Rn} + \text{OP}_2$           |

| Descrizione                              | Opcode | Sintassi                   | Semantica                  |
|------------------------------------------|--------|----------------------------|----------------------------|
| Addizione                                | ADD    | <b>ADD</b> Rd, R1, R2/#imm | Rd = R1 + R2/#imm          |
| Sottrazione                              | SUB    | <b>SUB</b> Rd, R1, R2/#imm | Rd = R1 - R2/#imm          |
| Moltiplicazione                          | MUL    | <b>MUL</b> Rd, R1, R2/#imm | Rd = R1 x R2/#imm          |
| Carica nel registro                      | MOV    | <b>MOV</b> Rd, R1/#imm     | Rd $\leftarrow$ R1/#imm    |
| Carica negato nel registro               | MVN    | <b>MVN</b> Rd, R1/#imm     | Rd $\leftarrow$ -(R1/#imm) |
| AND logico                               | AND    | <b>AND</b> Rd, R1, R2/#imm | Rd = R1 AND R2/#imm        |
| OR logico                                | ORR    | <b>ORR</b> Rd, R1, R2/#imm | Rd = R1 OR R2/#imm         |
| OR esclusivo                             | EOR    | <b>EOR</b> Rd, R1, R2/#imm | Rd = R1 $\oplus$ R2/#imm   |
| AND con complemento del secondo operando | BIC    | <b>BIC</b> Rd, R1, R2/#imm | Rd = R1 AND $\neg$ R2/#imm |
| Shift logico sinistro                    | LSL    | <b>LSL</b> Rd, R1, R2/#imm | Rd = R1 $\ll$ R2/#imm      |
| Shift logico destro                      | LSR    | <b>LSR</b> Rd, R1, R2/#imm | Rd = R1 $\gg$ R2/#imm      |
| Rotazione destra                         | ROR    | <b>ROR</b> Rd, R1, R2/#imm | Rd = R1 $\cup$ R2/#imm     |
| Confronto                                | CMP    | <b>CMP</b> R1, R2          | NZCV $\leftarrow$ R1 - R2  |
| Negato del confronto                     | CMN    | <b>CMN</b> R1, R2          | NZCV $\leftarrow$ R1 + R2  |

## Esempi istruzioni aritmetico-logiche

- 1) **ADD R0, R1, R2**  
Carico in R0 la somma tra il contenuto del registro R1 e del registro R2 (indirizzamento a registro).
- 2) **ADD R0, R1, #16**  
Carico in R0 la somma tra il contenuto del registro R1 e il numero decimale 16 (indirizzamento immediato).
- 3) **ADD R0, R1, #0xF**  
Carico in R0 la somma tra il contenuto del registro R1 e il numero esadecimale F (indirizzamento immediato).
- 4) **ADDLT R0, R1, R2**  
Carico in R0 la somma tra il contenuto del registro R1 e del registro R2 solamente se la condizione indicata con il suffisso LT è verificata
- 5) **ADDS R0, R1, R2**  
Carico in R0 la somma tra il contenuto del registro R1 e del registro R2, inoltre carico lo stato del risultato nei flags NZCV del registro di stato CPSR. Per esempio, se il risultato della somma va in overflow i flag C (carry) e V (overflow) verranno settati a 1

## Indirizzamento Immediato

Si hanno a disposizione solo 12 bit su 32 che costituiscono la word dell'istruzione, quindi si potrebbero rappresentare soltanto i numeri che vanno da 0...+4095 oppure da -2048...+2047. Questo limite non è accettabile perchè il processore ARM gestisce valori che hanno un campo di variazione da 0x00000000 a 0xFFFFFFFF. Vengono memorizzati nei 12 bit due campi: **posizione** (4 bit) e **valore** (8 bit)

Il numero descritto è ottenuto per traslazione, verso destra, dei bit del campo valore per un numero di posizioni *pari* al doppio del campo posizione

Questo implica che si possono esprimere tutti i valori che hanno in binario bit 1 a distanza massima, o al più uguale, ad 8 che possano essere ottenuti per traslazione in pos pari

in generale :

1. convertire il valore in binario e verificare che il bit 1 più significativo e ultimo bit 1 meno significativo siano a distanza massimo di 8 (compresi il primo bit 1 più significativo e ultimo bit 1 meno significativo)
  2. verificare che il numero di zeri sia pari
    - il codice binario anche se in riga vanno immaginati come scritti su un cerchio perciò anche se 0xA000000A sembra non indirizzabile perchè in binario è 101000000000000000000000000000001010 e sembra non rispettare i nessuno dei due punti in realtà **101000000000000000000000000000001010** le parti evidenziate sono come nelle mappe K vicine tra di loro

Esempio:

1. **#0x00000408** = 0000000000000000000000000000000010000001000 rispetta il punto 1 ma non il punto 2 **00000000000000000000000010000001000** un numero di zeri dispari (*NO*)
  2. **#0x55550000** = 10101010101010000000000000000000 non rispetta il punto 1 1010101010101000000000000000000 sono a distanza 15 uno dall'altro (*NO*)
  3. **#0x00000208** = 0000000000000000000000000000000010000001000 rispetta il punto 1) 0000000000000000000000000000000010000001000 sono a distanza 7 uno dall'altro ma non il punto 2) **0000000000000000000000000000000010000001000** ha un numero di zeri dispari (*SI*)
  4. **#0x00000102** = 000000000000000000000000100000010 rispetta il punto 1 ma non il punto 2 **000000000000000000000000100000010** un numero di zeri dispari (*NO*)
  5. **#0x000000EE** = 0000000000000000000000000000000011101110 rispetta il punto 1) 0000000000000000000000000000000011101110 sono a distanza 7 uno dall'altro e rispetta il punto 2) **0000000000000000000000000000000011101110** ha un numero di zeri pari (*SI*)
  6. **#0x00002040** = 00000000000000000000000010000001000000 rispetta il punto 1 00000000000000000000000010000001000000 sono a distanza 8 uno dall'altro e rispetta il punto 2 **00000000000000000000000010000001000000** ha un numero di zeri pari (*SI*)
  7. **#0x00002009** = 10000000001001 non rispetta il punto 1 e sembra come #0xA000000A ma non è così infatti #0x00002049 in realtà sarebbe = 000000000000000010000000001001 questo ci rivela e conferma che il punto 1 non è verificato (*NO*)
  8. da **#0x00000000 - #0x0000000F** ovviamente sono indirizzabili anche se non soddisfano i due punti perchè fanno dei valori di base per ARM (ovviamente questo ragionamento si applica anche ai loro complementari)
  9. **#0xFFFFFFFF** = 11111111111111111111111111111111 è un caso speciale in quanto e il reciproco di **#0x00000000** poiché anche se non sembra rispettare i due punti fa parte dei valori di base che devono per forza esistere

## Indirizzamento con shift immediato e shift a registro

Se il bit 25 vale 0, viene scritto, nei bit 5 e 6, il tipo di shift da applicare tra quelli disponibili nel barrel shifter (LSL, LSR, ASR, ROR, RRX) mentre il bit 4 specifica il tipo di indirizzamento.

Esempi:

ADD R3, R3, R3, LSL #2 —> R3 = R3+R3\*4 INDIRIZ. CON SHIFT IMMED.

RSB R2, R2, R2, LSL # 4—> R2 = R2\*16-R2

ADD R0, R1, R2, RRX —> R0 = R1 AND RRX (R2)

ADD R0, R1, R2, LSL R3 —> R0 = R1+R2\*(2^R3)

ORR R0, R0, R2, LSL R3 —> R0 = R0 OR R2 \* (2^R3)

AND R0, R0, R2, LSR R3 —> R0 = R0 AND R2 / (2^R3)

(INDIRIZZ. CON SHIFT A REGISTRO)

## Indirizzamento a registro

il secondo operando è il registro Rm, senza che quest'ultimo subisca operazioni di shift  
Questa istruzione è un caso particolare dell'istruzione LSL con indirizzamento immediato in cui i bit non sono traslati

## Istruzioni aritmetiche con saturazione

se si utilizzano 32 bit per codificare i numeri interi con segno, l'intervallo di rappresentazione si divide in due sottoinsiemi:

- valori positivi da 1 a  $2^{32-1}$
- valori negativi da -1 a  $-2^{32-1}$

Se durante un'operazione aritmetica si ottiene un numero che eccede uno dei due limiti, il risultato potrebbe essere inserito per sbaglio nel limite opposto.

Per questo ARM usa la tecnica di aritmetica con saturazione, in cui tutte le operazioni finiscono in un dominio intero e finito di valori compresi tra un minimo e un massimo

Il flag Q del CPSR viene attivato.

Le istruzioni che supportano le operazioni aritmetiche con saturazione sono QADD e QSUB

I bit non utilizzati nella codifica dell'istruzione sono segnati con SBZ (Should Be Zero)

**<MNEM>{<PreCond>} <Rd>, <Rm>, <Rn>**

| CODE  | MNEM  | Descrizione                        | Semantica                                 |
|-------|-------|------------------------------------|-------------------------------------------|
| 10000 | QADD  | Addizione con saturazione          | $Rd \leftarrow sat(Rm + Rn)$              |
| 10100 | QDADD | Addizione con doppia saturazione   | $Rd \leftarrow sat(Rm + sat(2 \cdot Rn))$ |
| 10010 | QSUB  | Sottrazione con saturazione        | $Rd \leftarrow sat(Rm - Rn)$              |
| 10110 | QDSUB | Sottrazione con doppia saturazione | $Rd \leftarrow sat(Rm - sat(2 \cdot Rn))$ |

## Istruzioni di confronto

$\langle \text{MNEM} \rangle \{ \langle \text{PreCond} \rangle \} \langle \text{Rn} \rangle, \text{OP}_2$

| OPCODE | MNEM | Descrizione                | Semantica                                                             |
|--------|------|----------------------------|-----------------------------------------------------------------------|
| 1000   | TST  | Test bit                   | $\text{CPSR} \leftarrow \langle \text{Rn} \rangle \cdot \text{OP}_2$  |
| 1001   | TEQ  | Test uguaglianza bit-a-bit | $\text{CPSR} \leftarrow \langle \text{Rn} \rangle \oplus \text{OP}_2$ |
| 1010   | CMP  | Comparazione               | $\text{CPSR} \leftarrow \langle \text{Rn} \rangle - \text{OP}_2$      |
| 1011   | CMN  | comparazione negativa      | $\text{CPSR} \leftarrow \langle \text{Rn} \rangle + \text{OP}_2$      |

Utilizzano in input 2 operandi ma non hanno un registro destinazione, perché il loro effetto è nella scrittura del registro di stato in base al valore risultato.

Sono 4 ed hanno il seguente comportamento:

1. TST - Test Bit
2. TEQ - Test uguaglianza bit-a-bit
3. CMP - Comparazione
4. CMN - Comparazione negativa

Utilizzano lo stesso formato delle istruzioni aritmetico/logiche e quindi valgono le stesse regole per quanto riguarda le modalità di indirizzamento.

CMP si comporta come ADD, CMN come SUB, TST come AND, TEQ come EOR (Exor)

## Istruzioni di moltiplicazione

- Tutte le istruzioni di moltiplicazione accettano due o tre registri come operandi sorgente e scrivono il risultato in un registro destinato
- hanno un funzionamento molto variegato perché consentono di eseguire operazioni di moltiplicazione e somma su word e halfword con o senza segno e di scrivere il risultato in word o double word

### Moltiplicazione a due operandi

1. utilizza due operandi  $\langle \text{Rm} \rangle, \langle \text{Rs} \rangle$  come registri sorgente, mentre  $\langle \text{Rd} \rangle$  è il registro di destinazione.
2. l'indicazione del suffisso **S** forza la scrittura nel **CPSR** ed è utilizzabile solo nell'istruzione **MUL**, in tutte le altre istruzioni di moltiplicazione a due operandi non è possibile forzare la scrittura sul registro dei flag.

| MNEM   | Descrizione                   | Molt.          | Semantica                                             | Tronec.      |
|--------|-------------------------------|----------------|-------------------------------------------------------|--------------|
| MUL    | Multiply                      | $32 \times 32$ | $Rd \leftarrow Rm \cdot Rs$                           | $31 \div 0$  |
| SMULxy | Sign. Mult. Long              | $16 \times 16$ | $Rd \leftarrow Rm[x] \cdot Rs[y]$                     |              |
| SMULwy | Sign. Mult. Word              | $32 \times 16$ | $Rd \leftarrow Rm \cdot Rs[y]$                        | $47 \div 16$ |
| SMUAD  | Sign. Mult, Add<br>Dual       | $16 \times 16$ | $Rd \leftarrow Rm[B] \cdot Rs[B] + Rm[T] \cdot Rs[T]$ |              |
| SMUADX | Sign. Mult, Add<br>Dual, eXch | $16 \times 16$ | $Rd \leftarrow Rm[B] \cdot Rs[T] + Rm[T] \cdot Rs[B]$ |              |
| SMUSD  | Sign. Mult, Sub<br>Dual       | $16 \times 16$ | $Rd \leftarrow Rm[B] \cdot Rs[B] - Rm[T] \cdot Rs[T]$ |              |
| SMUSDX | Sign. Mult, Sub<br>Dual, eXch | $16 \times 16$ | $Rd \leftarrow Rm[B] \cdot Rs[T] - Rm[T] \cdot Rs[B]$ |              |
| SMMUL  | Sign. MSW Mult<br>truncate    | $32 \times 32$ | $Rd \leftarrow Rm \cdot Rs$                           | $63 \div 32$ |
| SMMULR | Sign. MSW Mult.<br>Round      | $32 \times 32$ | $Rd \leftarrow Rm \cdot Rs$                           | $63 \div 32$ |

## Moltiplicazione a tre operandi

La sintassi delle moltiplicazioni che utilizzano 3 operandi e restituiscono un risultato in word (32 bit) è:

<MNEM>{<PreCond>}{<S>} <Rd>, <Rm>, <Rs>, <Rn>

1. <Rd> è il registro di destinazione , <Rm>, <Rs> e <Rn> sono i registri sorgente cioè gli operandi.
2. Il suffisso S che consente la scrittura dei flag del registro di stato (CPSR) è ammesso solo per l'istruzione MLA

| MNEM   | Descrizione                     | Molt.          | Semantica                                                          | Trunc.       |
|--------|---------------------------------|----------------|--------------------------------------------------------------------|--------------|
| MLA    | Mult, Acc.                      | $32 \times 32$ | $Rd \leftarrow Rn \cdot Rm \cdot Rs$                               | $31 \div 0$  |
| SMLAXY | Sign. Mult. Long Acc            | $16 \times 16$ | $Rd \leftarrow Rn \cdot Rm [x] \cdot Rs [y]$                       |              |
| SMLAWY | Sign. Mult. Word Acc            | $32 \times 16$ | $<Rd> \leftarrow Rn \cdot Rm \cdot Rs [y]$                         | $47 \div 16$ |
| SMLAD  | Sign. Mult, Add acc, Dual       | $16 \times 16$ | $Rd \leftarrow Rn \cdot Rm [B] \cdot Rs [B] + Rm [T] \cdot Rs [T]$ |              |
| SMUADX | Sign. Mult, Add acc, Dual, eXch | $16 \times 16$ | $Rd \leftarrow Rn \cdot Rm [B] \cdot Rs [T] + Rm [T] \cdot Rs [B]$ |              |
| SMLSD  | Sign. Mult, Sub acc, Dual       | $16 \times 16$ | $Rd \leftarrow Rm [B] \cdot Rs [B] - Rm [T] \cdot Rs [T]$          |              |
| SMLSDX | Sign. Mult, Sub acc, Dual, eXch | $16 \times 16$ | $Rd \leftarrow Rn \cdot Rm [B] \cdot Rs [T] - Rm [T] \cdot Rs [B]$ |              |
| SMMLA  | Sign. MSW Mult Acc, trunc.      | $32 \times 32$ | $Rd \leftarrow Rn \cdot Rm \cdot Rs$                               | $63 \div 32$ |
| SMMLAR | Sign. MSW Mult Acc, Round.      | $32 \times 32$ | $Rd \leftarrow Rn \cdot Rm \cdot Rs$                               | $63 \div 32$ |
| SMMLS  | Sign. MSW Mult Sub, trunc       | $32 \times 32$ | $Rd \leftarrow Rn \cdot Rm \cdot Rs$                               | $63 \div 32$ |
| SMMLSR | Sign. MSW Mult Sub, Round       | $32 \times 32$ | $Rd \leftarrow Rn \cdot Rm \cdot Rs$                               | $63 \div 32$ |

Tabella 3.21: Istruzioni di moltiplicazione

## Moltiplicazione con risultato doubleword

La sintassi delle moltiplicazioni che utilizzano 3 operandi e restituiscono un risultato in word (64 bit) è:

<MNEM>{<PreCond>} {<S>} <RdL>, <RdH>, <Rm>, <Rs>

- Il suffisso S che consente la scrittura dei flag del registro di stato (CPSR) è ammesso solo per le istruzioni: UMULL, UMLAL, SMULL e SMLAL.

| MNEM     | Descrizione                           | Molt.          | Semantica                                                                |
|----------|---------------------------------------|----------------|--------------------------------------------------------------------------|
| UMULL    | Unsign. Mult. Long                    | $32 \times 32$ | $[RdH RdL] \leftarrow Rm \cdot Rs$                                       |
| UMLAL    | Unsign. Mult. Acc. Long               | $32 \times 32$ | $[RdH RdL] \leftarrow [RdH RdL] + Rm \cdot Rs$                           |
| UMAAL    | Unsign. Mult. double Acc. Long        | $32 \times 32$ | $[RdH RdL] \leftarrow RdH + RdL + Rm \cdot Rs$                           |
| SMULL    | Sign. Mult. Long                      | $32 \times 32$ | $[RdH RdL] \leftarrow Rm \cdot Rs$                                       |
| SMLAL    | Sign. Mult. Acc. Long                 | $32 \times 32$ | $[RdH RdL] \leftarrow [RdH RdL] + Rm \cdot Rs$                           |
| SMLALxy  | Sign. Mult. Acc. Long                 | $16 \times 16$ | $[RdH RdL] \leftarrow [RdH RdL] + Rm[x] \cdot Rs[y]$                     |
| SMLALD   | Sign. Mult, Add acc. Long, Dual       | $16 \times 16$ | $[RdH RdL] \leftarrow [RdH RdL] + Rm[B] \cdot Rs[B] + Rm[T] \cdot Rs[T]$ |
| SMLALDX  | Sign. Mult, Add acc. Long, Dual, eXch | $16 \times 16$ | $[RdH RdL] \leftarrow [RdH RdL] + Rm[B] \cdot Rs[T] + Rm[T] \cdot Rs[B]$ |
| SMLS LD  | Sign. Mult, Sub acc, Long, Dual       | $16 \times 16$ | $[RdH RdL] \leftarrow [RdH RdL] + Rm[B] \cdot Rs[B] - Rm[T] \cdot Rs[T]$ |
| SMLS LDX | Sign. Mult, Sub, acc Long, Dual, eXch | $16 \times 16$ | $[RdH RdL] \leftarrow [RdH RdL] + Rm[B] \cdot Rs[T] - Rm[T] \cdot Rs[B]$ |

## Istruzioni di trasferimento dati

Si occupano di trasferire i valori tra i registri o nei registri

La codifica delle istruzioni di trasferimento ha la medesima forma di quelle di elaborazione dati.

| OPCODE | MNEM | Descrizione                                      | Semantica                       |
|--------|------|--------------------------------------------------|---------------------------------|
| 1101   | MOV  | Carica registro con OP <sub>2</sub>              | $Rd \leftarrow OP_2$            |
| 1111   | MVN  | Carica registro con l'inverso di OP <sub>2</sub> | $Rd \leftarrow \overline{OP_2}$ |

istruzione **MOV** nel caso si utilizza un **indirizzamento immediato con offset set**  
 $[Rn, \#{}^{+|-} <offset_{12}>]$

## Istruzioni SIMD

ARM ha introdotto delle istruzioni aritmetiche che agiscono sui registri considerandoli come dei contenitori di array definiti su word (32 bit) e halfword (16 bit). Una singola istruzione è in grado di operare contemporaneamente su più dati e quindi di eseguire, per esempio, la somma degli elementi di due array di 2 o 4 elementi.



UADD R0, R2, R3 ;

$$\begin{aligned}
 R0[0] &= R2[0] + R3[0] \\
 R0[1] &= R2[1] + R3[1] \\
 R0[2] &= R2[2] + R3[2] \\
 R0[3] &= R2[3] + R3[3]
 \end{aligned}$$

La sintassi generica di una generica istruzione aritmetica SIMD è la seguente:  
 <MNEM>{<PreCond>} <Rd>, <Rn>, <Rm>

Il codice mnemonico <MNEM> si ottiene unendo due elementi:

- Il prefisso, che definisce al massimo due modalità di esecuzione dell'operazione (U=Unsigned, Q=con saturazione, H=risultati dimezzati per prevenire overflow)
- Il tipo di istruzione combinata con la dimensione del singolo elemento dell'array (ADD8, SUBB8, ADD16, SUB16, ADDSUBX e SUBBADDX)

Le possibili combinazioni di prefissi applicabili alle istruzioni SIMD sono:

| Prefisso | Aritmetica                           | bit CPSR  |
|----------|--------------------------------------|-----------|
| S        | con segno, modulo $2^8$ o $2^{16}$   | GE[0 ÷ 3] |
| Q        | con segno e con saturazione          |           |
| SH       | con segno e risultati dimezzati      |           |
| U        | senza segno, modulo $2^8$ o $2^{16}$ | GE[0 ÷ 3] |
| UQ       | senza segno e con saturazione        |           |
| UH       | senza segno e risultati dimezzati    |           |

Le istruzioni SIMD utilizzano i bit GE del CPSR come flag per i byte o le halfword dei risultati. Questo permette di utilizzarli per controllare l'esecuzione di una successiva istruzione. Per le istruzioni che operano su due halfword:

- I bit GE[2 ÷ 3] sono impostati in base al risultato dell'halfword in posizione 1 (Most Significant Halfword).
- I bit GE[0 ÷ 1] sono impostati in base al risultato dell'halfword in posizione 0 (Least Significant Halfword)

Per le istruzioni che operano su 4 byte, i bit GE[ i ] sono impostati in base al risultato del byte in posizione i con  $i = [0, 1, 2, 3]$ . Questi bit sono aggiornati se durante una operazione di addizione di numeri senza segno si raggiunge, o si supera, il massimo valore rappresentabile. La stessa cosa accade se durante un'operazione di sottrazione di numeri con segno il risultato è maggiore o uguale a 0.

Le possibili tipologie di istruzioni SIMD sono:

| Tipo    | Semantica                                                           | Elemento |
|---------|---------------------------------------------------------------------|----------|
| ADD8    | $Rd[i]=Rn[i]+ Rm[i], i \in [0,1,2,3]$                               | byte     |
| SUB8    | $Rd[i]=Rn[i]- Rm[i], i \in [0,1,2,3]$                               | byte     |
| ADD16   | $Rd[i]=Rn[i]+ Rm[i], i \in [0,1]$                                   | halfword |
| SUB16   | $Rd[i]=Rn[i]-Rm[i], i \in [0,1]$                                    | halfword |
| ADDSUBX | $Rm[0] \leftrightarrow Rm[1], Rd[1]=Rn[1]+Rm[1], Rd[0]=Rn[0]-Rm[0]$ | halfword |
| SUBADDX | $Rm[0] \leftrightarrow Rm[1], Rd[1]=Rn[1]-Rm[1], Rd[0]=Rn[0]+Rm[0]$ | halfword |

Le istruzioni SIMD dell'architettura ARM che operano su un array di 4 byte sono:

| MNEM   | Tipo | con Segno | Saturazione | Risultati/2 |
|--------|------|-----------|-------------|-------------|
| QADD8  | ADD8 | ✓         | ✓           |             |
| SADD8  |      | ✓         |             |             |
| SHADD8 |      | ✓         |             | ✓           |
| UADD8  |      |           |             |             |
| UHADD8 |      |           |             | ✓           |
| UQADD8 |      |           | ✓           |             |
| QSUB8  | SUB8 | ✓         | ✓           |             |
| SSUB8  |      | ✓         |             |             |
| SHSUB8 |      | ✓         |             | ✓           |
| USUB8  |      |           |             |             |
| UHSUB8 |      |           |             | ✓           |
| UQSUB8 |      |           | ✓           |             |

Interessante è l'istruzione USAD8 che esegue la somma dei valori assoluti delle differenze dei byte di due array, che presenta la stessa sintassi delle altre istruzioni SIMD. Esiste anche la variante del registro destinazione che permette di accumulare i risultati parziali (USADA8) in questo caso nella sintassi occorre aggiungere <Rn>.

| MNEM   | Descrizione                | Semantica                                                                     |
|--------|----------------------------|-------------------------------------------------------------------------------|
| USAD8  | Unsign. Sum Abs. Diff.     | $\langle Rd \rangle \leftarrow \sum_0^3  Rm[i] - Rs[i] $                      |
| USADA8 | Unsign. Sum Abs. Diff. Acc | $\langle Rd \rangle \leftarrow \langle Rn \rangle + \sum_0^3  Rm[i] - Rs[i] $ |

Tabella 3.16: Altre istruzioni SIMD su array di byte

Le istruzioni SIMD dell'architettura ARM che operano su array di due halfword sono:

| MNEM      | Tipo    | con Segno | Saturazione | Risultati/2 |
|-----------|---------|-----------|-------------|-------------|
| QADD16    | ADD16   | ✓         | ✓           |             |
| SADD16    |         | ✓         |             | ✓           |
| SHADD16   |         | ✓         |             |             |
| UADD16    |         |           |             | ✓           |
| UHADD16   |         |           | ✓           |             |
| UQADD16   |         |           | ✓           |             |
| QSUB16    | SUB16   | ✓         | ✓           |             |
| SSUB16    |         | ✓         |             | ✓           |
| SHSUB16   |         | ✓         |             |             |
| USUB16    |         |           |             | ✓           |
| UHSUB16   |         |           | ✓           |             |
| UQSUB16   |         |           | ✓           |             |
| QADDSUBX  | ADDSUBX | ✓         | ✓           |             |
| SADDSUBX  |         | ✓         |             | ✓           |
| SHADDSUBX |         | ✓         |             |             |
| UADDSUBX  |         |           |             | ✓           |
| UHADDSUBX |         |           |             |             |
| UQADDSUBX |         |           | ✓           |             |
| QSUBADDX  | SUBADDX | ✓         | ✓           |             |
| SSUBADDX  |         | ✓         | .           |             |
| SHSUBADDX |         | ✓         |             | ✓           |
| USUBADDX  |         |           |             |             |
| UHSUBADDX |         |           |             | ✓           |
| UQSUBADDX |         |           | ✓           |             |

Tabella 3.17: Istruzioni aritmetiche SIMD che operano su array di halfword

### Istruzioni di array (da pagina 173 a pag 175)

istruzione **DCD** crea un array abbia un formato valido cioè che nella prima word ci sia scritto il numero di elementi di cui si compone l'array la sintassi è:

DCD #valore, #valore

esempio:

V DCD 3, 2, 5, 6  
 LDR R0, =V  
 LDR R2, [R0]  
 LSL R3, R2, #4

V è una variabile con riferimento di memoria (o puntatore) relativo alla prima delle quattro word (o valori indicati)

R0 contiene l'indirizzo della prima cella della struttura (array)

R1 scorre gli elementi che compongono la struttura (array)

R2 contiene gli elementi estratti

R3 indica l'ultimo elemento della struttura (array)

## Istruzioni di branch

- Le istruzioni di **branch** (o **jump**) sono utili per il controllo del flusso di esecuzione delle istruzioni. Le principali istruzioni sono **B** (branch) e **BL** (branch with link).
- **L'istruzione B** carica nel PC (R15) l'indirizzo della prima istruzione della procedura che si desidera eseguire, causando così un salto nel flusso di esecuzione delle istruzioni. Per comodità le procedure vengono identificate univocamente con dei nomi detti **label** (o **etichetta**).
- **L'istruzione BL** è simile all'istruzione B, in più però carica nel registro LR (R14) l'indirizzo di ritorno della procedura, ovvero il valore del PC nel momento in cui viene eseguita l'istruzione BL.
- Le istruzioni di branch sono necessarie per l'implementazione di istruzioni di condizione (if-thenelse), cicli e chiamate di funzioni.
- Per calcolare l'indirizzo di arrivo, ARM fa:
  - estende il segno a 30 bit il valore presente nei 24-bit di offset
  - esegue uno shift di 2 bit per arrivare a coprire i 32 richiesti
  - aggiunge il valore del PC

## Istruzione di Load e Store

muovono dati da (load) e verso (store) la memoria principale e viceversa.

L'istruzione **LDR** (**Load Register**) carica in un registro destinatario un byte, una half word o una full word contenuta in una data locazione della memoria principale. La sintassi è:

LDR{type}{condition} dest, [pointer]  
LDR{type}{condition} dest, [pointer,offset]

Il campo **dest** è il registro destinatario nel quale caricare il contenuto prelevato dalla memoria.

Il campo **[pointer]** indica un registro puntatore il quale definisce un contenuto che punta all'indirizzo in memoria della **cella** che si desidera referenziare. È possibile inoltre definire un **offset** il quale verrà sommato al puntatore.

L'istruzione **STR** (**Store Register**) esegue esattamente l'operazione inversa di LDR; carica in memoria il contenuto di un registro **sorgente** all'indirizzo definito dal **puntatore**.

`STR{condition} source, [pointer,offset]`

## Esempi istruzioni di load e store

- 1) `LDR R0, [R1, #2]`

Carico in R0 la parola in memoria puntata dal registro R1



- 2) `LDRH R0, [R1, #2]`

Carico in R0 la HalfWord (H) 2 byte a partire dalla cella puntata dal registro R1



- 3) `STR R0, [R1]`

Carico all'indirizzo puntato da R1 la parola contenuta nel registro R0



0x01F0 = 0000 0001 1111 0000

## istruzione di load e store su byte, word o doubleword

le operazioni di load/store che agiscono su byte con segno, halfword (con o senza segno) e word (con e senza segno) la sintassi è

LDR {<Precond>} {SB|H|SH|} <Rd>, <indirizzamento>

STR {<Precond>} {H} <Rd>, <indirizzamento>

| Suffisso       | Descrizione          |
|----------------|----------------------|
| B              | Byte senza segno     |
| SB             | Byte con segno       |
| H              | Halfword senza segno |
| SH             | Halfword con segno   |
| <non indicato> | Word                 |

## istruzioni di load e store su registro multipli

le istruzioni di load/store multipli (**LDM** e **STM**) eseguono un trasferimento di un qualsiasi numero di registri da o verso la memoria questa istruzioni sono pensate per far corrispondere al registro con indice più piccolo l'indirizzo di memoria più basso e, viceversa, a quello con indice più grande l'indirizzo più alto. la sintassi delle istruzioni **LDM** e **STM** è la seguente:

<MNEM>{<Precond>} {<Modo agg>} <Rn>{!}.<registri>{^}

| Modo Aggiornamento |                                    | Memoria         |                 | Calcolo di Rn<br>PreCond · W |
|--------------------|------------------------------------|-----------------|-----------------|------------------------------|
| Sintassi           | Descrizione                        | Ind. Inizio     | Ind. Fine       |                              |
| IA                 | Increment After<br>post-incremento | Rn              | Rn+4 · NumReg-4 | Rn ← Rn+4 · NumReg           |
| IB                 | Increment Before<br>pre-incremento | Rn+4            | Rn+4 · NumReg   | Rn ← Rn+4 · NumReg           |
| DA                 | Decrement After<br>post-decremento | Rn-4 · NumReg+4 | Rn              | Rn ← Rn-4 · NumReg           |
| DB                 | Decrement Before<br>pre-decremento | Rn-4 · NumReg   | Rn-4            | Rn ← Rn-4 · NumReg           |

esempio:

LDR R7, {R1, R4, R5}

STMDB R3!, {R4-R6, R11-R12}

STMF D R13!, {R0-R10, LR}

LDMFD R13!, {R1-R5, PC}

## istruzioni di accesso esclusivo alla memoria

- queste istruzioni nascono per la sincronizzazione dei processi in ambiente multi processore basato su memoria condivisa. sono istruzioni progettate per avere il comportamento atomico richiesto nei semafori senza bloccare tutte le risorse di sistema durante le fasi di accesso alla memoria condivisa.
- l' istruzione **LDREX** carica in modo condizionale nel registro **Rd** la word presente nell'indirizzo indicato da **Rn** (**Rd←memoria[Rd]**) la sintassi è:  
**<LDREX>{<Precond>} <Rd>, [<Rn>]**
- l'istruzione **STREX** carica in modo condizionale nel registro **Rm** in memoria (**memoria[Rn]←Rm**) la sintassi è:  
**<STREX>{<Precond>} <Rd>, <Rm>, {<Rn>}**

## Istruzioni di accesso ai registri di stato

Le istruzioni per l'accesso ai registri di stato sono:

1. **MRS**(Move to Register from Status register) copia il valore del CPSR o del SPSR nell'attuale modo di funzionamento del processore, all'interno dei registri di uso generale, la sintassi è :  
**MRS {<PreCond>} <Rd>, {CPSR|SPSR}**
2. **MSR**(Move to Status register from Register) copia il contenuto di un registro o una costante in una o più ambiti del registro CPSR o del SPSR nell'attuale modo di funzionamento del processore, le sintassi:  
**MSR{<PreCond>} {CPSR|SPSR}{<ambiti>}, <Rm>**  
**MSR{<PreCond>} {CPSR|SPSR}{<ambiti>}, #<valore>**

Il campo **<ambiti>** permette di specificare attraverso una lista di caratteri in sequenza(c = controllo, x = estensione, s = stato, f = flag), quali sezioni del registro di stato devono essere sovrascritte con il contenuto del secondo operando.

| MRS - Indirizzamento indiretto con registro |                |     |       |             |          |           |               |
|---------------------------------------------|----------------|-----|-------|-------------|----------|-----------|---------------|
| 31 .. 28                                    | 27 26 25 24 23 | 22  | 21 20 | 19 18 17 16 | 15 .. 12 | 11 10 9 8 | ..... 3 2 1 0 |
| PreCond                                     | 0 0 0 1 0      | PSR | 0 0   | SBO         | Rd       | Sbz       |               |

  

| MSR - Indirizzamento indiretto con registro |                |     |       |             |          |           |                 |
|---------------------------------------------|----------------|-----|-------|-------------|----------|-----------|-----------------|
| 31 .. 28                                    | 27 26 25 24 23 | 22  | 21 20 | 19 18 17 16 | 15 .. 12 | 11 10 9 8 | ..... 4 3 2 1 0 |
| PreCond                                     | 0 0 0 1 0      | PSR | 1 0   | field.mask  | SBO      | Sbz       | Rm              |

  

| MSR - Indirizzamento immediato sui bit di flag |                |     |       |             |          |           |                 |
|------------------------------------------------|----------------|-----|-------|-------------|----------|-----------|-----------------|
| 31 .. 28                                       | 27 26 25 24 23 | 22  | 21 20 | 19 18 17 16 | 15 .. 12 | 11 10 9 8 | 7 ..... 3 2 1 0 |
| PreCond                                        | 0 0 1 1 0      | PSR | 1 0   | field.mask  | SBO      | Rotax..   | Valore          |

Il bit 25 rappresenta il tipo di operando(0 = registro, 1 = valore immediato), il bit 22 specifica il tipo di registro di stato(0 = CPSR o 1 = SPSR), il campo **field.mask**, è costituito da 4 bit, responsabile del mascheramento dei diversi ambiti dei registri di stato.

La sintassi dell'istruzione MSR permette di inserire nel campo ambito una sequenza di letterali, che corrisponde ai diversi ambiti da mascherare:

| Istruzione MSR |           | Program Status Register |               |
|----------------|-----------|-------------------------|---------------|
| bit codifica   | letterale | ambito                  | bit coinvolti |
| 16             | c         | controllo               | 7÷0           |
| 17             | x         | estensione              | 15÷8          |
| 18             | s         | stato                   | 23÷16         |
| 19             | f         | flag                    | 31÷24         |

Per esempio è divenuta obsoleta la lettura del bit E con un'istruzione MRS.  
 I bit di stato di esecuzione nel CPSR, diversi dal bit E, possono essere letti soltanto quando il processore è nello stato di debug. È stato anche introdotto un registro chiamato APSR (Application Program Status Register) che contiene i flag di stato dell'ALU e che andrebbe utilizzato per accedere modalità Utente ai flag delle condizioni.

#### Esempio

```
MRS R0      , CPSR          ; R0=CPSR (lettura stato)
BIC R0      , R0, #0x1F    ; Ripulisce mode bit
ORR R0      , R0, #0x13    ; Imposta modo Supervisor
MSR CPSR_c, R0          ; CPSR=R0 (scrittura stato)
```

## Istruzioni verso i coprocessori

- il processore ARM può richiedere ai vari coprocessori operazioni di calcolo numerico (istruzioni di elaborazione dati) mentre continua a svolgere altri compiti
- ARM può arrivare ad avere fino a 16 coprocessori che sono identificati nelle istruzioni con gli alias **P0-P15**
- Le istruzioni fanno parte del modo 5 di indirizzamento

## Istruzioni di elaborazione dati

L'istruzione CDP(Coprocessor Data Processing) consente di richiedere ad un coprocessore disponibile (tra P0...P15) di eseguire una istruzione tra quelle disponibili nel suo Instruction Set

## Istruzioni di trasferimento dati in memoria

Le istruzioni di trasferimento in memoria sono:

1. **LDC**(Load to Coprocessor)
2. **STC**(Store from Coprocessor)

LDC carica i registri del coprocessore con i dati contenuti in una sequenza contigua di locazioni in memoria.

STC memorizza in una sequenza di indirizzi di memoria contigui i dati contenuti nei registri del coprocessore

Il campo CP\_Num indica con un numero intero quale coprocessore dovrà rispondere alla chiamata

il bit L, come per le istruzioni Load/Store, indica se l'istruzione è LDC(L=1) o STC(L=0)

il bit U determina se l'offset va sommato o sottratto

i bit P e W determinano il tipo di indirizzamento

## Istruzioni di trasferimento dati tra registri

Le istruzioni di trasferimento dati tra registri sono:

1. **MCR**(Move to Coprocessor from ARM register)
2. **MCRR**(Move to Coprocessor from two ARM register)
3. **MRC**(Move to ARM register from Coprocessor)
4. **MRRC**(Move to two ARM register from Coprocessor)

**MCR** trasferisce il contenuto del registro RD del processore nel registro del coprocessore, mentre **MRC** trasferisce il contenuto dei registri del coprocessore nel registro RD del processore o nei flag del registro di stato

Nel caso di **MRC**, se viene indicato R15, l'effetto ottenuto è l'aggiornamento dell'ambito dei flag nel registro CPSR

Il bit **r/c(negato)** individua il tipo di istruzione: se 1 si tratta di MRC altrimenti di MCR per MCRR e MRRC; se il bit **r/c(negato)** vale 1 si tratta di MRRC altrimenti di MCRR

| Tipi di istruzioni                    | MNEM | Possibile comportamento                                                                      |
|---------------------------------------|------|----------------------------------------------------------------------------------------------|
| <i>Elaborazione Dati</i>              | CPD  | <i>Coprocessor Data Operations</i><br>$CRd \leftarrow OPCODE_1(CRn, OPCODE_2(CRm))$          |
| <i>Trasferimento<br/>in Memoria</i>   | LDC  | <i>Load Coprocessor Register</i><br>$CRd \leftarrow memoria[indiriz(Rn)]$                    |
|                                       | STC  | <i>Store Coprocessor Register</i><br>$memoria[indiriz(Rn \leftarrow OPCODE_1(CRd))]$         |
| <i>Trasferimento<br/>nei Registri</i> | MCR  | <i>Move to Coprocessor from ARM Register</i><br>$CRn \leftarrow OPCODE_1(Rd, OPCODE_2(CRm))$ |
|                                       | MCRR | <i>Move to Coprocessor from two ARM Registers</i><br>$CRm \leftarrow OPCODE_1(Rd, Rn)$       |
|                                       | MRC  | <i>Move to ARM Register from Coprocessor</i><br>$Rd \leftarrow OPCODE_1(CRn, OPCODE_2(CRm))$ |
|                                       | MRRC | <i>Move to two ARM Registers from Coprocessor</i><br>$Rd, Rn \leftarrow OPCODE_1(CRn)$       |

## Istruzioni per generare eccezioni

- software interrupt
  - istruzione **SWI** genera una eccezione **SWI** che porta il processore nello stato ARM e la modalità cambia in **supervisor**
  - quindi il registro **CPSR** viene salvato nel registro **SPSR\_SVC**
  - questa è la modalità attraverso la quale un processo utente invoca una system call del sistema operativo
  - sintassi:  
 $\text{SWI}\{\text{<Precond>}\} \text{ <costante}_{24}$   
L'indirizzamento è immediato
- breakpoint software
  - istruzione **BKPT** (breakpoint) è utilizzata per introdurre punti di interruzione nel codice e causare una eccezione di **prefetch abort**
  - sintassi  
 $\text{BKPT}\text{<costante}_{16}$   
L'indirizzamento è immediato

## Istruzioni per il packing e l'unpacking dei dati

- packing
  - le istruzioni per il packing dei dati sono due:
    - 1) PKHBT (pack halfword bottom top) unisce le cifre meno significative del primo operando con quelle più significative del secondo  
esempio:  
LDR R1, =0x11112222  
LDR R2, =0x33334444  
  
PKHBT R3, R1, R2 //R3=0x33332222
    - 2) PKHTB (pack halfword top bottom) unisce le cifre più significative del primo operando con quella meno significativa del secondo  
esempio:  
LDR R1, =0x11112222  
LDR R2, =0x33334444  
  
PKHBT R3, R1, R2 //R3=0x11114444

- **unpacking**

sono istruzioni che permettono di ruotare di 0, 8, 16 o 24 bit il contenuto di un registro, inoltre possono accumulare il valore ottenuto, nei vari incrementi, in un registro destinazione.

## istruzioni di saturazione

Controllano se un valore è al di fuori di un intervallo prestabilito e in questo caso di assegnare l'estremo più vicino dell'intervallo stesso  
ci sono 4 versioni di queste istruzioni, a seconda che si considerino valori con segno o meno e se agiscano su intere word o halfword

1. **SSAT(Signed Saturate)**
2. **USAT(Unsigned Saturate)**
3. **SSAT16(Signed Saturate two 16-bit values)**
4. **USAT16(Unsigned Saturate two 16-bit values)**

## istruzione di conteggio degli zeri finali

- istruzione **CLZ** (count leading zero) rientra nella categoria dell'elaborazione dati e fornisce quanti bit sono zero a partire dal bit più significativo, spostandosi verso la cifra meno significativa
- la sintassi:  
`CLZ{<Precond>} <Rd>, <Rm>`
- Esempi:  
`LDR R1, =0x0000FFFF`  
`MOV R3, #0x10000000`  
`CLZ R2, R1` // R2=0x00000010  
`CLZ R4, R3` // R4=0x00000003

## istruzioni di inversione di byte

- Queste istruzioni converte i dati dal formato little-endian a quello big-endian e viceversa
- sintassi:  
`<MNEM>{<Precod>} <Rd>, <Rm>`

| MNEM         | Nome esteso e semantica                                                                                                                                                                                           |
|--------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| <b>REV</b>   | <i>byte-Reverse word</i><br>$Rd[B_3] \leftarrow Rm[B_0]$<br>$Rd[B_2] \leftarrow Rm[B_1]$<br>$Rd[B_1] \leftarrow Rm[B_2]$<br>$Rd[B_0] \leftarrow Rm[B_3]$                                                          |
| <b>REV16</b> | <i>byte-Reverse packed 16-bit</i><br>$Rd[B_1] \leftarrow Rm[B_0]$<br>$Rd[B_0] \leftarrow Rm[B_1]$<br>$Rd[B_3] \leftarrow Rm[B_2]$<br>$Rd[B_2] \leftarrow Rm[B_3]$                                                 |
| <b>REVSH</b> | <i>byte-Reverse signed 16-bit</i><br>$Rd[B_1] \leftarrow Rm[B_0]$<br>$Rd[B_0] \leftarrow Rm[B_1]$<br>$Rd[B_2B_3] \leftarrow \begin{cases} 0xFFFF & \text{se } Rm[7]=1 \\ 0x0000 & \text{se } Rm[7]=0 \end{cases}$ |

- Esempio

LDR R1, =0x0FE10547

REV R2, R1 // R2=0x4705E10F NB: vengono girati a coppie es  
47, 05, E1 ecc

REV16 R3, R1 // R3=0xE10F4705

REVSH R4, R1 // R4=0x00004705 Halfword

## pseudo-istruzioni

- No Operation

- la pseudo-istruzione **NOP** è una operazione che non esegue alcun compito
- può essere utilizzata come segnaposto nel corpo del programma da sostituire in seguito con istruzioni attive
- può invalidare un istruzione esistente (es: un branch) per scopi di debug
- può richiedere un ciclo di clock
- in alcune circostanze il processore potrebbe rimuoverla dalla pipeline prima che raggiunga la fase di esecuzione
- ARM potrebbe tradurre NOP con:

MOV R0, R0 //nella modalità arm

oppure

MOV R8, R8 //nella modalità Thumb

- Shifting e rotazione

- ARM non dispone di istruzioni di shifting e rotazione dirette se non attraverso l'innesto all'interno di istruzioni di elaborazione dati
- l'assembler (ARM) riconosce 5 pseudo-istruzioni (**LSL**, **LSR**, **ASR**, **ROR** e **RRX**) che sono poi tradotte utilizzando l'istruzione **MOV**
- **RRX** utilizza un solo operando ed è differente dalle altre istruzioni di shift o rotate con la sintassi:  
 $\text{RRX } \{<\text{Precond}>\} \{<\text{S}>\} <\text{Rd}>, <\text{Rn}>$
- mentre per le istruzioni **LSL**, **LSR**, **ASR**, **ROR** le sintassi possibili sono:  
 $<\text{MNEM}> \{<\text{Precond}>\} \{<\text{S}>\} <\text{Rd}>, <\text{Rn}>, \text{Rs}$   
 $<\text{MNEM}> \{<\text{Precond}>\} \{<\text{S}>\} <\text{Rd}>, <\text{Rn}>, \#&\text{valore}$
- il registro **Rs** indica nel suo Byte meno significativo il numero di cifre da scorrere
- il **#valore** è un numero intero compreso tra 1 e 31

| MNEM | Descrizione                         | Semantica                                                           |
|------|-------------------------------------|---------------------------------------------------------------------|
| LSL  | <i>Shift Left</i>                   | $<\text{Rd}> \leftarrow <\text{Rn}> \ll \#&\text{valore}$           |
| LSR  | <i>Shift Right</i>                  | $<\text{Rd}> \leftarrow <\text{Rn}> \gg \#&\text{valore}$           |
| ASR  | <i>Shift Right with sign extend</i> | $<\text{Rd}> \leftarrow <\text{Rn}> \gg \#&\text{valore}$           |
| ROR  | <i>Rotate Right</i>                 | $<\text{Rd}>, \text{C} \leftarrow <\text{Rn}> \gg \#&\text{valore}$ |
| RRX  | <i>Rotate Right with eXtend</i>     | $[<\text{Rd}> \text{C}] \leftarrow [<\text{Rd}> \text{C}] \gg 1$    |

- Copia registro

- istruzione **CPY** è una pseudo-istruzione sinonima della **MOV offset a registro** ma, differentemente da quest'ultimo non ha la possibilità di impostare i flag del registro di stato (**S**) e neanche di eseguire lo shift sul secondo operando la sua sintassi risulta:  
 $\text{CPY}\{<\text{Precond}>\} <\text{Rd}>, <\text{Rm}>$

## Change Processor State

CPS (Change Processor State) è una istruzione molto duttile che **può essere utilizzata per abilitare o disabilitare le eccezioni** (FIQ, IRQ e data Abort mask) **e allo stesso tempo modificare il modo di funzionamento del processore** (Utente, FIQ, IRQ, Supervisor, Abort, Undefined e System) nel registro CPSR. La stessa istruzione si può utilizzare esclusivamente per alterare la modalità di funzionamento, senza alterare le abilitazioni sul trattamento delle eccezioni.

La sintassi dell'istruzione CPS risulta quindi:

$\text{CPS}\{\text{IE|ID}\} <\text{int\_flag}> \{&\#<\text{modo}>\}$

Il campo int\_flag indica quali bit nel registro di stato verranno abilitati o disabilitati.

| Sintassi<br>int_flag | Current Program Status Register |                        |
|----------------------|---------------------------------|------------------------|
|                      | bit                             | significato            |
| a                    | A                               | Imprecise data Abort   |
| i                    | I                               | Interrupt Request      |
| f                    | F                               | Fast Interrupt Request |

La codifica dell'istruzione è la seguente:

| 31 30 29 28 | 27 26 ..... | 22 21 20 | 19 18 | 17 | 16 | 15 .. 9 | 8 7 6 | 5 | 4 3 .. 1 0 |
|-------------|-------------|----------|-------|----|----|---------|-------|---|------------|
| 1 1 1 1     | 0 0 0 1     | 0 0 0 0  | IE_ID | M  | 0  | SBZ     | A I F | 0 | modo       |

Il campo IE\_ID permette di specificare se si tratta di un Interrupt Enable (IE\_ID=10) oppure un Interrupt Disable (IE\_ID=11). Se il bit M è asserito allora significa che l'istruzione contiene un cambio di modalità di funzionamento e pertanto negli ultimi 5 bit sarà indicato il relativo codice.

#### Esempi

```
CPSIE a,#17 ; abilita i data Abort imprecisi
; e cambia il modo FIQ
CPSID if ; disabilita le interruzioni FIQ e IRQ
CPS #31 ; imposta il modo di funzionamento a System
```

## Store Return State onto a Stack

L'istruzione **SRS** (Store Return State onto a stack), **memorizza rispettivamente il LR e SPR dell'attuale modalità di funzionamento, nelle due word successive a partire da (SP) della modalità indicata all'interno dell'istruzione**. Grazie a questa istruzione è possibile predisporre lo stato di ritorno da un exception handler su uno stack diverso da quel-

lo utilizzato automaticamente dal processore. Le due sintassi equivalenti dell'istruzione risultano:

SRS{<Modo Agg>}{<PreCond>} SP{!}, #<Modo>  
 SRS{<Modo Agg>}{<PreCond>} #<Modo>{!}

L'istruzione **SRS** si comporta come una STM che però opera sulla coppia di registri: R14 e SPSR del corrente modo di funzionamento. Utilizza la medesima modalità di aggiornamento (IA, IB, DA e DB) e utilizza come registro base il registro R13 relativo alla modalità di funzionamento indicata nel campo numerico <Modo>. Il punto esclamativo permette di aggiornare il registro base con la nuova posizione di memoria ed agisce sul bit di writeback (W). La codifica dell'istruzione SRS risulta:

|          |          |          |          |          |         |      |        |
|----------|----------|----------|----------|----------|---------|------|--------|
| 31 .. 28 | 27 26 25 | 24 .. 20 | 19 .. 16 | 15 .. 12 | 11 .. 8 | 7..5 | 4 .. 0 |
| 1 1 1 1  | 1 0 0    | PU1WO    | 1 1 0 1  | SBZ      | 0 1 0 1 | SBZ  | modo   |

Tabella 3.42: Codifica dell'istruzione SRS.

## Return From Exception

L'istruzione **RFE** (Return From Exception) **permette di ripristinare lo stato del processore salvato da una istruzione di SRS al termine dell'esecuzione di una routine di servizio di una eccezione.**

La RFE permette di caricare la coppia di registri PC e CPSR a partire dall'indirizzo contenuto in <Rn> e nella successiva word. La sintassi dell'istruzione risulta:

RFE<Modo Agg> <Rn>{!}

L'istruzione RFE si comporta come una LDM che opera sulla coppia di registri: PC e CPSR. Utilizza la stessa modalità di aggiornamento (IA, IB, DA e DB). Come per la SRS, il punto esclamativo permette di aggiornare il registro base con la nuova posizione di memoria ed agisce sul bit di writeback (W). L'istruzione è codificata nel seguente modo:

|          |          |          |          |          |         |          |
|----------|----------|----------|----------|----------|---------|----------|
| 31 .. 28 | 27 26 25 | 24 .. 20 | 19 .. 16 | 15 .. 12 | 11 .. 8 | 7 .... 0 |
| 1 1 1 1  | 1 0 0    | PUOW1    | Rn       | SBZ      | 1 0 1 0 | SBZ      |

## Set Endianess

**Questa istruzione permette di modificare l'ordinamento dei byte (big-endian o little-endian) durante le operazioni di accesso in memoria.** L'istruzione SETEND è stata introdotta per aumentare l'efficienza delle applicazioni rendendo possibile un accesso ottimizzato in funzione del formato di memorizzazione. Differentemente dalle altre istruzioni, la SETEND non può essere eseguita in modo condizionato e agisce direttamente sul bit E del flag di stato CPSR senza alterarne gli altri bit. **Sono possibili due sintassi, la prima per abilitare l'ordinamento big-endian (E=1) e la seconda per il little-endian (E=0):**

SETEND (BE|LE}

L'istruzione è codificata nel seguente modo:

|          |                    |          |          |   |     |         |        |
|----------|--------------------|----------|----------|---|-----|---------|--------|
| 31 .. 28 | 27 26 25 ... 21 20 | 19 .. 16 | 15 .. 10 | 9 | 8   | 7 .. 4  | 3 .. 0 |
| 1 1 1 1  | 0 0 0 1 0 0 0 0    | 0 0 0 1  | SBZ      | E | SBZ | 0 0 0 0 | SBZ    |

il bit 9 contiene il valore che sarà impostato nel bit E del registro CPSR, ovvero E = 1 se l'istruzione è SETEND BE.

*Esempio*

```
SETEND BE ; E=1 accesso Big-Endian
LDR R0, [R1,#Tabella] ; lettura dati nel formato BE
SETEND LE ; E=0 accesso Little-Endian
```