

## Aula 8

- Métodos de endereçamento em saltos condicionais e incondicionais
- Codificação das instruções de salto condicional no MIPS
- Codificação das instruções de salto incondicional no MIPS: o formato J
- Endereçamento imediato e uso de constantes
- Resumo dos modos de endereçamento do MIPS

Bernardo Cunha, José Luís Azevedo, Arnaldo Oliveira

# Formatos de codificação no MIPS

- As instruções aritméticas e lógicas no MIPS são codificadas no **formato R**



- A necessidade de codificação do **endereço-alvo** das instruções de salto condicional obriga a que estas instruções sejam codificadas recorrendo ao **formato I**



# Codificação de *branches* – método geral

Exemplo: **beq \$19, \$20, ELSE** # "ELSE" representa o endereço-alvo

| OP | RS | RT | OFFSET   | Endereço alvo ? |
|----|----|----|----------|-----------------|
| 4  | 19 | 20 | ELSE ??? |                 |

- Se o endereço alvo fosse codificado diretamente nos 16 bits menos significativos da instrução, isso significaria que o programa não poderia ter uma dimensão superior a  $2^{16}$  (64K)...
- Em vez de um endereço absoluto, o campo *offset* pode ser usado para codificar a **diferença** entre o valor do endereço-alvo e o endereço onde está armazenada a instrução de *branch*
- O *offset* é interpretado como um **valor em complemento para dois**, permitindo o salto para **endereços anteriores** (*offset* negativo) ou **posteriores** (*offset* positivo) ao PC
- Durante a execução da instrução de *branch* o seu endereço está disponível no registo PC, pelo que o processador pode calcular o endereço-alvo como: **Endereço-alvo = PC + offset**
- Endereçamento relativo ao PC (**PC-relative addressing**)

# Codificação de *branches* no MIPS

- No MIPS, na fase de execução de um *branch*, o PC corresponde ao endereço da instrução seguinte (o PC é incrementado na fase “*fetch*” da instrução)
- Por essa razão, na codificação de uma instrução de *branch*, **a referência para o cálculo do offset é o endereço da instrução seguinte**
- As instruções estão armazenadas em memória em endereços múltiplos de 4 (e.g., **0x00400004**, **0x00400008**,...) pelo que o *offset* é também um valor múltiplo de 4 (2 bits menos significativos são sempre 0)
- De modo a otimizar o espaço disponível para o *offset* na instrução, os dois bits menos significativos não são representados

# Codificação de *branches* no MIPS

Considere-se o seguinte exemplo:

|            |         |                      |
|------------|---------|----------------------|
| 0x00400000 | bne     | \$19, \$20, ELSE     |
| 0x00400004 | add     | \$16, \$17, \$18     |
| 0x00400008 | j       | END_IF               |
| 0x0040000C | ELSE:   | sub \$16, \$16, \$19 |
| 0x00400010 | END_IF: |                      |

O endereço correspondente ao label ELSE é 0x0040000C

Durante o *instruction fetch* o PC é incrementado (i.e.  $PC=0x00400004$ )

O "offset" seria portanto:

$$\text{ELSE} - [\text{PC}] =$$

$$0x0040000C - 0x00400004 = 0x08$$

No entanto, como **cada instrução ocupa sempre 4 bytes** na memória (a partir de um endereço múltiplo de 4), o "offset" é também múltiplo de 4 Logo:

$$\text{"offset"} = 0x08 / 4 = 0x02 \text{ (offset em número de instruções!!!)}$$

| 31 | 0            |
|----|--------------|
| 5  | 19 20 0x0002 |

Código máquina: **00010110011101000000000000000010 = 0x16740002**

Uma instrução de salto condicional pode referenciar qualquer endereço de uma outra instrução que se situe até **32K instruções** antes ou depois dela própria.

# Execução de uma instrução de *branch*

- O campo *offset* do código máquina da instrução de *branch* é então usado para codificar a **diferença** entre o valor do endereço-alvo e o valor do endereço seguinte ao da instrução de *branch*, **dividida por 4**
- Durante a execução da instrução, o processador calcula o endereço-alvo como:

$$\text{Endereço\_alvo} = \text{PC\_atual} + (\text{offset} * 4)$$

ou:

$$\text{Endereço\_alvo} = \text{PC\_atual} + (\text{offset} \ll 2)$$

(o offset de 16 bits é estendido com sinal para 32 bits, antes do *shift*)

# Interpretação de uma instrução de *branch* no MIPS

## Exemplo



Offset = 1111 1111 1111 1101



1111 1111 1111 1111 1111 1111 1111 1101



1111 1111 1111 1111 1111 1111 1111 0100

(0xFFFFFFFF4)



O valor do PC foi incrementado na fase *fetch* da instrução

$$\text{Endereço alvo} = \text{PC} + (\text{offset} \ll 2) = \boxed{0x00400034} + 0xFFFFFFFF4 = 0x00400028$$

Instrução descodificada: bne \$8, \$9, 0x00400028

# Codificação da instrução de salto incondicional

- No caso da instrução de salto incondicional ("j"), é usado **endereçamento pseudo-direto**, i.e. o **código máquina** da instrução **codifica diretamente parte do endereço alvo**
- Formato J:



- Endereço alvo da instrução "j" é sempre múltiplo de 4 (2 bits menos significativos são sempre 0)



# Codificação da instrução de salto incondicional

- Exemplo: **j Label # com Label = 0x001D14C8**

0x001D14C8: 0000 **0000 0001 1101 0001 0100 1100 1000**

(26 bits)      00 0000 0111 0100 0101 0011 0010



- Código máquina (opcode do "j" é 0x02):

**0000 1000 0000 0111 0100 0101 0011 0010 = 0x08074532**

# Cálculo do endereço-alvo de uma instrução J

Se a instrução só codifica 28 bits (26 explícitos + 2 implícitos),  
como é formado o endereço final de 32 bits?



# Salto incondicional – endereçamento indireto por registo

- Haverá maneira de especificar, numa instrução que realize um salto incondicional, um endereço-alvo de 32 bits?
- Há! Utiliza-se **endereçamento indireto por registo**. Ou seja, um registo interno (de 32 bits) armazena o endereço alvo da instrução de salto (**instrução JR - Jump on register**)

(Código máquina da instrução)



CPU

Número do registo

Registo Interno  
de 32 bits

Endereço alvo

Program Counter

Endereço

Memória

Cód. Máq. Instrução

# Instrução JR (jump on register)

**jr Rsrc** # salta para o endereço que  
# se encontra armazenado no registo Rsrc

Exemplo:

**jr \$ra** # Salta para o endereço que está  
# armazenado no registo \$ra

O formato de codificação da instrução JR é o formato R:



# Manipulação de constantes

- Constante é um valor determinado com antecedência (quando o programa é escrito) e que não se pretende que seja ou possa ser mudado durante a execução do programa
- As constantes poderiam ser armazenadas na memória externa. Nesse caso, a sua utilização implicaria sempre o recurso a duas instruções:
  - leitura do valor residente em memória para um registo interno
  - operação com essa constante
- Para aumentar a eficiência, a arquitetura MIPS disponibiliza um conjunto de instruções em que as **constantes se encontram armazenadas na própria instrução**
- Desta forma, com a leitura da instrução, o acesso à constante é “**imediato**”, sem necessidade de recorrer a uma operação prévia de leitura da memória: “**endereçamento imediato**”

# Manipulação de constantes no MIPS

- As instruções aritméticas e lógicas que manipulam constantes (do tipo imediato) são identificadas pelo sufixo “**i**”:

```
addi $3, $5, 4      # $3 = $5 + 0x0004
andi $17, $18, 0x3AF5 # $17 = $18 & 0x3AF5
ori  $12, $10, 0x0FA2 # $12 = $10 | 0x0FA2
slti $2, $12, 16    # $2 = 1 se $12 < 16
                     # ($2 = 0 se $12 ≥ 16)
```

- Estas instruções são codificados usando o **formato I**. Logo apenas **16 bits** podem ser usados para codificar a constante
- Este espaço é geralmente suficiente para armazenar as constantes mais frequentemente utilizadas (geralmente valores pequenos)
- Se há apenas 16 bits dedicados ao armazenamento da constante, qual será a **gama de representação** dessa constante?
  - Depende da instrução...

# Manipulação de constantes no MIPS

- No caso mais geral, a constante representa uma quantidade inteira, positiva ou negativa, codificada em **complemento para dois**. É o caso das instruções:

```
addi $3, $5, -4      # equivalente a 0xFFFFC  
addi $4, $2, 0x15    # 2110  
slti $6, $7, 0xFFFF  # -110
```

- Gama de representação da constante: **[-32768, +32767]**
- A constante de 16 bits é estendida para 32 bits, preservando o sinal (ex: para -4, **0xFFFFC** é estendido para **0xFFFFFFFFC**)
- Existem também instruções em que a constante deve ser entendida como uma quantidade inteira sem sinal. Estão neste grupo todas as instruções lógicas:

```
andi $3, $5, 0xFFFF
```

- Gama de representação da constante: **[0, 65535]**
- A constante de 16 bits é estendida para 32 bits, sendo os 16 mais significativos **0x0000** (para o exemplo: **0x0000FFFF**)

# Codificação das instruções que usam constantes

Exemplo: **addi \$5, \$18, 31**

|    |   |    |   |    |   |
|----|---|----|---|----|---|
| 31 | 8 | 18 | 5 | 31 | 0 |
|----|---|----|---|----|---|

OP

RS

RT

**IMEDIATO (CONSTANTE)**

Instrução do tipo I

***addi rt, rs, immediate***

|    |        |       |       |                     |   |
|----|--------|-------|-------|---------------------|---|
| 31 | 001000 | 10010 | 00101 | 0000 0000 0001 1111 | 0 |
|----|--------|-------|-------|---------------------|---|

OP

RS

RT

**IMEDIATO (CONSTANTE)**

**Cod. Máquina: 0010001001001010000000000011111 = 0x2245001F**

# Manipulação de constantes de 32 bits – LUI

- Em alguns casos pode ser necessário manipular constantes que necessitem de um espaço de armazenamento com mais do que 16 bits (e.g., a referência explícita a um endereço)
- Como lidar com esses casos?
- Para permitir a manipulação de constantes com mais de 16 bits, o ISA do MIPS inclui a seguinte instrução, também codificada com o formato I:

**lui        \$reg, immediate**

- A instrução **lui** ("Load Upper Immediate"), coloca a constante "immediate" nos **16 bits mais significativos do registro destino** (\$reg)
- Os 16 bits menos significativos ficam com **0x0000**

# Manipulação de constantes de 32 bits – LUI

Exemplo:

**lui \$8, 255 #  $255_{10} = 0xFF$**

31

0

|        |       |       |                             |
|--------|-------|-------|-----------------------------|
| 001111 | 00000 | 01000 | 0000 0000 1111 1111         |
| OP     | RS    | RT    | <b>IMEDIATO (CONSTANTE)</b> |

***lui rt, immediate***

Conteúdo do registo **\$8** após a execução da instrução:

31

16 15

0

|                     |                     |
|---------------------|---------------------|
| 0000 0000 1111 1111 | 0000 0000 0000 0000 |
|---------------------|---------------------|

Valor que fica armazenado  
em **\$8** = **0x00FF0000**

Os 16 bits menos significativos ficam  
com o valor 0

- Exemplo: inicializar o registo **\$6** com o valor **0xF32864D9**

**lui \$6, 0xF328 # \$6=0xF3280000**

**ori \$6, \$6, 0x64D9 # \$6=0xF3280000 | 0x000064D9=0xF32864D9**

# Manipulação de constantes de 32 bits – LA / LI

A instrução virtual "load address"

```
la $16,MyData #Ex. MyData = 0x10010034  
# (segmento de dados em 0x1001000)
```

é executada no MIPS pela sequência de instruções nativas:

```
lui $1,0x1001      # $1    = 0x10010000  
ori $16,$1,0x0034 # $16   = 0x10010000 | 0x00000034
```

## Notas:

- O **registro \$1 (\$at)** é reservado para o **Assembler**, para permitir este tipo de decomposição de **instruções virtuais** em **instruções nativas**.
- A **instrução “li” (load immediate)** é decomposta em instruções nativas de forma análoga à instrução “**la**”



# Modos de endereçamento no MIPS (resumo)

- Instruções aritméticas e lógicas: **endereçamento tipo registo**
- Instruções aritméticas e lógicas com constantes: **endereçamento imediato**
- Instruções de acesso à memória: **endereçamento indireto por registo com deslocamento**
- Instruções de salto condicional (*branches*): **endereçamento relativo ao PC**
- Instrução de salto incondicional através de um registo (instrução JR ): **endereçamento indireto por registo**
- Instrução de salto incondicional (J): **endereçamento direto** (uma vez que o endereço não é especificado na totalidade, esse tipo de endereçamento é normalmente designado por "**pseudo-direto**")

# Modos de endereçamento do MIPS (resumo)

- Register Addressing (endereçamento tipo registo):



- Base addressing (indireto por registo com deslocamento):



# Modos de endereçamento do MIPS (resumo)

- Immediate Addressing (endereçamento imediato):



**Exemplo:**  
addi \$3,\$4,0x3F

- PC-relative Addressing (endereçamento relativo ao PC):



**Exemplo:**  
beq \$3,\$4, 0x12

# Modos de endereçamento do MIPS (resumo)

- Pseudo-direct Addressing (endereçamento pseudo-direto):



## Exemplos:

```
j 0x0010000B # target address is 0x0040002C
jal 0x0010048E # target address is 0x00401238
```

(target calculado supondo que PC = 0x0...)

# Questões / exercícios

- ① • Qual o formato de codificação de cada uma das seguintes instruções: "**beq/bne**", "j", "jr"?
- ② • O que é codificado no campo *offset* do código máquina das instruções "**beq/bne**" ?
- ③ • A partir do código máquina de uma instrução "**beq/bne**", como é formado o endereço-alvo (*Branch Target Address*)?
- ④ • A partir do código máquina de uma instrução "j", como é formado o endereço-alvo (*Jump Target Address*)?
- ⑤ • Na instrução "jr \$ra", como é obtido o endereço-alvo?
- ⑥ • Qual o endereço mínimo e máximo para onde uma instrução "j", residente no endereço de memória **0x5A18F34C**, pode saltar?
- ⑦ • Qual o endereço mínimo e máximo para onde uma instrução "beq", residente no endereço de memória **0x5A18F34C**, pode saltar?
- ⑧ • Qual o endereço mínimo e máximo para onde uma instrução "jr", residente no endereço de memória **0x5A18F34C** pode saltar?

# Questões / exercícios

- ⑨ • Qual a gama de representação da constante nas instruções aritméticas imediatas?
- ⑩ • Qual a gama de representação da constante nas instruções lógicas imediatas?
- ⑪ • Porque razão não existe no ISA do MIPS uma instrução que permita manipular diretamente uma constante de 32 bits?
- ⑫ • Como é que no MIPS se podem manipular constantes de 32 bits?
- ⑬ • Apresente a decomposição em instruções nativas das seguintes instruções virtuais:

**li \$6, 0x8B47BE0F**

**xori \$3, \$4, 0x12345678**

**addi \$5, \$2, 0xF345AB17**

**beq \$7, 100, L1**

**blt \$3, 0x123456, L2**

1

`beg / bne` → Formato I

`j` → Formato J

`jr` → Formato R

2

É codificado a diferença entre o valor do endereço alvo e o valor do endereço seguinte da instrução branch, dividida por 4.

Exemplo

|            |         |                  |                  |
|------------|---------|------------------|------------------|
| 0x00400000 | bne     | \$19, \$20, ELSE | ←                |
| 0x00400004 | add     | \$16, \$17, \$18 |                  |
| 0x00400008 | j       | END_IF           |                  |
| 0x0040000C | ELSE:   | sub              | \$16, \$16, \$19 |
| 0x00400010 | END_IF: |                  |                  |

$$\begin{aligned} \text{Offset} &= \frac{\text{ELSE} - \text{PC}}{4} = \frac{0x0040000C - 0x00400004}{4} \\ &= \frac{0x08}{4} = 0x02 \end{aligned}$$

3

|            |         |                  |                  |
|------------|---------|------------------|------------------|
| 0x00400000 | bne     | \$19, \$20, ELSE | ←                |
| 0x00400004 | add     | \$16, \$17, \$18 |                  |
| 0x00400008 | j       | END_IF           |                  |
| 0x0040000C | ELSE:   | sub              | \$16, \$16, \$19 |
| 0x00400010 | END_IF: |                  |                  |

$$\begin{aligned} \text{Endereço\_alvo} &= \text{PC} + (\text{offset} * 4) \\ &= 0x00400004 + (0x02 * 4) \\ &= 0x00400004 + 0x08 = 0x0040000C \end{aligned}$$

No caso de não sabermos o endereço alvo, mas temos o código máquina da instrução:



Offset em decimal

1111 1111 1111 1101 ) Inverter

$$\begin{array}{r} 0000 \quad 0000 \quad 0000 \quad 0010 \\ + \qquad \qquad \qquad \qquad 1 \\ \hline 0000 \quad 0000 \quad 0000 \quad 0011 \end{array} \longrightarrow \boxed{-3}$$

$$\begin{aligned} \text{Endereço - alvo} &= 0x00400034 + (-3 \times 4) \\ &= 0x00400034 - 0xC \\ &= 0x00400028 \end{aligned}$$

(4)

Formato J:

|        |                 |
|--------|-----------------|
| OP     | Endereço - alvo |
| 6 Bits | 26 Bits         |

$$j \quad 0x001D14C8 \rightarrow 0000000111010001010011001000 \quad 26 \text{ Bits}$$

Endereço alvo

(5)

O endereço - alvo na função  $\boxed{jr \$rc}$  é obtido diretamente a partir do valor contido no registo especificado, neste caso é o  $\$rc$ .

(endereçamento indireto por registo)

(6)

Endereço alvo máx e min.

0x5A18F34C

|        |             |
|--------|-------------|
| PC     | 26 Bits * 4 |
| 4 Bits | 28 Bits     |

$$\text{Mín 26 Bits} = 0x00000000$$

$$\text{Máx 26 Bits} = 0x3FFFFFFF$$

$\downarrow \times 4$

0xFFFFFFF0 28 Bits

Endereço min: 0x5000 0000

Endereço máx: 0x5FFF FFFC

7

## Endereço alvo máx e min

0x5A18F34C

Endereço de próxima instrução: 0x5A18F350 ( $0x5A18F34C + 4$ )

Offset min, máx:  $[-2^{15}, 2^{15} - 1]$

0x8000      0xFFFF

extender para 32 bits para poder somar com o endereço de instrução ( $0x5A18F34C$ )

0xFFFF8000

↓  
x4

0xFFFFE000

↓  
+ 0x5A18F350

0x00007FFF

↓  
x4

0x00001FFFC

↓  
+ 0x5A18F350

0x5A1AF34C

Endereço min

Endereço máx

8

## Endereço alvo máx. e min

A instrução **[jr]** não tem um endereço mínimo ou máximo. O endereço de salto é completamente determinado pelo valor que está armazenado no registro.

Endereço mínimo: 0x0000 0000

Endereço máximo: 0xFFFF FFFF

9

A Gamz de representação é  $[-2^{15}, 2^{15} - 1]$  com sinal (ex. addi)  
 $[0, 2^{16}]$  sem sinal (ex. addiu)

10

A Gamz de representação é  $[0, 2^{16}]$

11

No ISA do MIPS, não existe uma instrução para manipular diretamente um constante de 32 bits, pois as instruções possuem um formato fixo de 32 bits, e parte desse espaço é ocupado pelo **Opcode** e outros campos. Isso limita o campo **immediate** a apenas 16 bits em instruções como **addi**.

12

No MIPS, para manipular constantes de 32 bits, utilizamos uma combinação de instruções, pois o formato das instruções limita o Campo immediate a 16 bits. As constantes de 32 bits são manipuladas dividindo-as em duas partes: os 16 bits superiores e os 16 bits inferiores. Isso é feito com as instruções **lui** e **ori**.

13

**li** \$6, 0x8B47BE0F

↳ **lui** \$6, 0x8B47  
**ori** \$6, \$6, 0xBE0F

**xori** \$3, \$4, 0x12345678

↳ **lui** \$1, 0x1234  
**ori** \$1, 0x5678  
**xor** \$3, \$4, \$1

**blt** \$3, 0x123456, L<sub>2</sub>

↳ **lui** \$1, 0x1234  
**ori** \$1, \$1, 0x56  
**slt** \$1, \$3, \$1  
**bne** \$1, \$0, L<sub>2</sub>

**addi** \$5, \$2, 0xF345AB17

↳ **lui** \$1, 0xF345  
**ori** \$1, 0xAB17  
**addi** \$5, \$2, \$1

**beq** \$7, 100, L<sub>1</sub>

↳ **addi** \$1, \$0, 100  
**beq** A, \$1, L<sub>1</sub>