

# Processamento Paralelo - IV

## Canto III

*A porta do Inferno - Vestíbulo  
Rio Aqueronte - Caronte*

POR MIM SE VAI À CIDADE DOLENTE,  
POR MIM SE VAI À ETERNA DOR ,  
POR MIM SE VAI À PERDIDA GENTE.

JUSTIÇA MOVEU O MEU ALTO CRIADOR,  
QUE ME FEZ COM O DIVINO PODER,  
O SABER SUPREMO E O PRIMEIRO AMOR.

ANTES DE MIM COISA ALGUMA FOI CRIADA  
EXCETO COISAS ETERNAS, E ETERNA EU  
DURO.  
DEIXAI TODA ESPERANÇA, VÓS QUE ENTRAIS!



# **Processadores Multicore**

## **1. Motivação:**

- aumentar desempenho**

## **2. Idéia geral:**

- aproveitar a mesma pastilha de silício (die) e colocar duas ou mais unidades de processamento (core)**

## **3. O que é um core?**

- basicamente é um processador independente, contendo:**
  - registradores**
  - unidade lógica e aritmética**
  - pipeline**
  - unidade de controle**
  - cache L1 (dados e instruções)**
  - cache L2**
  - cache L3 em alguns projetos**

# Processadores Multicore



## Essenciais

Coleção de produtos

Processadores Intel® Core™ série X

Codinome

Produtos com denominação anterior Cascade Lake

Segmento vertical

Desktop

Número do processador

i9-10980XE

Status

Launched

Data de introdução ?

Q4'19

Litografia ?

14 nm

## Especificações da CPU

Número de núcleos ?

18

Nº de threads ?

36

Frequência turbo max ?

4.60 GHz

Frequência da Tecnologia Intel® Turbo Boost Max 3.0 ?

4.80 GHz

Frequência baseada em processador ?

3.00 GHz

Cache ?

24.75 MB Intel® Smart Cache

Velocidade do barramento ?

8 GT/s DMI3

TDP ?

165 W

Especificações de exportação

# Processadores Multicore



## Essenciais

Coleção de produtos

Processador Intel® Xeon® W

Codinome

Produtos com denominação anterior Ice Lake

Segmento vertical

Workstation

Número do processador

W-3375

Status

Launched

Data de introdução [?](#)

Q3'21

Litografia [?](#)

10 nm

## Especificações da CPU

Número de núcleos [?](#)

38

Nº de threads [?](#)

76

Frequência turbo max [?](#)

4.00 GHz

Frequência baseada em processador [?](#)

2.50 GHz

Cache [?](#)

57 MB

Nº de links de UPI [?](#)

0

Velocidade do barramento [?](#)

8 GT/s

TDP [?](#)

270 W

## Como isso é possível?



## Como isso é possível?



**CLOCK:** freqüência com que os transistors abrem e fecham, em GHz (bilhões de ciclos por segundo)

# Como isso é possível?



## Organização Multicore Básica



(a) Dedicated L1 cache



(b) Dedicated L2 cache



(c) Shared L2 cache



(d) Shared L3 cache

O que é importante em um processador multicore?

- Número de cores por chip
- Número de níveis de memória
- Quantidade de memória cache compartilhada
  - dados compartilhados não são replicados
  - comunicação entre os cores é fácil
  - confina a coerência de cache para L1 ou L2
- Se tem multithreading simultâneo (SMT)
- Tipos de cores

# Organização Multicore Heterogênea

A organização básica é **HOMOGÊNEA**:

- os cores são do mesmo tipo (idênticos)

Para aumentar desempenho: **HETEROGÊNEA**

- os cores são de tipos diferentes

- 2 abordagens para arquitetura heterogênea:

- **conjunto de instruções diferentes**: mistura cores convencionais (CPU) com outros tipos de cores com instruções totalmente diferentes:
  - cores GPU (processar dados vetoriais/matriciais) = Multicore CPU/GPU
  - cores DSP (processar sinais digitais) = Multicore CPU/DSP
- **conjunto de instruções equivalentes**: mistura cores que têm instruções diferentes mas equivalentes, variando no desempenho e eficiência energética

# Organização Multicore Heterogênea

Exemplo de organização heterogênea com arquitetura de instruções diferentes: multicore CPU/GPU



| AMD A10 5800K                | CPU   | GPU   |
|------------------------------|-------|-------|
| <b>Clock frequency (GHz)</b> | 3.8   | 0.8   |
| <b>Cores</b>                 | 4     | 384   |
| <b>FLOPS/core</b>            | 8     | 2     |
| <b>GFLOPS</b>                | 121.6 | 614.4 |

FLOPS = floating point operations per second

FLOPS/core = number of parallel floating point operations that can be performed

# Organização Multicore Heterogênea

Exemplo de organização heterogênea com arquitetura de instruções diferentes: multicore CPU/DSP



# Organização Multicore Heterogênea

Exemplo de organização heterogênea com arquitetura de instruções equivalentes: big.LITTLE da ARM



Cores big:

- processos de grande intensidade: vídeos, jogos, processamento matemático, navegação, etc.

Cores LITTLE:

- processos de baixa intensidade: processamento de fundo, tocar música, enviar mensagens, etc.

Voltados para mercado mobile/tablet

## Referência e Leitura Adicional



### Capítulo 18: Computadores Multicore

- 18.1 Questões sobre desempenho de hardware
- 18.3 Organização Multicore
- 18.4 Organização Multicore Heterogênea