

# Prova 2

**Entrega** 5 de jun de 2020 em 11:30

**Pontos** 30

**Perguntas** 12

**Disponível** até 5 de jun de 2020 em 11:30

**Limite de tempo** Nenhum

## Instruções

Inicia em suporte multithreading até o último conteúdo de aula.

Este teste não está mais disponível, pois o curso foi concluído.

## Histórico de tentativas

|                     | Tentativa                   | Tempo      | Pontuação |
|---------------------|-----------------------------|------------|-----------|
| <b>MAIS RECENTE</b> | <a href="#">Tentativa 1</a> | 91 minutos | 26 de 30  |

! As respostas corretas não estão mais disponíveis.

Pontuação deste teste: **26** de 30

Enviado 5 de jun de 2020 em 10:22

Esta tentativa levou 91 minutos.

### Pergunta 1

2 / 2 pts

Várias técnicas para suporte multithreading foram propostas para o projeto de um processador. O objetivo é escolher uma técnica ou combinação de técnicas que melhor se adeque à proposta de arquitetura em desenvolvimento. Em uma reunião os projetistas argumentaram e apresentaram escolhas de técnicas e suas justificativas em relação a arquitetura. Marque a alternativa correta:



O suporte IMT propicia uma redução na complexidade de despacho e terminação de instruções em uma arquitetura escalar com múltiplas unidades funcionais.

→ não há vários instruções  
muito despachados por ciclo



O suporte IMT e BMT integrados propicia uma redução na complexidade de despacho e terminação de instruções em uma arquitetura escalar com dois pipelines.

X → ainda lidam com threads por vez.



O suporte IMT e SMT integrados propicia uma redução na complexidade de despacho e terminação de instruções em uma arquitetura superescalar com dois pipelines.

→ NIAGRA



O suporte SMT propicia uma redução na complexidade de despacho e terminação de instruções em uma arquitetura superescalar com múltiplas unidades funcionais.



O suporte CMT e SMT integrados propicia uma redução na complexidade de despacho e terminação de instruções em uma arquitetura superescalar com uma unidade funcional.



## Pergunta 2

1 / 1 pts

Com relação ao compartilhamento de memória, é correto afirmar (marque a resposta certa):



NUMA é uma classe de máquinas com memórias compartilhadas e distribuídas.

✓



UMA é uma classe de máquinas com memórias compartilhadas e distribuídas.

X centralizadas

NUMA é uma classe de máquinas com memórias privadas e distribuídas.

X multico<sup>putadores</sup>

UMA é uma classe de máquinas com memórias privadas e distribuídas. X

### Pergunta 3

5 / 8 pts

Explique o que pode impactar a escalabilidade de uma aplicação paralela em execução em um processador manycore, por exemplo de 1000 núcleos/roteadores, considerando em sua resposta uma correlação entre rede-em-chip mesh e memória cache compartilhada e distribuída.

Sua Resposta:

→ latência nos contencões dos roteadores → pode crescer conforme a distância entre núcleos aumenta  
 → Congestionamento nos roteadores e link pode se tornar um gargalo.  
 pode aumentar conflitos e contencões (Máxima de missões é etapa decisiva)

Em um processador manycore com diversos núcleos, a comunicação é feita por roteadores e esta comunicação, via rede, acaba por ser lenta devido a possuirmos uma cache distribuída com isso temos passar pelo processo de validação dos pacotes resultando no aumento de gargalo e consequentemente aumento no tempo médio dos envios dos pacotes.

O que é validação de pacotes. Não está claro. Correlacionar com o desempenho da aplicação.

### Pergunta 4

→ + um MUX p/ intercinal  
 good thread tecí  
 prioridade

6 / 7 pts  
 + 4 buffers de instruções  
 (Program Counter)  
 + 4 PCs

Explique alterações arquiteturais mínimas que devem ser feitas para que o processador MIPS pipeline escalar estudo na disciplina suporte 4 threads em Simultaneous Multithreading (SMT).

+ 4 unidades funcionais  
 + 4 bancos de registradores

**Sua Resposta:**

O processador MIPS, com a finalidade de suportar o funcionamento de 4 threads deve-se usar buffers de instrução para cada thread, 4 vias de pipeline, 4 Programs Counter(PC), e 4 bancos de registradores pois uma arquitetura SMT tem suas próprias propriedades além da adição de um MUX(Thread Priority) para selecionar qual thread vai ter prioridade na execução do projeto.

Lembrar que são múltiplas unidades funcionais.

**Pergunta 5**

1 / 1 pts

Uma alternativa relativamente barata para executar aplicações paralelas e alcançar alto desempenho é o cluster de computadores. Analise as afirmativas e marque somente aquela que apresenta uma característica correta de um cluster de computadores.

multicomputadores  
menores  
(privados e  
distribuídos)

- Um cluster é constituído de uma rede de interconexão chamada de Network-on-Chip. X rede em chips monçole não entre computadores independentes
- Um cluster possui restrições de escalabilidade devido as memórias privadas. X

- Um cluster é tipicamente um aglomerado de máquinas com memórias privadas.

- Um cluster é considerado alternativa para aumento do desempenho e consumo de energia. X não p/ consumo C gasto de energia Lwta energia



Um cluster possui controle descentralizado e múltiplos domínios administrativos.



## Pergunta 6

3 / 3 pts

Um processador com certa quantidade de núcleos executa no máximo 128 threads simultaneamente e suporta 256 threads, marque a alternativa correta:



*128 · 4 núcleos*

128 núcleos superescalares, suporte de 4 threads por núcleo, SMT entre 2 threads por núcleo, 4 Bancos de registradores, 4 PCs, unidades de controle de threads.



*64 · 4 = 256 threads*

64 núcleos superescalares, suporte de 4 threads por núcleo, SMT de 2 threads por núcleo, 4 Bancos de registradores, 4 PCs, unidades de controle de threads.

*64 · 2 = 128 simultâneos*



64 núcleos superescalares, suporte de 4 threads por núcleo, SMT de 4 threads por núcleo, 4 Bancos de registradores, 4 PCs, unidades de controle de threads.

*64 · 4 = 256 threads*



*128 · 2 = 256*

128 núcleos escalares, suporte de 2 threads por núcleo, SMT de 2 threads por núcleo, 2 Bancos de registradores, 2 PCs, unidades de controle de threads.

*128 · 2 = 256 simultâneos*



64 núcleos escalares, suporte de 4 threads por núcleo, SMT de 2 threads por núcleo, 4 Bancos de registradores, 4 PCs, unidades de controle de threads.

*64 · 4*

*64 · 2*

## Pergunta 7

1 / 1 pts

*IMT, SMT, BMT*

Com relação ao suporte multithreading, marque a alternativa correta:

- Interleaved multithreading corresponde ao entrelaçamento de instruções de uma mesma thread, por ciclo, em um pipeline escalar.  
*X de threads diferentes*
- Blocked multithreading corresponde ao entrelaçamento de blocos de instruções de uma mesma thread, por ciclo, em um pipeline escalar.  
*on intervalo*
- Simultaneous multithreading corresponde à execução simultânea de threads, por ciclo, em um pipeline ~~escalar~~  
*Superscalar*
- Interleaved multithreading corresponde ao entrelaçamento de instruções entre threads, por ciclo, em um pipeline escalar.  
*on superscalar!*
- Blocked multithreading corresponde ao entrelaçamento de ~~instruções~~  
*blocos de instruções*

## Pergunta 8

3 / 3 pts

O que pode impactar no ganho de desempenho de uma aplicação paralela reduzindo sua escalabilidade? Marque somente a resposta correta.



Programas com maior quantidade de regiões paralelas reduzem a quantidade de comunicação em rede em comparação com programas com maior regiões sequenciais.

*distribuindo o trabalho entre threads*



O balanceamento de carga reduz a quantidade de threads criadas para execução paralela aumentando a escalabilidade.

*aumentando a eficiência, não reduzindo escalabilidade.*



As regiões sequenciais dos programas podem aumentar o overhead de comunicação reduzindo o potencial paralelo.

*não aumentam o overhead, não limitam a execução paralela*



As regiões sequenciais dos programas podem reduzir o potencial paralelo aumentando a quantidade de threads em execução.

*X o potencial paralelo não diminui*



A rede de computadores pode ser mal aproveitada devido a grande competição e comunicação, causando overhead de processamento.

*overhead*

## Pergunta 9

1 / 1 pts

O surgimento dos processadores multi-core tem relação com uma das afirmativas a seguir. Marque somente a correta.



A Lei de Moore que se baseia no aumento da frequência, não era mais atendida pelas empresas.

*transistores*



Os chips escalavam em transistores na mesma velocidade que se desejava aumentar a frequência de operação.

*se não escalam + → referem um limite*  
*→ parou de crescer na mesma frequência*

Os limites do paralelismo de instrução e do aumento de frequência impulsionaram o surgimento multi-core.

levou à necessidade de adicionar núcleos.

✓ → difícil aumentar o desempenho  
não elevando a frequência de clock  
e explorando o paralelismo de instruções

O barramento não escalava para elevada quantidade de núcleos, o que impulsionou o surgimento das redes-em-chip.

→ verdade, mas não é  
multicore no geral

## Pergunta 10

1 / 1 pts

Sobre a viabilidade do uso de redes-em-chip, analise as afirmativas e marque somente a correta

Para a rede-em-chip, a largura de banda é afetada a medida que o número de nós aumenta.

✓ → não é afetada p/ redes em chip

Para o barramento, o árbitro é um gargalo à medida que o número de nós aumenta

✓ → componente que gerencia o acesso a recursos compartilhados entre núcleos (o barramento)  
pois ele precisa resolver conflitos de acesso ao barramento com cada vez + núcleos

Para a chave crossbar, a latência é afetada pela contagem nos roteadores da rede.

✗ → ela é afetada pelo fio  
dimensão NxC

Para a rede-em-chip, a compatibilidade é garantida com qualquer hardware ou software.

depende do projeto  
e dos protocolos  
adotados

### Contextos de Aplicação

- **Barramentos:** Em sistemas com memória compartilhada, o árbitro gerencia solicitações de leitura/escrita.
- **Redes-em-Chip (NoC):** Em roteadores, define qual pacote é encaminhado primeiro para evitar deadlocks.
- **Caches:** Coordena acesso a linhas de cache compartilhadas entre núcleos (ex: protocolos MES).

## Pergunta 11

1 / 1 pts

Em relação a subdivisão da classe MIMD, analise as afirmativas e marque somente a correta.

→ multiprocessador → compartilhado  
→ multicpu → privado

Em uma arquitetura multicpu, os espaços de endereçamento são originalmente privados e com memória centralizada.

distribuída X

Em uma arquitetura multiprocessador, os espaços de endereçamento são originalmente compartilhados e com memória centralizada ou distribuída.

→ janela de instruções

Em uma arquitetura multicpu, os espaços de endereçamento são originalmente compartilhados e com memórias distribuídas.

X privados

Em uma arquitetura multiprocessador, os espaços de endereçamento são originalmente privados e com memórias centralizadas ou distribuídas.

compartilhados

## Pergunta 12

1 / 1 pts

Em relação a coerência de cache write-invalidate (snooping), analise as afirmativas e marque somente a correta.

→ leituras não invalidam dados em outros caches

A realização de uma leitura invalida a escrita em outras caches.

X

Uma escrita é invalidada, se o flag de invalidação estiver ativado na MMU.

X

→ a invalidação ocorre por meio do bencimento de snooping, mas por flags de MMU

Após realizar a escrita, uma cópia dos dados é enviada para todas as caches.  ~~imo e write-update~~

 Antes de realizar a escrita, todas as cópias em outras caches são invalidadas. 

Pontuação do teste: **26** de 30