

# Akcelerator graficzny fixed-pipeline oparty na FPGA

Jakub Janeczko

Instytut Informatyki, Uniwersytet Wrocławski

Promotor: Dr. Marek Materzok

6 lutego 2026

# Cel projektu i problem

- Problem: sprzętowe przyspieszenie renderingu 3D w systemach wbudowanych.
- Cel: zaprojektować i zaimplementować fixed-pipeline GPU zgodny z wybranym podzbiorem OpenGL ES 1.1 Common-Lite.
- Założenia: arytmetyka stałoprzecinkowa, integracja z SoC, możliwość testowania i demonstracji.

- FPGA łączy elastyczność z deterministycznym czasem działania.
- Fixed-pipeline pozwala precyzyjnie kontrolować zasoby i opóźnienia.
- Projekt jako punkt wyjścia do dalszych rozszerzeń (teksturowanie, shadery).

Zaimplementowane elementy potoku:

- Transformacje wierzchołków (model–view–projection).
- Rasteryzacja trójkątów z interpolacją perspektywiczną.
- Oświetlenie (ambient, diffuse) w wierzchołkach.
- Testy głębokości i szablonu.
- Mieszanie kolorów (alpha blending).

- **FPGA Intel Cyclone V (DE1-SoC)**: elastyczność, możliwość iteracji architektury, integracja z HPS.
- **Amaranth HDL**: generatywność w Pythonie, szybka iteracja, symulacja i eksport do SystemVerilog.
- **OpenGL ES 1.1 Common-Lite**: klasyczny fixed-pipeline, naturalny punkt odniesienia i arytmetyka fixed-point.
- **SoC + Linux**: łatwy dostęp do CSR i uruchamianie aplikacji demonstracyjnych.

# Wymagania i założenia

- Docelowa platforma: Intel Cyclone V (DE1-SoC).
- Podzbiór OpenGL ES 1.1 Common-Lite (fixed-pipeline).
- Arytmetyka stałoprzecinkowa (brak FPU w profilu).
- Integracja z SoC: CSR + dostęp do pamięci przez magistrale.
- Weryfikacja funkcjonalna w symulacji i na płytce.

- Symulacja i testy funkcjonalne na poziomie modułów.
- Integracja z Qsys/Platform Designer (Avalon-MM).
- Aplikacje demonstracyjne w userspace Linux.

- HPS (ARM) konfiguruje GPU przez rejesty CSR.
- GPU jako akcelerator w logice FPGA.
- Magistrale: Avalon-MM (CSR i dostęp do pamięci), mostek do Wishbone.
- Bufory: wierzchołki, indeksy, ramka, głębokość, szablon.

# Architektura potoku graficznego

- ① Wejście i składanie prymitywów (Input Assembly).
- ② Transformacje wierzchołków (Vertex Transform).
- ③ Cieniowanie wierzchołków (Vertex Shading).
- ④ Rasteryzacja (barycentryczne, perspektywa).
- ⑤ Operacje fragmentów: depth/stencil/blend.

# Diagram potoku graficznego



# Zgodność z OpenGL ES 1.1 Common-Lite

- Zaimplementowane: transformacje, rasteryzacja trójkątów, oświetlenie ambient/diffuse, depth/stencil, blending.
- Braki: teksturowanie, specular, linie/punkty, MSAA.
- Skupienie na kluczowych elementach fixed-pipeline i stabilności działania.

# Arytmetyka stałoprzecinkowa

- Brak FPU w profilu Common-Lite — konieczność fixed-point.
- Stabilność czasowa i przewidywalne zasoby w FPGA.
- Kluczowe miejsca: macierze, interpolacja perspektywiczna, testy głębokości.

# Interfejs CSR i konfiguracja

- Rejestry sterujące: adresy buforów, formaty danych, topologia.
- Parametry macierzy, oświetlenia, viewport/scissor.
- Tryby testów depth/stencil i ustawienia blendingu.
- Dostęp z Linuxa przez mapowanie /dev/mem.

- Projekt architektury fixed-pipeline i podział na moduły sprzętowe.
- Implementacja modułów Amaranth: transformacje, rasteryzacja, testy, blending.
- Zaprojektowanie mapy CSR i integracja z SoC.
- Środowisko testowe i aplikacje demonstracyjne.

- Testy jednostkowe modułów potoku (symulacja).
- Porównanie wyników renderingu z referencją (obrazy PPM).
- Testy integracyjne na płycie DE1-SoC.

# Wyniki — zasoby FPGA (Cyclone V)

- ALM: 31 372 / 32 070 (98%).
- DSP: 75 / 87 (86%).
- Pamięć: 634 097 / 4 065 280 bitów (16%).
- PLL: 3 / 6 (50%), DLL: 1 / 4 (25%).

# Wyniki i demonstracja

- Poprawne renderowanie trójkątów z interpolacją i testami.
- Sceny demonstracyjne uruchamiane na płycie DE1-SoC.



# Ograniczenia

- Brak teksturowania i specular.
- Brak rasteryzacji linii i punktów.
- Wysokie zużycie ALM (98%) ogranicza dalszą rozbudowę bez optymalizacji.

- Fixed-pipeline GPU na FPGA jest możliwe i edukacyjnie wartościowe.
- Amaranth HDL ułatwia iterację i testowanie architektury.
- Architektura modułowa ułatwia rozwój i izolację błędów.

- Rozszerzenie funkcjonalności o teksturowanie, MSAA, shadery.
- Ulepszenia wydajności: większa równoległość, TBR.
- Lepsze narzędzia debug/telemetria w CSR.
- Zbliżenie do pełnej zgodności z OpenGL ES 1.1.

- OpenGL ES 1.1 Specification (Khronos Group).
- Dokumentacja Amaranth HDL.
- Dokumentacja DE1-SoC i Cyclone V.

Krótka demonstracja działania akceleratora na płycie DE1-SoC

Dziękuję za uwagę