

# Домашнее задание №6

---

Домашнее задание №6 состоит из 7 упражнений:

- Первое, второе, третье и четвёртое в папке `06_01_04_sqrt_formula_pipe`
- Пятое в папке `06_05_sqrt_formula_distributor`
- Шестое в папке `06_06_float_discriminant_distributor`
- Седьмое в папке `06_07_put_in_order`

У некоторых упражнений есть секция `Example` с модулем для примера.

Во всех упражнениях есть секция `Task` с описанием задания и местом, где необходимо описать ваше решение.

## Предисловие

---

В файле Testbench любого из заданий можно убрать комментарий у строк `$dumpfile;` и `$dumpvars;` для генерации `dump.vcd` файла. В файле будут содержаться текстовые описания временной диаграммы, описывающей изменения на всех проводах и регистрах во время симуляции.

Можно воспользоваться командой `gtkwave dump.vcd` для просмотра файла, либо добавить опцию `--wave` или `-w` к скрипту `run_linux_mac` или `run_windows`.

Так же, возможно использовать более современную программу [Surfer](#) для просмотра временных диаграмм.

Surfer доступен на системах Linux, Windows и macOS, а так же в качестве [расширения редактора VS Code](#).

## Упражнения 1-4. Конвейерное вычисление формул с квадратным корнем

---

### Введение

Директория `06_01_04_sqrt_formula_pipe` содержит набор упражнений посвящённый вычислению Формулы 1 и Формулы 2 с использованием квадратных корней в конвейеризованном виде. Это лучшая по производительности версия задания `05_04_05_sqrt_formula_fsm`.

Рекомендуется ознакомиться с обсуждением этого задания в статье Юрия Панчула, опубликованной в Журнале FPGA-Systems :: FSM :: Issue ALFA (state\_0). Выпуск находится по ссылке [https://fpga-systems.ru/fsm#state\\_0](https://fpga-systems.ru/fsm#state_0).

### Упражнение 1

Задание:

Реализуйте конвейерный модуль `formula_1_pipe`, который вычисляет результат по формуле, определенной в файле `formula_1_fn.svh`.

Требования:

1. Модуль `formula_1_pipe` должен быть конвейерным

- Он должен быть способен принимать новый набор аргументов `a`, `b` и `c`, поступающих в каждом такте
  - Он также должен быть способен выдавать новый результат каждый такт с фиксированной латентностью
2. В вашем решении должно быть создано ровно 3 экземпляра конвейерного модуля `isqrt`, каждый из которых будет вычислять целочисленный квадратный корень для своего аргумента.
3. Ваше решение должно экономить динамическое энергопотребление за счет правильного подключения `valid` сигналов.

Архитектурная диаграмма

### PIPELINED SQRT (A) + SQRT (B) + SQRT (C) WITH 3 ISQRT PIPELINED MODULES



## Упражнение 2

Задание:

Реализуйте модуль `formula_1_pipe_aware_fsm` с помощью конечного автомата (FSM), который управляет входными данными и использует выходные данные одного конвейерного модуля `isqrt`.

Предполагается, что модуль `formula_1_pipe_aware_fsm` должен быть создан внутри модуля `formula_1_pipe_aware_fsm_top` вместе с единственным экземпляром `isqrt`.

Результирующая структура должна вычислять формулу, определенную в файле `formula_1_fn.svh`.

Модуль `formula_1_pipe_aware_fsm` не должен создавать никаких экземпляров модуля `isqrt`, он должен использовать только порты ввода и вывода, подключенные к экземпляру `isqrt` на более высоком уровне иерархии экземпляров.

Все вычисления пути передачи данных, за исключением вычисления квадратного корня, должны быть реализованы внутри модуля `formula_1_pipe_aware_fsm`. Таким образом, этот модуль является не только конечным автоматом, но и комбинацией FSM с каналом передачи данных для добавлений и промежуточными регистрами данных.

Обратите внимание, что модуль `formula_1_pipe_aware_fsm` сам по себе не является конвейерным. Он должен быть способен принимать новые аргументы `a`, `b` и `c`, поступающие через каждые `N+3` такта.

Для достижения этой задержки предполагается, что FSM использует факт, что `isqrt` является конвейерным.

Архитектурная диаграмма

## IMPLEMENTING A FORMULA WITH FSM THAT CONTROLS ONE ISQRT MODULE



### Упражнение 3. Сдвиговый регистр с valid сигналом

Задание:

Реализуйте вариант модуля сдвигового регистра, который перемещает передачу данных только в том случае, если эта передача действительна (сигнал `valid` активен).

## SHIFT REGISTER WITH VALID BIT FOR WIDE DATA



### Упражнение 4

Задание:

Реализуйте конвейерный модуль `formula_2_pipe`, который вычисляет результат по формуле, определенной в файле `formula_2_fn.svh`.

Требования:

1. Модуль `formula_2_pipe` должен быть конвейерным.
  - Он должен быть способен принимать новый набор аргументов `a`, `b` и `c`, поступающих в каждом такте.
  - Он также должен быть способен выдавать новый результат каждый такт с фиксированной задержкой после принятия аргументов.
2. В вашем решении должно быть создано ровно 3 экземпляра конвейерного модуля `isqrt`.
3. Ваше решение должно экономить динамическое энергопотребление за счет правильного подключения сигналов валидности.

При правильной конвейерной обработке, выравнивания данных по тактам, используйте модуль `shift_register_with_valid` для создания задержки в `N` и `2N+1` тактов.

## Архитектурная диаграмма



## Упражнение 5. Распределитель вычислений. Формулы с корнями

Задание:

Реализуйте модуль, который будет вычислять Формулу 1 или Формулу 2 на основе значений параметров.

Модуль должен быть конвейерным. Он обязан принимать новую тройку аргументов `a`, `b`, `c`, поступающих в каждом такте.

Идея задания состоит в реализации аппаратного распределителя задач, который будет принимать тройку аргументов и назначать задачу вычисления формулы 1 или формулы 2 с этими аргументами свободному внутреннему модулю из прошлых заданий.

Первым шагом к решению упражнения является заполнение файлов `03_04` и `03_05`.

Примечание 1: \

Необходимо самостоятельно выяснить задержку в тактах для модуля `formula_1_isqrt` по временной диаграмме.

В случае трудностей с временной диаграммой, можно считать, что она равна 50 тактам.

Примечание 2: \

Упражнение предполагает идеализированный распределитель (с 50 внутренними вычислительными блоками), однако на практике инженеры редко используют более 10 модулей одновременно. Обычно используют 3-5 блоков и глобальную остановку (stall) в случае высокой нагрузки.

Рекомендация: \

Создайте достаточно большое количество модулей `"formula_1_impl_1_top"`, `"formula_1_impl_2_top"` или `"formula_2_top"` для достижения желаемой производительности.

## Архитектурная диаграмма



Пример работы на временной диаграмме



## Упражнение 6. Распределитель вычислений. Вещественный дискриминант

Задание:

Реализуйте модуль, который будет вычислять дискриминант на основе тройки входных вещественных чисел `a`, `b`, `c`.

Модуль обязан быть конвейерным. Он должен быть способен принимать новую тройку аргументов в каждом тактовом цикле, а также через некоторое время выдавать результат в каждом такте.

Идея упражнения аналогична упражнению [06\\_05](#). Основное отличие заключается в базовом модуле `05_07_float_discriminant` вместо модулей формул.

Примечание 1: \

Повторно используйте свой файл "05\_07\_float\_discriminant.sv" из Домашнего задания 5.

Примечание 2: \

Задержка модуля "float\_discriminant" должна быть определена по временной диаграмме.

## Упражнение 7. Упорядочивание результатов

Задание:

Реализуйте модуль, который принимает множество выходных данных с массива вычислительных блоков и выводит их один за другим по порядку.

Входные сигналы `up_vlds` и `up_data` поступают из неконвейерных вычислительных блоков. Эти внешние вычислители имеют переменную задержку.

Порядок входящих `up_vlds` не является фиксированным, при этом задача состоит в том, чтобы выводить `down_vld` и данные по порядку, одни за другими.

Комментарий: \

Идея блока отчасти похожа на блок `parallel_to_serial` из Домашнего задания 2, но в данном упражнении блок должен придерживаться правильного порядка вывода.

Архитектурная диаграмма



Пример работы на временной диаграмме

