Materials and homework assignments for HSE reinforcement learning course
Task 1. Q-learning
Задача: С помощью метода Q-learning обучить агента побеждать в игре MountainCar.
Task 2. DQN
Задача: С помощью метода DQN или одной из его модификаций обучить агента побеждать в игре LunarLander.
Task 3. PPO
Задача: При помощи Actor-Critic, A2C, TRPO или PPO обучить агента побеждать в игре Walker2D.
Task 4. DDPG
Задача: С помощью метода DDPG, TD3 или SAC обучить агента побеждать в игре Ant.