2022_DRL_HomeWork5

深度強化學習作業5

說明

其他branch是我在自己電腦上使用Windows10 & anaconda & gtx1060 的環境實做的。

作業內容：

環境：MountainCar-v0
- 主要是使用Gym中的環境下去做訓練。
原因：
- 經過幾次失敗以後，發現本模型不做修改的話只能訓練acttion是離散式的環境，如果是連續的會無法訓練，例如Car-racing。
- 使用離散式car-racinng(CarRacingDiscrete-v1)時，用原本的模型參數無法訓練，若是更改會佔用大量資源，colab無法實做，相關結果發布在network-fail-banch這個分支中。
使用的訓練方式 - 老師提供的DQN