--Self Generate Expert Experience/SGEE

This code combine DDPG Algorithm and Behavior Clone methods,which integrate off and on-policy training process. After one episode on-policy train, algorithm generate expert samples with current parameters and feed the off-policy train. For it can produce expert experient by itself, so we call it SGEE. The implementation of DDPG refer to sweetice's code.>>https://github.com/sweetice/Deep-reinforcement-learning-with-pytorch

Reference CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING>>https://arxiv.org/abs/1509.02971 Self Lmitation Learning>>https://arxiv.org/abs/1806.05635

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
HalfCheetTah.png		HalfCheetTah.png
README.md		README.md
ddpg_sgee.py		ddpg_sgee.py
normalized_env.py		normalized_env.py
sgee_full.py		sgee_full.py
td3_sgee.py		td3_sgee.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

HalfCheetTah.png

HalfCheetTah.png

README.md

README.md

ddpg_sgee.py

ddpg_sgee.py

normalized_env.py

normalized_env.py

sgee_full.py

sgee_full.py

td3_sgee.py

td3_sgee.py

Repository files navigation

--Self Generate Expert Experience/SGEE

About

Releases

Packages

Languages

alhabk/SGEE--pytorch

Folders and files

Latest commit

History

Repository files navigation

--Self Generate Expert Experience/SGEE

About

Resources

Stars

Watchers

Forks

Languages