InverseRL-Pytorch

Agent Algorithm

PPO
SAC

Discriminator Algorithm

GAIL(Generative Adversarial Imitation Learning)
VAIL(Variational Adversarial Imitation Learning)
SQIL(Imitation Learning via Reinforcement Learning with Sparse Rewards)
AIRL(Adversarial Inverse Reinforcement Learning)
- Two value functions can be merged into one.
- Extremely unstable
EAIRL(Empowerment-regularized Adversarial Inverse Reinforcement Learning)
- Two value functions can be merged into one.
- Extremely unstable
VAIRL(Variational Adversarial Inverse Reinforcement Learning)
- Joint gaussian distribution kl-divergence yet.

TODO

add more environments(ant and disabled ant)
build setup file
make expert
make trajectories by expert

Name		Name	Last commit message	Last commit date
Latest commit History 97 Commits
agents		agents
discriminators		discriminators
expert_data		expert_data
networks		networks
utils		utils
LICENSE		LICENSE
README.md		README.md
config.ini		config.ini
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

agents

agents

discriminators

discriminators

expert_data

expert_data

networks

networks

utils

utils

LICENSE

LICENSE

README.md

README.md

config.ini

config.ini

main.py

main.py

Repository files navigation

InverseRL-Pytorch

Agent Algorithm

Discriminator Algorithm

TODO

About

Releases

Packages

Languages

License

seolhokim/InverseRL-Pytorch

Folders and files

Latest commit

History

Repository files navigation

InverseRL-Pytorch

Agent Algorithm

Discriminator Algorithm

TODO

About

Topics

Resources

License

Stars

Watchers

Forks

Languages