Neighboring States-based RL Exploration

Repo for this ArXiv paper. All training scripts are located in the scripts/ directory. To be updated with more extensive experiments on different agents (e.g. SAC, PPO).

Hyperparameters to consider (as of Dec 2022)

Hyperparameter	values
`learning_rate`	1e-3, 5e-4
`rho (perturbation margin)`	3, 5, 7, 10, 20%
`rho_sample`	10, 20, 30
`lambda (look ahead steps)`	1, 10
`sample_heuristics`	`max`, `mode of top percentile`
`model-free algo`	DQN (Actor Critic, SAC, PPO)

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.vscode		.vscode
cs285		cs285
data		data
plots		plots
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
requirements_colab.txt		requirements_colab.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.vscode

.vscode

cs285

cs285

data

data

plots

plots

.gitignore

.gitignore

README.md

README.md

requirements.txt

requirements.txt

requirements_colab.txt

requirements_colab.txt

setup.py

setup.py

Repository files navigation

Neighboring States-based RL Exploration

About

Releases

Packages

Languages

Curiouskid0423/rho_exploration

Folders and files

Latest commit

History

Repository files navigation

Neighboring States-based RL Exploration

About

Topics

Resources

Stars

Watchers

Forks

Languages