Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.gitignore		.gitignore
README.md		README.md
baseline.py		baseline.py
main.py		main.py
main_baseline.py		main_baseline.py
trl-example.py		trl-example.py

Repository files navigation

Fine-tuning GPT2 with RL

About

Playing with RL fine-tuning of large language models. What if I fine tune the model to always output a certain word?

Readme

Activity

0 stars

2 watching

0 forks

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.gitignore

.gitignore

README.md

README.md

baseline.py

baseline.py

main.py

main.py

main_baseline.py

main_baseline.py

trl-example.py

trl-example.py

Repository files navigation

Fine-tuning GPT2 with RL

About

Releases

Packages

Languages

haoxing-du/compulsive-lm

Folders and files

Latest commit

History

Repository files navigation

Fine-tuning GPT2 with RL

About

Resources

Stars

Watchers

Forks

Languages