Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

GPT-3.5 파인 튜닝 후기 #37

Open
LowyShin opened this issue Feb 1, 2024 · 0 comments
Open

GPT-3.5 파인 튜닝 후기 #37

LowyShin opened this issue Feb 1, 2024 · 0 comments

Comments

@LowyShin
Copy link
Owner

LowyShin commented Feb 1, 2024

https://revf.tistory.com/m/294

JSON파일로 파인튜닝을 하여 목적에 맞추는 대답을 하도록 하는 방법

OpenAI의 가이드에 따르면, 일반적으로 50개에서 100개의 예제로 파인튜닝을 하면 효과를 볼 수 있지만 사용 사례에 따라 적절한 개수는 달라집니다. 잘 만들어진 50개의 데이터로 시작하여 파인튜닝을 진행해보고, 모델에 개선 징후가 나타나는지 확인하는 것을 권장하고 있습니다. 만약 개선의 조짐이 있다면 더 많은 데이터를 제공할 경우 모델이 계속 개선 될 수 있다는 좋은 신호이며, 개선의 조짐이 없을 경우에는 데이터셋을 더 확장하기 전에 진행 중인 작업을 재고하거나 데이터를 재구성 하는 것이 좋다고 합니다.

성공적인 파인튜닝을 위해서는

  1. 고품질의 데이터를 확보하는 것이 중요합니다.
  2. 그리고 적절한 양의 데이터가 필요합니다. 너무 적거나, 너무 많으면 새로운 데이터나 테스트 데이터에 대한 성능이 떨어지는 오버피팅(overfitting)이 일어납니다.
  3. 데이터의 다양상을 높이기 위해 데이터 증강을 통해 학습 데이터 양을 늘리는 것을 고려해볼 수 있습니다. 예를 들어 문장의 순서를 바꾸거나 유의어를 사용하는 방법들이 있습니다.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant