image-captioning-for-celebrities

[updating]

Overall architecture:

We utilize the mtcnn module and the pretrained Inception_v1 in facenet-pytorch

Download the following datasets and add them to relative paths:

torch=1.10.1
python=3.9.7
numpy=1.21.5
matplotlib=3.5.1
torchvision=0.11.2 
spacy=3.2.1
nltk=3.7

model training is in main.py. For a glance of the performance, see example.ipynb.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
cele_test		cele_test
data		data
flickr30k		flickr30k
flickr8k		flickr8k
img		img
models		models
photos		photos
.gitignore		.gitignore
0.jpg		0.jpg
README.md		README.md
config.py		config.py
data.pt		data.pt
data_loader.py		data_loader.py
example.ipynb		example.ipynb
face_recognition.py		face_recognition.py
main.py		main.py
model.py		model.py
parse.py		parse.py
parse_sentence.py		parse_sentence.py
utils.py		utils.py