Show And Tell 한국어 버전

This is the final project for Multimedia course CSE6501

1. 이미지 캡션 생성

Google's im2txt 모델 사용
im2txt 설치 및 훈련 방법은 해당 Github repo에 정리되어 있음.
유의해야 할 점은 CNN image 분석 모델은 pre-trained 모델 파일을 사용하고 LSTM이 추가된 언어생성 모델은 직접 훈련해야 됨.

시스템 구조

2. 이미지 캡션 생성 데모 페이지

webdemo 폴더에 있음.
python django framework를 사용함.

2.1 django 설치

pip install django

2.2 네이버 번역 API 연동

https://developers.naver.com/products/translator

Naver developer Client ID, Client Secret 필요함.

2.3 구글 번역 연동

Python Library 사용 - Googletrans

2.4 실행방법

webdemo 폴더에서 다음 명령어 실행

python manage.py runserver 0.0.0.0:8000

2.5 show and tell 캡션 생성 모델 호출

im2txt_analyzer.py 파일의 analyze_image 함수에 정의되어 있고 주의 할 부분은 다음 3가지 파일의 경로를 올바르게 지정해야 함.

tensorflow checkpoint 파일

vocabulary 파일

업로드한 분석 대상 이미지 파일

예시

FLAGS = {
    "checkpoint_path": "/home/hkh/sources/im2txt/im2txt/model/train",
    "vocab_file": "/hdd/data/mscoco/tfdata/word_counts.txt",
    "input_files": "/home/hkh/sources/im2txt/webdemo"+filename,
}

3. 한국어 이미지 캡션 수집 툴

데모 페이지와 동일하게 webdemo 웹 어플리케이션으로 구성됨.
현재 200이미지를 대상으로 구성되었고 추후 MSCOCO 전체 8만장 이미지를 대상으로 확장할 예정임.
자세한 부분은 views.py 파일의 image_gallery, modal_view 참조.

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.idea		.idea
docs		docs
g3doc		g3doc
google_translate		google_translate
im2txt		im2txt
webdemo		webdemo
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
WORKSPACE		WORKSPACE

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.idea

.idea

docs

docs

g3doc

g3doc

google_translate

google_translate

im2txt

im2txt

webdemo

webdemo

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

WORKSPACE

WORKSPACE

Repository files navigation

Show And Tell 한국어 버전

1. 이미지 캡션 생성

시스템 구조

2. 이미지 캡션 생성 데모 페이지

2.1 django 설치

2.2 네이버 번역 API 연동

2.3 구글 번역 연동

2.4 실행방법

2.5 show and tell 캡션 생성 모델 호출

3. 한국어 이미지 캡션 수집 툴

4. 시스템 데모 동영상

About

Releases

Packages

Languages

License

hkhpub/show_and_tell_korean

Folders and files

Latest commit

History

Repository files navigation

Show And Tell 한국어 버전

1. 이미지 캡션 생성

시스템 구조

2. 이미지 캡션 생성 데모 페이지

2.1 django 설치

2.2 네이버 번역 API 연동

2.3 구글 번역 연동

2.4 실행방법

2.5 show and tell 캡션 생성 모델 호출

3. 한국어 이미지 캡션 수집 툴

4. 시스템 데모 동영상

About

Topics

Resources

License

Stars

Watchers

Forks

Languages