GitHub - vanya-robot/U-Net_OCR: OCR system built with U-Net models and CRNN.

Russian language OCR built with U-Net models and CRNN (plus additional Faster-RCNN for russian passport recognition task).

Use by running pipeline_general.py (for general text recognition purposes)

or pipeline_passport.py (for Russian Federation passport recognition)

Recognition model that is presented here were trained on these fonts (cyrillic): Arial, Courier New, OCR B.

General system pipeline:

U-Net trained to segment lines of text from image (pic. 1).
U-Net trained to segment words from lines of text (pic. 2).
CRNN trained to recognize words (fonts, on which it was trained are located in ./data_generator/fonts/).

pic. 1 (Mask of lines in the image)

pic. 2 (Mask of words in line)

pic. 3 (Recognition of words by CRNN)

For better performance

You should re-train CRNN with fonts that it will be recognizing in your task (add your fonts to data_generator/fonts/ and proceed to Russian_OCR_part_1.ipynb).

For Russian passport recognition

Faster-RCNN were added to detect area of image with First name, Last name and Patronymic (pic. 4).

pic. 4 (Passport recognition)

Then General pipeline is used to recognize this as regular image.

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
data_generator		data_generator
.gitattributes		.gitattributes
.gitignore		.gitignore
Passport_name_detection_Faster_RCNN.ipynb		Passport_name_detection_Faster_RCNN.ipynb
README.MD		README.MD
Russian_OCR_part_1.ipynb		Russian_OCR_part_1.ipynb
Russian_OCR_part_2.ipynb		Russian_OCR_part_2.ipynb
crnn.hdf5		crnn.hdf5
crnn.py		crnn.py
fasterrcnn.h5		fasterrcnn.h5
frcnn.py		frcnn.py
pipeline_general.py		pipeline_general.py
pipeline_passport.py		pipeline_passport.py
pipeline_utils.py		pipeline_utils.py
recognition_model.pth		recognition_model.pth
requirements.txt		requirements.txt
unet.py		unet.py
unet_lines.h5		unet_lines.h5
unet_lines.py		unet_lines.py
unet_words.h5		unet_words.h5
unet_words.py		unet_words.py

vanya-robot/U-Net_OCR

Folders and files

Latest commit

History

Repository files navigation

Russian language OCR built with U-Net models and CRNN (plus additional Faster-RCNN for russian passport recognition task).

For better performance

For Russian passport recognition

About

Topics

Resources

Stars

Watchers

Forks

Languages