Naive Language Detector

Detect the language of a given text in Python.

This simple algorithm should work fine with a long text (news article, email, document..).

Currently supports 41 languages:

['el', 'en', 'zh', 'af', 'ca', 'it', 'cs', 'ar', 'eu', u'et', az', id', es', r , nl', pt', nb', tr', lv', lt', th', ro', is', pl', be', fr', bg', uk', hr', bn', de', da', fa', hi', bs', fi', h , he', kk', sq', sv', mk', ur', sk', si', ms', sl']

Test Code

  import language_detector
  language_detector.test()

Training data was downloaded from [here] (http://invokeit.wordpress.com/frequency-word-lists/)

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
naive_language_detector		naive_language_detector
.gitignore		.gitignore
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

naive_language_detector

naive_language_detector

.gitignore

.gitignore

README.md

README.md

setup.py

setup.py

Repository files navigation

Naive Language Detector

Currently supports 41 languages:

Test Code

About

Releases

Packages

shlomibabluki/naive_language_detector

Folders and files

Latest commit

History

Repository files navigation

Naive Language Detector

Currently supports 41 languages:

Test Code

About

Resources

Stars

Watchers

Forks