bangla_pos_tagger

POS Tagger for Bangla language based on Conditional Random Fields

Usage

Install the module python setup.py install
Code import bangla_pos_tagger bangla_pos_tagger.pos_tag(query)

where query is a tokenized words for a given Bangla Sentence.

Observations

Unigram Based Tagger gives approximately 60-65% accuracy.
Adding Bigram, and Trigram based taggers following the same increases the accuracy to some extent.
Adding an affix based tagger, improves the accuracy a bit.

Note: In the "accuracy.txt" file in the analyzed_data directory. Only the relevant results have been added which were giving really good accuracies. The analysis is similar to that of the blog.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
analyzed_data		analyzed_data
data		data
.gitignore		.gitignore
POSTag.py		POSTag.py
README.md		README.md
bangla_pos_tagger.py		bangla_pos_tagger.py
params.py		params.py
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

analyzed_data

analyzed_data

data

data

.gitignore

.gitignore

POSTag.py

POSTag.py

README.md

README.md

bangla_pos_tagger.py

bangla_pos_tagger.py

params.py

params.py

setup.py

setup.py

Repository files navigation

bangla_pos_tagger

Usage

Observations

Relevant Blog Posts

About

Releases

Packages

Languages

ankur-india/bangla_pos_tagger

Folders and files

Latest commit

History

Repository files navigation

bangla_pos_tagger

Usage

Observations

Relevant Blog Posts

About

Resources

Stars

Watchers

Forks

Languages