hmm-tagger

This is a Part of Speech tagger written in Python, utilizing the Viterbi algorithm (an instantiation of Hidden Markov Models). It uses the Natural Language Toolkit and trains on Penn Treebank-tagged text files. It will use ten-fold cross validation to generate accuracy statistics, comparing its tagged sentences with the gold standard.

Usage

python hmm-tagger.py [--clean]

Pass in the --clean option to clean a Treebank file before running the tagger. This can be time consuming, so you can leave it off during future runs.

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.gitignore		.gitignore
Guesser.py		Guesser.py
HMM.py		HMM.py
Helper.py		Helper.py
PennTags.py		PennTags.py
README.markdown		README.markdown
Tagger.py		Tagger.py
Treebank.py		Treebank.py
TreebankCleaner.py		TreebankCleaner.py
hmm-tagger.py		hmm-tagger.py
treebank3_sect2.txt		treebank3_sect2.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.gitignore

.gitignore

Guesser.py

Guesser.py

HMM.py

HMM.py

Helper.py

Helper.py

PennTags.py

PennTags.py

README.markdown

README.markdown

Tagger.py

Tagger.py

Treebank.py

Treebank.py

TreebankCleaner.py

TreebankCleaner.py

hmm-tagger.py

hmm-tagger.py

treebank3_sect2.txt

treebank3_sect2.txt

Repository files navigation

hmm-tagger

Usage

About

Releases

Packages

Languages

jlipps/hmm-tagger

Folders and files

Latest commit

History

Repository files navigation

hmm-tagger

Usage

About

Resources

Stars

Watchers

Forks

Languages