NLP_Yelp

Final Natural Language Processing Project using sentiment analysis. Most of the project is written in Python.

Data Cleaning

Data Cleaner - CleaningFile.py

Data Extractor - Extract_Data.py

Vocabulary Generator - GenerateVocab.java

Initial Methods

Naive Bayes' - NaiveBayesClassifier.py

VADER - VaderYelp.py

TextBlob - TestBlob.py

Opinion Lexicon - OpinionLexicon.py

Datasets

500 Entries - Clean_sample.txt

1,000 Entries - Development1000.txt

5,000 Entries - Development5000.txt

10,000 Entries - Development10000.txt

Combination Methods

Majority Voting - MajorityVoting.py

Accuracy Weighting - AccuracyWeighting.py

Error Analysis - ErrorAnalysis.py

SAMPLE OUTPUT

On dataset of 5000 reviews

Naive Bayes': Accuracy: 0.8342

VADER: Accuracy: 0.8444

TextBlob: Accuracy: 0.8816

Opinion Lexicon: Accuracy: 0.5521

Majority Voting: Accuracy: 0.8452

Accuracy Weighting: Accuracy: 0.8492

Error Analysis: Accuracy: 0.8843

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
opinion_lexicon		opinion_lexicon
AccuracyWeighting		AccuracyWeighting
Clean_sample.txt		Clean_sample.txt
CleanedDevelopment5000.txt		CleanedDevelopment5000.txt
CleaningFile.py		CleaningFile.py
Development1000.txt		Development1000.txt
Development10000.txt		Development10000.txt
Development5000.txt		Development5000.txt
ErrorAnalysis.py		ErrorAnalysis.py
Extract_Data.py		Extract_Data.py
GenerateVocab.java		GenerateVocab.java
MajorityVoting.py		MajorityVoting.py
NaiveBayesClassifier.py		NaiveBayesClassifier.py
OpinionLexicon.py		OpinionLexicon.py
README.md		README.md
TestBlob.py		TestBlob.py
VaderYelp.py		VaderYelp.py

jwanggggg/NLP_Yelp