Watching

Trabalho do curso de Big Data sobre processamento paralelo utilizando Python, conceitos de crawling, MongoDB e Hadoop (HDFS, MapReduce e Hive).

O sistema monitora tweets com o termo "assistindo" que são posteriormente processados para identificar os filmes mencionados.

Foi utilizado datasets de filmes da Ancine e do IMDB. O dataset final gerado pelo sistema possui informações sobre a data e hora do tweet e título, ano, gênero, elenco, nota e votos do filme mencionado no tweet.

Este dataset pode ser importado em uma ferramenta de BI para análise das informações.

Fluxo de uso

Sequência de documentações a serem seguidas para a execução do sistema:

Qualquer dúvida entre em contato: yoshiodeveloper@gmail.com

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
bin		bin
docs		docs
watching		watching
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

bin

bin

docs

docs

watching

watching

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

requirements.txt

requirements.txt

Repository files navigation

Watching

Fluxo de uso

About

Releases

Packages

Languages

License

yoshiodeveloper/watching

Folders and files

Latest commit

History

Repository files navigation

Watching

Fluxo de uso

About

Topics

Resources

License

Stars

Watchers

Forks

Languages