Biblioteca de códigos úteis(ou não) que foram usados para poderem processar dados de textos e imagens.
As tecnologias aqui usadas são Open-Source e que tem ajuda da comunidade para ser desenvolvida. Entre elas estão, Python, Hadoop, NLTK, Linux e algumas outras.
Machado de Assis é um escritor brasileiro que é referência internacional a poesia brasileira. Neste projeto, serão estudados seus textos para analise estatística de palavras, parágrafos, estrofes, versos, sílabas e muitos outros tipos de analises que podem ser feitas a partir de seus textos. Além de ser feita a geração de Hashes e senhas criptográficas a partir de textos do autor.
Este projeto visa a avaliação do governo atual(até o dia 15 de abril de 2016) com a análise de textos postados na rede social Twitter, limitados a 140 caracteres com Hashtags, mídia e uma série de outros fatores que podem ser extraídos a partir do programa.
E as estátisticas estão disponíveis na imagem abaixo:
Este gerador tem como intuíto gerar corporas baseados em scrapping de dados de sites de noticias, críticas de cinema e etc para poder servir de base para as análises sentimentais!