Releases: ldaniel/fgv-social-media-analysis-text-mining
Submissão da Tarefa Mirapalheta
Trabalho em Grupo
(até 4 integrantes)
- Curso: FGV MBA - Business Analytics and Big Data
- Disciplina: Análise de Mídias Sociais e Mineração de Texto
- Professor: Gustavo Mirapalheta
Alunos
Github | Nome | Matricula | |
---|---|---|---|
Daniel Campos | A57635769 | daniel.ferraz.campos@gmail.com | |
Leandro Daniel | A57622988 | contato@leandrodaniel.com | |
Rodrigo Goncalves | A57566093 | rodrigo.goncalves@me.com | |
Ygor Lima | A57549661 | ygor_redesocial@hotmail.com |
Enunciado
Apresente uma análise exploratória de dados utilizando as técnicas de Text Mining desenvolvidas na disciplina Análise de Mídias Sociais e Mineração de Texto.
Para esta tarefa iremos utilizar um dataset extraído do Kaggle. Nele, encontram-se disponíveis cerca de 380 mil letras de músicas de uma grande variedade de artistas e gêneros.
Submissão da Tarefa da Aula 3
Proponham uma análise/projeto envolvendo SNA e Text Mining que possa ser realizada através da plataforma R e softwares livres contemplando:
• Problema / Oportunidade de Negócio
• Relevância / Motivação
• Escopo: Dados, Processamento, Saída
• Estrutura Estratégica / Operacional
• Indicadores de Avaliação
• Adoção no ambiente empresarial (recorrência, implicação gerencial, etc)
• Se possível: realizem Prova de Conceito
Submissão da Tarefa da Aula 1
• Explore as rotinas Exemplo Rede.R e Exemplo Rede Two Mode.R . Rode os códigos na plataforma R utilizando como base as tabelas Rede One Mode_Tarefa Aula 1_Berrini T1.xlsx e Rede Two Mode_Tarefa Aula 1_Berrini T1.xlsx. (atenção: não são as mesmas bases trabalhadas em sala).
• Faça pequenas modificações na tabela e veja seus resultados.
• Inclua outras análises em seu código (usando as extensões sna, network ou igraph) e comente os resultados (seja criativo!).
• Compile as saídas dos códigos (conteúdo das variáveis, gráficos, tabelas) em um documento Word (usando o modelo deste documento) e comente seus resultados (principalmente as medidas de centralidade), análises, potenciais implicações gerenciais, etc, conforme discutido em sala na Aula 1.
• Desafio: Baseado na tabela da Rede Two Mode desta tarefa, faça uma análise de agrupamento (cluster analysis) do tipo hierárquico aglomerativo (dendrograma) das pessoas ou dos produtos adquiridos por elas, levando em consideração apenas a estrutura de relações entre elas. Comente como implementou e discuta os resultados, comparando com a rede construída. Utilize a plataforma R e o script de exemplo de uso de Cluster Analysis em R.
Dica: após a seleção dos grupos, desenhe a rede e represente os nós das pessoas (ou produtos) com cores de acordo com o grupo correspondente.