ML_Trabalho_Final

Trabalho final da disciplina de Machine Learning - Pós-graduação em Data Science na Faesa, pelos alunos Iúri Brandão e Júlio Scopel.

Importante!

Nesse repositório há dois Notebooks Jupyter, sendo que no arquivo mais recente foram realizados tratamentos dos dados (feature engineering), de modo a trazer os valores zerados de insulina e glicose, dentre outros, para perto da realidade.

Instruções

Pesquise e selecione uma coleção (https://archive.ics.uci.edu/ , https://www.kaggle.com/ , outra fonte de sua escolha desde que coloque a referência);
Selecione três modelos de aprendizagem de máquina para aplicar a coleção;
Explique o funcionamento dos modelos selecionados;
Compare os resultados obtidos por cada modelo e destaque as nuances de cada um, utilize gráficos para comparação das métricas e comente os resultados;
A entrega deverá ser feita através da publicação no Github em modo público do Notebook gerado;
Todos componentes dos grupos deverão enviar o trabalho no AVA no formato PDF gerado a partir do Notebook;
O trabalho pode ser realizado em grupos de até 3 pessoas;
Não serão aceitos trabalhos idênticos;
Coloque todas as referências externas utilizadas para confecção do trabalho.

Descrição

O objetivo do trabalho é avaliar o Dataset diabetes.csv, disponível em https://www.kaggle.com/uciml/pima-indians-diabetes-database, realizando análise exploratória e executando o aprendizado de máquina (machine learning) utilizando três modelos de aprendizagem, que serão discutidos ao longo do desenvolvimento do trabalho.

Passos / Desenvolvimento do Notebook Jupyter

Carregamento dos dados;
Análise exploratória;
Tratamento dos dados;
Definição dos modelos de aprendizagem;
Utilização dos modelos;
Discussão dos resultados.

Atributos do Dataset (descrição obtida no site fonte do arquivo)

Number of times pregnant
Plasma glucose concentration a 2 hours in an oral glucose tolerance test
Diastolic blood pressure (mm Hg)
Triceps skin fold thickness (mm)
2-Hour serum insulin (mu U/ml)
Body mass index (weight in kg/(height in m)^2)
Diabetes pedigree function
Age (years)
Class variable (0 or 1)

Resultado

O resultado das análises consta no final dos Notebooks Jupyter presente nesse repositório. Importante frisar a diferença obtida nos resultados sem e com a feature engineering, de modo com que os preditores e seus fatores de importância estejam mais próximos da realidade - compare os Notebooks e perceba a diferença. Compare, por exemplo, o gráfico de importância das variáveis e veja como é importante o tratamento de dados zerados, bem como o entendimento do significado de cada preditor.

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.ipynb_checkpoints		.ipynb_checkpoints
Diabetes_Iuri_Julio-Ajuste_Vars_Zeradas.ipynb		Diabetes_Iuri_Julio-Ajuste_Vars_Zeradas.ipynb
Diabetes_Iuri_Julio.ipynb		Diabetes_Iuri_Julio.ipynb
README.md		README.md
diabetes.csv		diabetes.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.ipynb_checkpoints

.ipynb_checkpoints

Diabetes_Iuri_Julio-Ajuste_Vars_Zeradas.ipynb

Diabetes_Iuri_Julio-Ajuste_Vars_Zeradas.ipynb

Diabetes_Iuri_Julio.ipynb

Diabetes_Iuri_Julio.ipynb

README.md

README.md

diabetes.csv

diabetes.csv

Repository files navigation

ML_Trabalho_Final

Importante!

Instruções

Descrição

Passos / Desenvolvimento do Notebook Jupyter

Atributos do Dataset (descrição obtida no site fonte do arquivo)

Resultado

Informações Complementares:

About

Releases

Packages

Contributors 2

Languages

iuri-br/ML_Trabalho_Final

Folders and files

Latest commit

History

Repository files navigation

ML_Trabalho_Final

Importante!

Instruções

Descrição

Passos / Desenvolvimento do Notebook Jupyter

Atributos do Dataset (descrição obtida no site fonte do arquivo)

Resultado

Informações Complementares:

About

Topics

Resources

Stars

Watchers

Forks

Languages