Skip to content

fabianocastello/fca2

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 

Repository files navigation

INFORMAÇÃO IMPORTANTE

Sempre foi um desejo que houvesse uma aplicação rodando em web, de forma que mais pessoas pudessem utilizar o FCA2. Finalmente temos uma versão beta no ar: acesse http://fabianocastello.com.br/fca2. A versão mais atualizada será a da web. Este site tem a última versão do FCA2 que foi base para a versão web. Se vc deseja contribuir para o desenvolvimento visite https://github.com/fabianocastello/fca2web.

Cheers! Fabiano julho de 2021

FCA2 FC Auto Analyser v0.9 beta (jul/21)

(no English version - sorry!)

FCA2 é um algoritmo em Python criado para análise exploratória básica de dados, que visa trazer produtividade para analistas. De forma automática, o algoritmo captura arquivos em formato csv, xls e xlsx e realiza diversas análises:

__ identificação de campos texto, campos numéricos inteiros e números decimais

__ campos texto: quantidade de registros, duplicações e de categorias, top "n" categorias (baseada em max_freq)

__ campos numéricos: quantidade de registros, registros zerados, soma total, média, desvio, máximos e mínimos, amplitude, quartis. Mesmas descrições para a base descontando os registros zerados

Desenvolvido originalmente por Fabiano Castello (www.fabianocastello.com.br), é disponibilizado sob licença GNL3.0 para toda a comunidade. FCA2 é disponibilizado em beta: use por seu próprio risco.

Contato com o desenvolvedor em fabianocastello.com.br Código mais atualizado disponível em github.com/fabianocastello/fca2 Código original registrado no DOI abaixo: https://doi.org/10.6084/m9.figshare.9902417

CONTRIBUIÇÕES

Marcus Pinto (https://github.com/marcuspinto) criou a matriz de correlações em janeiro de 2020.

DEPENDÊNCIAS

FCA2 utiliza os seguintes pacotes: os, sys, numpy, requests, pandas, datetime, time, socket, locale, seaborn, mathplot

PARÂMETROS

Parâmetros podem ser alterados no início do código. São auto-explicativos:

datain = ".\data.in" #coloque aqui seus arquivos xls ou csv dataout = ".\data.out" #onde analisador vai gravar os resultados datalog = ".\data.log" #onde o analisador vai gravar os logs do processamento datatmp = ".\data.tmp" #arquivos temporários. Será limpo após o processamento

max_freq = 10 #numeros de categorias máximas nos campos texto

COMO USAR

FCA2 rodar, atualmente, a partir de cadernos do Jupyter Notebook, com Kernel Python 3. Recomendo fortemente instalação do Anaconda (www.anaconda.com).

Para rodar o analizadort basta colocar seus arquivos formato xls, xlsx ou csv no diretório de entrada. A leitura é automática e a análise de cada arquivo é disponibilizada no diretório de saída, com o mesmo nome do arquivo.

NOTAS IMPORTANTES

__ várias pastas em arquivos xls ou xlsx: o FCA2 pegará a primeira delas para analisar.

__ vírgula "," ou ponto e vírgula ";" em arquivos CSV: o FCA2 conta o número de ocorrências de cada tipo na primeira linha do arquivo, e considera como separador o maior número de ocorrências

EM DESENVOLVIMENTO

__ versão web usando streamlit para ampliar o uso da ferramenta.

NO FUTURO

__ colocar todas as informações juntas em um PDF.

__ inserir data labels nos histogramas.

__ montar correlação entre variáveis numéricas.

__ criar uma versão compilada para ampliar o uso por pessoas que não usam python

About

FCA2 beta, FCastell Auto Analyser

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published