Skip to content

ramirojc/Mentoria

Repository files navigation

Analisis de calidad de servicio eléctrico

Aplicacion de ML sobre datos georeferenciados

Mentoria: Diplomatura Ciencias de Datos, FAMAF, 2020

Descripción del dataset, problemas interesantes asociados

Se provee de un dataset que contiene la base de datos geográfica del año 2018. El dataset contiene datos geográficos de los consumidores y de todos los activos de la distribuidora. Uno de los mayores desafíos de esta industria es conocer los impulsores de la Calidad de Servicio que permitan la toma de dicisiones eficientes sobre los costos operativos e inversiones. El objetivo de este proyecto es que el estudiante a lo largo de las materias de la diplomatura identifique y aplique diferentes técnicas de análisis/procesamiento de los datos que generen información relevantes para la toma de decisiones.

Objetivos generales para cada materia:

Análisis y Visualización

Visualizacion de funciones de densidad de probabilidad de diferentes variables.

Matrices de correlacion.

Diagramas de caja para deteccion de Outliers.

Introduccion a la visualizacion en mapas.

Visualizacion basica de realciones y grafos.

Análisis y Curación

El formato del dataset nos permite aplicar los siguientes conceptos:

Carga de datos: Codificaciones, Caracteres Especiales, formatos.

Clasificacion de tipos de variables en continuas, ordinales y categoricas.

Metodos de normalizacion de variables continuas.

Codificacion de variables ordinales y categoricas.

Imputacion de valores invalidos y outliers.

Adicionamiento de datos externos.

Agregacion de datos.

Introducción al ML

Interpretacion y analisis conceptual del dataset.

Métodos básicos de codificación de relaciones espaciales

Métodos de selección de variables univariados, multivariados e intrínsecos a un modelo.

Partición de datos para Training, Test y Validation. Cross Validation.

Evaluación de modelos: Baselines, tipos de error.

Consolidación de un dataset consumible para los modelos.

Aprendizaje Supervisado

Aplicación de diversas técnicas de ML sobre el dataset generado.

Métodos de selección de variables y reducción de dimensionalidad.

Definicion, interpretación y ajuste de hiperparametros.

Metodos de ajuste de hyperparameters GridSearch, Random, Bayesiana

Interpretabilidad de los modelos.

Aprendizaje No Supervisado

Métodos de clusterización de datos para reduccion de variables.

Implementacion de regresor basado en KNN

Codificacion de variable de salida en categorias.

About

Repositorio de mentoría de Análisis de calidad de servicio eléctrico, aplicacion de ML sobre información georeferenciada.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published