Skip to content

Neste projeto, são realizadas transformações nos dados da empresa Northwind. ✒️

Notifications You must be signed in to change notification settings

andressagomes26/northwind_analytics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

72 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Northwind - Transformação de Dados

Neste projeto, são realizadas transformações nos dados da empresa Northwind utilizando a ferramenta dbt. Nele, está sendo conduzido o processo abrangente de entendimento, modelagem, transformação e visualização dos dados de uma empresa fictícia denominada Northwind.

Objetivos

  • Realizar a transformação e análise dos dados brutos da Northwind para extrair insights relevantes e coerentes.
  • Aplicar conceitos de Business Intelligence para visualização e compreensão dos dados, a fim de extrair insights para orientar decisões estratégicas e impulsionar o crescimento da empresa, fortalecendo sua posição competitiva no mercado.
  • Desenvolver e implementar uma infraestrutura de dados flexível, adaptável e acessível, alinhada à metodologia Modern Data Stack (MDS).
  • Promover a cultura data driven e aumentar a capacidade analítica da empresa.
  • Aplicar conceitos de Businees Inteligence para visualização e entendimento dos daods.

Instalar e executar o projeto

  • Criar ambiente virtual:
python -m venv venv
  • Ativar ambiente virtual:
source venv/bin/activate
  • Instalar dependências:
pip install -r requirements.txt
  • Entrar na pasta do projeto:
cd northwind/
  • Executar os modelos:
dbt run
  • Executar os testes:
dbt test

Planejamento do Projeto

Para implementação do projeto e criação de infraestruturas de dados foi utilizada uma combinação de boas práticas e ferramentas, definida como Modern Data Stack (MDS).

Explorando KPIs e Perguntas de Negócio

Com o objetivo de agregar valor e fornecer respostas precisas às principais perguntas de negócio, foi desenvolvido um Data Planning abrangente. Este plano aborda um dicionário dos dados, dimensões e métricas analisadas, KPIs e questões estratégicas essenciais para impulsionar o sucesso da organização.

Para acessar o Data Planning completo: Link

KPI Descrição
Total de Pedidos Número total de pedidos
Receita Total Valor obtido pela empresa com as vendas (faturamento bruto ou renda total)
Receita Líquida Valor obtido pela empresa com as vendas após a redução de descontos
Média de Itens por Pedido Quantidade média de produtos em cada pedido
Margem de Lucro Produto Define a margem de lucro média por produto
Produto mais recorrente O produto mais recorrente em pedidos
Descontinuado Quantidade de produtos que não estão mais disponível para venda
Produtos por Fornecedor Quantidade de produtos fornecidos por cada fornecedor
Valor Médio de Compra por Cliente Valor médio gasto por um cliente específico em suas compras durante um período
Ticket Médio Valor médio gasto em todas as transações
Razão Cliente/Funcionário Número de Clientes Atendidos por Funcionário
Tempo Médio de Entrega Define o Tempo Médio de Entrega por Transportadora
Perguntas de Negócio
Existem padrões sazonais nas vendas de determinados produtos?
Quais produtos têm a maior margem de lucro?
É possível analisar quais são os clientes que têm maior impacto nas vendas totais da empresa?
Quais são os diferentes segmentos de clientes com base em seu histórico de compras?
Quais são os vendedores mais produtivos em termos de vendas ou número de pedidos?
Quais são os países que apresentam os melhores desempenhos?
Quais são os principais motivos para atrasos ou problemas na entrega de pedidos aos clientes?
É possivel identificar se existem diferença na venda de produtos com desconto ou sem desconto?

Criação Star schema

Foi criado o modelo star schema, uma estrutura de banco de dados comumente usada em Data Warehousing. Nesse modelo, foram definida a tabela fato que contêm as métricas de negócios principais e tabelas de dimensões que fornecem contextos adicionais para análises mais profundas. A implementação deste modelo foi realizada utilizando a ferramenta dbt, garantindo uma organização eficiente e fácil acesso aos dados para análises avançadas.

Data Model Northwind- Northwind  Schema drawio

Arquitetura

Para implementação do projeto e criação de infraestruturas de dados foi utilizada uma combinação de boas práticas e ferramentas, definida como Modern Data Stack (MDS). Dessa forma, é possível combinar ferramentas que executam funções distintas para construir uma estrutura de dados moderna, mutável e mais independente. Logo, para execução do projeto foram seguidas etapas e atribuições específicas ao longo de uma pipeline. A metodologia utilizada no planejamento e execução do projeto pode ser resumida no diagrama a seguir.

Data Model Northwind-Arquitetura drawio (1)

Armazenamento e gerenciamento de dados

Para garantir armazenamento dos dados e consultas de grandes volumes de dados, foi utilizado o Data Warehouse Google BigQuery, que possibilita análises e o gerenciamento de informações em larga escala.

Transformação de Dados

Para ganhos de eficiência no projeto, foi realizada a abordagem ELT (Extract-Load-Transform), na qual, os dados foram extraídos, carregados e em seguida, transformados. Trata-se de uma abordagem mais rápida e flexível para a transformação de dados brutos em dados modelados dentro do Data Warehouse. A principal ferramenta utilizada para a transformação dos dados foi o DBT (data build tool). A tecnologia permite executar o processo de ELT para a transformação dos dados brutos em dados modelados, garantindo um código analítico, capaz de produzir resultados de maior qualidade, realizar testes e documentar consultas.

Business Intelligence

Para fornecer a visualização, as análises de informações e gerar insights que agregam valor à tomada de decisão empresarial foi utilizada a ferramenta de Business Intelligence Power BI, com intuito de analisar os principais indicadores, otimizar processos e tomar decisões assertivas.

Para acessar o Dashboard completo: Link.

image

image

image

image

image

image

image

image

Conclusões

Neste projeto foi realizado a transformação de dados da empresa fictícia Northwind. A partir da exploração e análise dos dados brutos, foram extraídos insights relevantes e coerentes que podem orientar decisões estratégicas e impulsionar o crescimento da empresa, fortalecendo sua posição competitiva no mercado. Durante o projeto, foram explorados os principais KPIs e perguntas de negócio, definido um Data Planning abrangente que serviu como guia para nossas análises. Além disso, foi implementado um modelo star schema, garantindo uma organização eficiente e fácil acesso aos dados para análises avançadas. Na arquitetura do projeto, foram utilizadas ferramentas, tais como, o Google BigQuery para armazenamento e gerenciamento de dados e adotando a abordagem ELT para transformação de dados brutos em dados modelados, utilizando o dbt como ferramenta principal. Por fim, usou-se o conceito de Business Intelligence, por meio da ferramenta Power BI, para visualização e análise das informações, que contribuem para a tomada de decisões estratégicas.

Autores

Andressa Gomes Moreira - andressagomesm26@gmail.com

About

Neste projeto, são realizadas transformações nos dados da empresa Northwind. ✒️

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published