A arquitetura do Data Lakehouse tem como objetivo resolver estes desafios enfrentados no Data Warehouse e Data Lake para reduzir os custos operacionais, simplificar o processo de transformação e melhorar a governança. Este repositório contém um exemplo prático com Spark de implementação da arquitetura de Lakehouse utilizando o Delta Lake.
- Subindo o container:
docker-compose up -d
-
Acesse o Jupyter no endereço
http://localhost:8888
. -
Para para o container utilize:
docker-compose down
- Gerenciamento de dados:dos Dados ao Lakehouse
- Quickstart Delta Lake
- 5 razões para utilizar o Delta Lake
- Data Warehouse x Data Lake x Data Lakehouse
- Data Lakehouse
- Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics
- Building a Data Lakehouse on GCP
- Construindo Data Lakehouse e muito mais, no Grupo Boticário — Data Hackers Podcast 44
- Lakehouse: unindo o Data Lake e o Data Warehouse
- Delta Lake - The Definitive Guide