Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Enrichir la partie consacrée au format parquet #448

Open
ddotta opened this issue Nov 8, 2022 · 3 comments · Fixed by #475
Open

Enrichir la partie consacrée au format parquet #448

ddotta opened this issue Nov 8, 2022 · 3 comments · Fixed by #475
Labels

Comments

@ddotta
Copy link
Contributor

ddotta commented Nov 8, 2022

Sur le format de données parquet, il en est question à cet endroit.
Compte-tenu de l'importance que peut prendre ce type de fichiers dans l'utilisation de données volumineuses avec R, peut-être serait-il envisageable de créer une fiche supplémentaire dans la partie IMPORTER DES DONNÉES AVEC R ?
Il pourrait être par exemple question de :

  • son interopérabilité
  • ses performances
  • sa logique de partitionnement
  • sa compatibilité avec la syntaxe dplyr
  • ses limites ...
@ddotta
Copy link
Contributor Author

ddotta commented Jan 19, 2023

Une source d'inspiration écrite par @ericemc3
#451 (comment)

@linogaliana
Copy link
Contributor

J'ai une version python dont on peut aussi s'inspirer (faut que je l'enrichisse avec duckdb) : https://pythonds.linogaliana.fr/reads3/

@ddotta
Copy link
Contributor Author

ddotta commented Jan 25, 2023

👍 Top @linogaliana ta doc sur python est vraiment hyper riche !

oliviermeslin pushed a commit that referenced this issue Mar 27, 2023
* Initialisation (1er jet) pour la fiche sur Parquet
#448

* Prise en compte relecture de Romain L

* Prise en compte relecture 1ère partie Lino

* Ajout oubli sur une correction

* Exemples désormais avec la BPE

* suppression fichier json inutile

* Prise en compte relecture 1ère partie Olivier

* Suppression paragraphe en double

* Ajout conseil sur variable de partitionnement
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

Successfully merging a pull request may close this issue.

2 participants