Skip to content

Commit

Permalink
Update 03_Fiches_thematiques/Fiche_import_fichiers_parquet.qmd
Browse files Browse the repository at this point in the history
  • Loading branch information
linogaliana committed Apr 26, 2024
1 parent 56842f0 commit abfe90a
Showing 1 changed file with 1 addition and 1 deletion.
2 changes: 1 addition & 1 deletion 03_Fiches_thematiques/Fiche_import_fichiers_parquet.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -154,7 +154,7 @@ knitr::include_graphics("../pics/parquet/fichier_partition.png")

### Données volumineuses: optimiser en triant

Il n'est pas toujours possible de partitionner un fichier (variable non discrète ou avec des milliers de modalités...). Dans ces cas là, vous pouvez trier le fichier par la variable à utiliser, cela va permettre une recherche efficace à partir des métadonnées des fichiers et des groupes de lignes.
Il n'est pas toujours possible ou souhaitable de partitionner un fichier si la variable de partitionnement possède de trop nombreuses modalités (si celle-ci est non discrète ou possède des milliers de modalités...). Dans ces cas là, vous pouvez trier le fichier par la variable à utiliser, cela va permettre une recherche efficace à partir des métadonnées des fichiers et des groupes de lignes.

```{r, eval = FALSE}
donnees_BPE |>
Expand Down

0 comments on commit abfe90a

Please sign in to comment.