Skip to content

CR_2020_04_08

Lino Galiana edited this page Jan 12, 2021 · 1 revision

utilitR

L'origine du projet

Pour les personnes qui rejoignent le groupe, quelques éléments de contexte :

Le projet fait suite à un atelier du séminaire LS2 de janvier 2020. Suite à une proposition d'Olivier Meslin, Benoit Rouppert souhaite qu'une documentation R sous forme de cookbook soit réalisée par des agents volontaires.

L'objectif est de proposer aux agents de l'Insee (et SSM) une documentation sous forme de fiches thématiques, disponible en ligne sur l'intranet, mais aussi sous forme de pdf, périodiquement réactualisé..

Les lignes directrices :

  1. une documentation concise mais efficace ;

  2. qui s'adresse à un public de niveau débutant / intermédiaire ;

  3. qui peut / pourra inclure les recommandations du COPS.


Voici le mail reçu de Benoit suite à la 1ere visio du projet :

Suite à la réunion de ce matin, je vous envoie les sujets de fiche:

  • "Guide de démarrage rapide sous R pour grand débutant" (2-3 pages) (a.k.a. "Hello World en R sous AUS"), resp. Olivier Meslin

  • "Si je connais rien à R quel est le parcours que je dois suivre (formations, personnes à contacter, ressources à utiliser …)", resp. Mathias André

  • template pour les fiches, resp. Gilles Fidani

  • "Comment je fais du git à l'Insee", resp. Lino Galiana

  • "Fiche martyre sur l'analyse de données (factominer)", resp. Olivier Meslin

  • "Comment faire si vous avez des données un peu volumineuses", resp. Lino Galiana

  • "Usage de SQL avec R", resp. Antoine Dreyer

  • mise à forme par Antoine des fiches qu'il avait commencé

  • "Données géographiques" (mais pour dans un deuxième temps)

  • fiche suite à ce qu'a fait Arlindo sur les fichiers SAS pour le COPS, resp. Olivier Meslin contacte Arlindo

Autres actions :

  • Claire Legroux a créé un projet sous Gforge pour ces travaux de documentation. Le dépôt Git de ce projet servira pour stocker de façon pérenne les contenus produits. Le Git de la plateforme innovation pourra être utilisé pour la constitution du contenu, il y a aura synchronisation entre les deux dépôts Git. Claire contactera la DAAP pour avoir les informations sur comment utiliser le Git du projet Gforge et diffusera ces informations aux participants du GT.

  • Le contenu sera édité officiellement chaque année (en juin, en septembre ?). Cette version millésimée sera déposée sur l'intranet du réseau LS².

  • A terme les recommandations du COPS pourront se retrouver dans le Cookbook.

Si vous avez des choses à ajouter, n'hésitez pas.

Avancement du projet

A ce jour (2020-04-08), de nombreuses fiches ont déja été rédigées. Certaines sont presque achevées, d'autres nécessite encore un peu de travail.

Fiches quasi finies

  • data.table

  • analyse de données

  • ggplot2

Fiches en cours de rédaction

  • connexion bases de données

  • analyse textuelle

  • télécharger des données en R

  • ...

Fiche non entamées

  • encoding

  • ...

Les contributeurs

Principalement Olivier Meslin et Lino Galiana, Pierre Lamarche, Gaelle Genin, Arlindo Dos Santos, et accessoirement moi (Gilles Fidani)

Romain Lesur nous conseille, Antoine Dreyer participe activement aux échanges du salon, Mathias André est intervenu ponctuellement et a contribué à certaines fiches.

Claire Legroux suit également la progression du projet.

Lionel Cacheux a été recruté récemment, il va prendre en charge la partie cartographie.

Règles de travail collaboratif

Idéalement par gitlab (https://gitlab.com/linogaliana/documentationR), sous forme de commit / push / pull.

La connaissance de git ne devant pas être un frein à la contribution, il est possible de participer par d'autres moyens (à définir).

Pour la validation des fiches, on attend en général que 4 personnes se prononcent favorablement pour basculer d'une branche vers master.

Pour proposer de nouveaux sujets / nouvelles fiches : faire des issues

Pour digresser, il y a le salon Tchap : DocumentationR_Insee

Points à discuter

  • stratégie optimale pour réaliser une fiche. A ce sujet, un pattern commence à se dégager :

    1. identifier des sources de doc externe ;
    2. proposer un plan et un début de composition de la fiche ;
    3. soumettre à l'avis des membres du groupe.
  • comment échanger efficacement : mail / issues / tchap / visio / un mélange de tout ça ?

  • tout ce qui vous semble pertinent

  • Eventuellement, discuter de l'articulation entre toutes les initiatives relatives à la formation R à l'Insee (palette, ussr, fun camp, COPS, ...). A noter que ce sujet n'est pas prioritaire, et ne relève pas fondamentalement des attributions du groupe.